0|基本信息
- 标题(Title):Spatial reorganization of object representations in high-level visual cortex distinguishes working memory from perception / 《高级视觉皮层中物体表征的空间重组区分工作记忆与知觉》
- 作者(Authors):Wanru Li(李婉如),Jia Yang(杨佳),Pinglei Bao(包平磊)— 北京大学心理与认知科学学院、北大-清华生命科学联合中心、IDG/麦戈文脑科学研究所
- 期刊 / 会议(Venue):Science Advances,AAAS 旗下顶级开放获取子刊,中科院一区
- 发表时间(Year):2026年5月8日
通讯作者包平磊和杨佳均为北京大学视觉认知方向的青年研究员。包平磊长期从事灵长类视觉皮层编码研究,杨佳关注注意与工作记忆的神经机制。
1|核心结论(Core Takeaway)
视觉工作记忆(VWM)对物体身份的表征不再受知觉中对侧偏好的空间约束,而是主动招募超过 90% 的同侧(ipsilateral)高级视觉皮层(OSC)顶点,形成双侧化的记忆编码。 这种空间重组并非注意力扩散的副产物,而是一种表征格式保持但空间拓扑发生根本改变的记忆策略。IPS 虽然也表现出双侧解码,但其表征格式已脱离知觉模板,提示 OSC 和 IPS 通过不同的机制支持物体 VWM。
2|研究问题与背景(Problem & Context)
OSC(包括 FFA、PPA 等区域)在知觉中同时表现出位置容忍(位置不变性)和对侧偏好:双侧输入时同侧信息被强烈抑制(interhemispheric normalization)。然而,VWM 需要在没有持续感觉输入的情况下维持内部表征。一个根本性问题是:VWM 是直接继承知觉的空间约束(保持对侧编码),还是通过重组表征拓扑来满足记忆需求?
前人研究在早期视觉皮层(EVC)中发现记忆可以减弱对侧偏好,但 OSC 因其更大的感受野和更强的自上而下调制,其记忆态的空间编码方式尚不清楚。
3|方法主线(Approach)
作者设计了一套高度匹配的六任务 fMRI 实验范式,所有任务使用相同的 20 个真实物体刺激:
| 任务 | 缩写 | 核心要求 |
|---|---|---|
| 单侧知觉 | UP | 单侧看一个物体 |
| 双侧知觉 | BP | 两侧各看一个物体 |
| 中央知觉 | CP | 中央看一个物体 |
| 单侧 VWM | 1-item WM | 双侧编码→箭头线索提示侧→延迟 10s→报告 |
| 双侧 VWM | 2-item WM | 双侧编码→延迟 10s→后线索→报告两侧 |
| 双侧注意 | BA | 检测物体旋转(高度注意参与) |
每位被试完成 >11 小时 fMRI 扫描(1520 个 event-related VWM trials),使用:
- SVM 解码(20-class,留一 trial-out cross-validation)
- 交叉侧解码(contra 训练→ipsi 测试)
- 顶点消融分析(vertex-ablation,逐步移除双侧响应性最高的顶点)
- 表征相似性分析(RSA)及 searchlight RSA
EVC、IPS、FEF 作为对照区域。
4|创新贡献(Novel Contribution)
方法创新(Methodological)为主,兼有理论创新。
- 首次系统比较了 OSC 在知觉和 VWM 下的空间表征拓扑,并使用相同刺激集和匹配任务设计排除混淆
- 顶点消融分析提供了一个精巧的量化框架:通过逐步移除双侧响应性最高的顶点,证明了 VWM 征用了超过 90% 的同侧 OSC顶点——远超出知觉中可解码的范围
- 揭示了 OSC 与 IPS 在记忆表征格式上的双重解码机制:OSC 保留知觉格式而 IPS 采用抽象格式
创新幅度:中高。 这不是一个全新的发现(已有研究表明 OSC 参与 VWM),但其系统性的空间拓扑量化是一个重要进步。
5|关键点(Key Points)
- 双侧知觉下同侧 OSC 无显著表征,但单侧知觉下同侧有微弱表征——与 interhemispheric normalization 模型一致
- VWM 双侧编码→同侧 OSC 出现稳健解码,无论记忆负荷是 1 个还是 2 个物体;这种双侧化在 vertex-ablation 中持续到 >90% 顶点被移除后仍显著
- 注意力任务(BA)不能解释这种扩展——BA 任务虽然有更强的注意参与,但其同侧表征在 vertex-ablation 中显著弱于 VWM
- 同侧 OSC 的表征格式与对侧高度相似(与 CP 模板 RDM 高度相关),说明 VWM 扩展是一种”格式不变、拓扑重组”的策略
- IPS 也支持双侧解码,但不保留知觉格式——与 CP 模板无显著相关,提示其记忆表征更抽象/任务驱动
6|关键数学 / 统计方法(Quantitative Tools)
| 方法 | 作用 | 可迁移性 |
|---|---|---|
| Vertex-ablation decoding | 逐步移除按双侧响应性排序的顶点,量化记忆表征的空间分散程度 | 高——适用于任何需要区分”真正需要”和”边缘参与”的脑区解码研究 |
| Cross-lateral decoding | 用对侧高 SNR 数据训练→同侧测试,分离 SNR 效应与真正的表征存在 | 中高——适用于双侧不对称 SNR 的 fMRI 分析 |
| Searchlight RSA | 以每个顶点为中心构建局部 RDM,与知觉模板 RDM 相关,生成全脑表征相似图 | 高——经典方法,广泛适用于表征映射 |
7|结果与证据强度(Results & Evidence Strength)
证据强度:强。
- 数据量极其充分:每位被试 1520 个 VWM trials + 知觉对照,每人 >11 小时扫描,6 名被试但组内统计力通过 trial 密度弥补
- 多重交叉验证:解码 + RSA + cross-lateral + vertex-ablation,所有方法指向一致结论
- 严格的混淆控制:匹配的刺激集、对照任务(BA 排除注意 confound)、cue-specific 效应(确认是记忆而非知觉残余)
- FDR 校正的 P 值,多重比较控制严格
主要弱点:
- n=6 且均来自北京大学在校生——样本量小,外推性存疑;但作者指出每人 >11h 扫描的设计最大化组内统计力
- 无眼动追踪——虽通过短刺激呈现(200ms)和 EVC 严格对侧解码间接验证了注视稳定,但不如直接眼动数据可靠
- fMRI 的时间分辨率限制——延迟期解码可能混有知觉残余,但 cue-specific 效应和后期时间窗口分析部分缓解了此问题
8|局限与注意点(Limitations)
- 样本量小(n=6)——尽管组内数据量大,但个体差异无法充分估计,群体水平的结论仍需更大样本验证
- 无眼动追踪——无法完全排除微眼动对同侧表征的贡献
- fMRI 时间分辨率低——无法精确区分编码阶段和维持阶段的表征动态;同侧表征何时出现(编码中还是延迟期?)不清楚
- 任务要求的是基本类别级别的记忆(”大象”而非”哪只大象”)——这可能导致 EVC 无显著参与;对于细粒度记忆,EVC 可能也会展现出类似的双侧化
- FEF 无显著解码——可能因 fMRI 空间分辨率限制或 FEF 编码更抽象/非线性的表征格式,不能证明 FEF 不参与物体 VWM
9|可迁移价值(Transferable Value)
- Vertex-ablation 框架可直接用于其他脑区/认知功能的表征分散度分析——这是一个干净、可量化的工具
- “格式不变、拓扑重组”的概念可以推广到其他认知任务(如注意、想象)中知觉与记忆的关系研究
- OSC vs. IPS 的双重编码机制提示在设计脑机接口(BCI)或解码器时,应根据目标区域选择不同的解码策略——OSC 的信号更接近知觉模板,IPS 的信号更抽象
- 跨同源区的 interhemispheric coordination 可能是 VWM 中信息稳定化的关键机制——这一假设可以用高时间分辨率方法(EEG、ECoG)进一步检验
10|一句话总结
VWM 不继承知觉的空间约束——OSC 在记忆态中通过感知格式不变但空间拓扑双侧化的方式,将超过 90% 的同侧皮层纳入物体编码。