视觉工作记忆使高级视觉皮层的物体表征发生空间重组

0｜基本信息

标题（Title）：Spatial reorganization of object representations in high-level visual cortex distinguishes working memory from perception / 《高级视觉皮层中物体表征的空间重组区分工作记忆与知觉》
作者（Authors）：Wanru Li（李婉如），Jia Yang（杨佳），Pinglei Bao（包平磊）— 北京大学心理与认知科学学院、北大-清华生命科学联合中心、IDG/麦戈文脑科学研究所
期刊 / 会议（Venue）：Science Advances，AAAS 旗下顶级开放获取子刊，中科院一区
发表时间（Year）：2026年5月8日

通讯作者包平磊和杨佳均为北京大学视觉认知方向的青年研究员。包平磊长期从事灵长类视觉皮层编码研究，杨佳关注注意与工作记忆的神经机制。

1｜核心结论（Core Takeaway）

视觉工作记忆（VWM）对物体身份的表征不再受知觉中对侧偏好的空间约束，而是主动招募超过 90% 的同侧（ipsilateral）高级视觉皮层（OSC）顶点，形成双侧化的记忆编码。这种空间重组并非注意力扩散的副产物，而是一种表征格式保持但空间拓扑发生根本改变的记忆策略。IPS 虽然也表现出双侧解码，但其表征格式已脱离知觉模板，提示 OSC 和 IPS 通过不同的机制支持物体 VWM。

2｜研究问题与背景（Problem & Context）

OSC（包括 FFA、PPA 等区域）在知觉中同时表现出位置容忍（位置不变性）和对侧偏好：双侧输入时同侧信息被强烈抑制（interhemispheric normalization）。然而，VWM 需要在没有持续感觉输入的情况下维持内部表征。一个根本性问题是：VWM 是直接继承知觉的空间约束（保持对侧编码），还是通过重组表征拓扑来满足记忆需求？

前人研究在早期视觉皮层（EVC）中发现记忆可以减弱对侧偏好，但 OSC 因其更大的感受野和更强的自上而下调制，其记忆态的空间编码方式尚不清楚。

3｜方法主线（Approach）

作者设计了一套高度匹配的六任务 fMRI 实验范式，所有任务使用相同的 20 个真实物体刺激：

任务	缩写	核心要求
单侧知觉	UP	单侧看一个物体
双侧知觉	BP	两侧各看一个物体
中央知觉	CP	中央看一个物体
单侧 VWM	1-item WM	双侧编码→箭头线索提示侧→延迟 10s→报告
双侧 VWM	2-item WM	双侧编码→延迟 10s→后线索→报告两侧
双侧注意	BA	检测物体旋转（高度注意参与）

每位被试完成 >11 小时 fMRI 扫描（1520 个 event-related VWM trials），使用：

SVM 解码（20-class，留一 trial-out cross-validation）
交叉侧解码（contra 训练→ipsi 测试）
顶点消融分析（vertex-ablation，逐步移除双侧响应性最高的顶点）
表征相似性分析（RSA）及 searchlight RSA

EVC、IPS、FEF 作为对照区域。

4｜创新贡献（Novel Contribution）

方法创新（Methodological）为主，兼有理论创新。

首次系统比较了 OSC 在知觉和 VWM 下的空间表征拓扑，并使用相同刺激集和匹配任务设计排除混淆
顶点消融分析提供了一个精巧的量化框架：通过逐步移除双侧响应性最高的顶点，证明了 VWM 征用了超过 90% 的同侧 OSC顶点——远超出知觉中可解码的范围
揭示了 OSC 与 IPS 在记忆表征格式上的双重解码机制：OSC 保留知觉格式而 IPS 采用抽象格式

创新幅度：中高。 这不是一个全新的发现（已有研究表明 OSC 参与 VWM），但其系统性的空间拓扑量化是一个重要进步。

5｜关键点（Key Points）

双侧知觉下同侧 OSC 无显著表征，但单侧知觉下同侧有微弱表征——与 interhemispheric normalization 模型一致
VWM 双侧编码→同侧 OSC 出现稳健解码，无论记忆负荷是 1 个还是 2 个物体；这种双侧化在 vertex-ablation 中持续到 >90% 顶点被移除后仍显著
注意力任务（BA）不能解释这种扩展——BA 任务虽然有更强的注意参与，但其同侧表征在 vertex-ablation 中显著弱于 VWM
同侧 OSC 的表征格式与对侧高度相似（与 CP 模板 RDM 高度相关），说明 VWM 扩展是一种”格式不变、拓扑重组”的策略
IPS 也支持双侧解码，但不保留知觉格式——与 CP 模板无显著相关，提示其记忆表征更抽象/任务驱动

6｜关键数学 / 统计方法（Quantitative Tools）

方法	作用	可迁移性
Vertex-ablation decoding	逐步移除按双侧响应性排序的顶点，量化记忆表征的空间分散程度	高——适用于任何需要区分”真正需要”和”边缘参与”的脑区解码研究
Cross-lateral decoding	用对侧高 SNR 数据训练→同侧测试，分离 SNR 效应与真正的表征存在	中高——适用于双侧不对称 SNR 的 fMRI 分析
Searchlight RSA	以每个顶点为中心构建局部 RDM，与知觉模板 RDM 相关，生成全脑表征相似图	高——经典方法，广泛适用于表征映射

7｜结果与证据强度（Results & Evidence Strength）

证据强度：强。

数据量极其充分：每位被试 1520 个 VWM trials + 知觉对照，每人 >11 小时扫描，6 名被试但组内统计力通过 trial 密度弥补
多重交叉验证：解码 + RSA + cross-lateral + vertex-ablation，所有方法指向一致结论
严格的混淆控制：匹配的刺激集、对照任务（BA 排除注意 confound）、cue-specific 效应（确认是记忆而非知觉残余）
FDR 校正的 P 值，多重比较控制严格

主要弱点：

n=6 且均来自北京大学在校生——样本量小，外推性存疑；但作者指出每人 >11h 扫描的设计最大化组内统计力
无眼动追踪——虽通过短刺激呈现（200ms）和 EVC 严格对侧解码间接验证了注视稳定，但不如直接眼动数据可靠
fMRI 的时间分辨率限制——延迟期解码可能混有知觉残余，但 cue-specific 效应和后期时间窗口分析部分缓解了此问题

8｜局限与注意点（Limitations）

样本量小（n=6）——尽管组内数据量大，但个体差异无法充分估计，群体水平的结论仍需更大样本验证
无眼动追踪——无法完全排除微眼动对同侧表征的贡献
fMRI 时间分辨率低——无法精确区分编码阶段和维持阶段的表征动态；同侧表征何时出现（编码中还是延迟期？）不清楚
任务要求的是基本类别级别的记忆（”大象”而非”哪只大象”）——这可能导致 EVC 无显著参与；对于细粒度记忆，EVC 可能也会展现出类似的双侧化
FEF 无显著解码——可能因 fMRI 空间分辨率限制或 FEF 编码更抽象/非线性的表征格式，不能证明 FEF 不参与物体 VWM

9｜可迁移价值（Transferable Value）

Vertex-ablation 框架可直接用于其他脑区/认知功能的表征分散度分析——这是一个干净、可量化的工具
“格式不变、拓扑重组”的概念可以推广到其他认知任务（如注意、想象）中知觉与记忆的关系研究
OSC vs. IPS 的双重编码机制提示在设计脑机接口（BCI）或解码器时，应根据目标区域选择不同的解码策略——OSC 的信号更接近知觉模板，IPS 的信号更抽象
跨同源区的 interhemispheric coordination 可能是 VWM 中信息稳定化的关键机制——这一假设可以用高时间分辨率方法（EEG、ECoG）进一步检验

10｜一句话总结

VWM 不继承知觉的空间约束——OSC 在记忆态中通过感知格式不变但空间拓扑双侧化的方式，将超过 90% 的同侧皮层纳入物体编码。