AAAI 2026 | Vision Transformers are Circulant Attention Learners：当Self-Attention学会“偷懒“，效率与精度我全都要！

发布时间：2026/7/6 2:01:49

论文: Vision Transformers are Circulant Attention Learners作者: Dongchen Han, Tianyu Li, Ziyi Wang, Gao Huang (清华大学 LeapLab)发表: AAAI 2026论文链接: https://arxiv.org/pdf/2512.21542代码链接: https://github.com/LeapLabTHU/Circulant-Attention一、引言Vision Transformer (ViT) 的成功离不开 Self-Attention 机制强大的全局建模能力。但正所谓"能力越大，代价越大"——Self-Attention 的O ( N 2 ) O(N^2)O(N2)二次复杂度在高分辨率场景下简直是算力黑洞。为了缓解这个问题，前人提出了各种"手工设计"的优化策略：局部注意力（Swin Transformer）：将注意力限制在窗口内稀疏注意力（PVT）：对 K/V 进行下采样动态路由（BiFormer）：动态选择感兴趣的区域然而，这些方法本质上都是外部强加的手工约束，不可避免地会损害模型的表达能力。那么问题来了：有没有一种方法，既能降低 Self-Attention 的计算复杂度，又能最大程度保留其强大的表达能力？今天要介绍的这篇 AAAI 2026 论文给出了一个非常 elegant 的答案——Circulant Attention（循环注意力）。二、核心发现：Self-Attention 天生就会"偷懒"论文首先做了一个非常有趣的观察：训练好的 ViT 中的 Attention 矩阵，竟然高度近似于 BCCB 矩阵！BCCB（Block Circulant matrix with Circulant Blocks）是循环矩阵在二维的推广，它的核心特点是：完全由第一行决定，整个矩阵就是第一行不断循环移位的结果矩阵乘法可以用 2D FFT 在O ( N log ⁡ N ) O(N \log N)O(NlogN)时间内完成这意味着什么？意味着Self-Attention 虽然形式上花着O ( N 2 ) O(N^2)O(N2)的算力，但实际上它学到的模式完全可以用O ( N log ⁡ N ) O(N \log N)O(NlogN)高效计算。论文进一步可视化了相邻 query 的注意力分布，发现它们呈现出明显的平移不变性（shift invariance）——这正是 BCCB 矩阵对应的 2D 全局卷积的行为特征。三、方法：Circulant Attention基于上述发现，论文提出了Circulant Attention，核心思想很简单：将原始的 Attention 矩阵显式地投影到 BCCB 矩阵子空间上，然后用 FFT 高效计算。3.1 数学形式原始 Self-Attention：A = Q K ⊤ d , O = σ ( A ) V A = \frac{QK^\top}{\sqrt{d}}, \quad O = \sigma(A) VA=dQK⊤,O=σ(A)VCirculant Attention 将A AA替换为它在 BCCB 子空间上的正交投影A ~ \tilde{A}A~：A ~ = arg ⁡ min ⁡ B ∈ B ∥ A − B ∥ \tilde{A} = \arg\min_{B \in \mathcal{B}} \|A - B\|A~=argB∈Bmin∥A−B∥其中B \mathcal{B}B是 BCCB 矩阵子空间。3.2 高效计算由于 BCCB 矩阵完全由第一行a aa决定，我们可以直接计算a aa：

AAAI 2026 | Vision Transformers are Circulant Attention Learners：当Self-Attention学会“偷懒“，效率与精度我全都要！

相关新闻

Linux 内核日志捕获对比：/proc/kmsg 与 /dev/kmsg 的3大差异与实时监控方案

华为 A800I A2 昇腾 910B NPU 大模型推理部署

RTVS 1.3.0 阿里云 CentOS 7.8 部署实战：5分钟完成 Docker 网络与端口映射配置

2026新大纲普通话考试真题题库50套（PDF电子版）

Python爬虫经典案例第68篇：新闻媒体平台爬取：BBC新闻数据采集实战

基于FSV8943的4寸4色AI智能墨水屏手机背夹模组——个性由我，屏上生花

Ubuntu系统镜像各个版本下载Ubuntu镜像合集资源Linux系统镜像乌班图Linux系统镜像

别盲目上顶配！ChatGPT 权益充值与 Pro20x 真实适配场景

zxcvbn密码强度评估工具：如何快速提升密码安全性的完整指南

思源宋体CN：7种字重免费开源字体，中文设计从此无忧

解锁AMD Ryzen处理器深层性能：SMU Debug Tool完全指南

6个月转型AI工程师：实战路径与核心技能

终极指南：在Windows上完美驱动Apple触控板的完整解决方案

Windows任务栏终极清理指南：用RBTray一键隐藏窗口到系统托盘

React Server Components安全漏洞CVE-2025-55182深度剖析与防御实践

Coze与Dify对比指南：低代码AI应用开发从入门到实战

AI生图工具怎么选？2026年6月版实测对比

国产DSP FT-M6678 DDR3配置避坑指南：从PLL时钟到PHY寄存器，手把手调通你的第一块板