查看: 5|回复: 0

别瞎试了:群论证明,AI的位置编码已被数学锁死

[复制链接]

10

主题

1

回帖

42

积分

新手上路

积分
42
发表于 4 小时前 | 显示全部楼层 |阅读模式
【别瞎试了:群论证明,AI的位置编码已被数学锁死】

大模型研究员总想发明新的位置编码来超越RoPE,但Jane Street这篇硬核研究直接给这个领域盖了棺:别折腾了,好用的通道早就被数学锁死了。

注意力机制天然是瞎子,分不清词的先后。要给它加位置感,还要满足平移不变和连续性,这在数学上会被死死卡在“单参数群”的结构里。简单说,所有位置变换在底层只有矩阵指数这一种形式。

沿着这个线索推导,数学只给出两种可能:如果矩阵能对角化,你得到的就是RoPE这种像时钟指针一样的旋转,或者衰减;如果矩阵不能对角化,就会产生类似滑行冰壶的多项式增长,这刚好对应了ALiBi这种靠扣分工作的长文本算法。

这带来了一个极具美感的结论:AI的进化看似是工程师玄学试错的产物,最后却总能撞在严丝合缝的数学定理上。终点线早就画好了。

blog.janestreet.com/using-group-theory-to-explore-positional-encodings-attention/



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关注公众号

相关侵权、举报、投诉及建议等,请发 E-mail:2776601884@qq.com

Powered by Discuz! X5.0 © 2001-2026 Discuz! Team.|青ICP备2025004122号-1

在本版发帖
关注公众号
返回顶部