第194章 SLRM论文投稿
你在读故事,故事也在回应你。
  原因很简单。
  首先,ai圈子太浮躁了。大家每天都在追逐最新的sota,看谁的模型参数更大,谁的demo更炫酷。对於这种满篇都是微分几何、流形拓扑的“硬核理论”论文,绝大多数工程师看一眼摘要就头大,直接划走了。
  其次,验证成本太高。
  数学论文,只要逻辑通了就是通了。但ai论文,你说你效果好,別人得復现出来才算数。而復现徐辰这个模型,不仅需要重写底层的算子,还需要不菲的算力。在没有看到確凿的“神跡”之前,没人愿意花这个冤枉钱。
  reddit网站的机器学习板块,倒是有人发了个帖子提到了这篇论文,但回復寥寥。
  【用户a】:来了一个“is also you need”?现在的標题党真是够了。
  【用户b】:等等,作者是chen xu?怎么这么眼熟,是那个数学天才吗?
  【用户c】:好像还真是他。不过术业有专攻吧,搞数论的来搞深度学习?我看了眼论文,全是微分几何和流形分布……太硬核了,完全看不懂。
  【用户d】:没有github连结?没有ingface权重?那这就是纯理论推导唄。散了散了,等什么时候有人復现了再说。
  正如朱宋纯所预料的那样,西方的学术界和工业界,对来自华国的ai学术成果有著天然的傲慢。
  在他们眼里,ai的中心在硅谷,在openai,在谷歌。一个中国的数学系大一新生,写了一篇满是数学公式、没有一行代码的论文,能有什么价值?
  大多数研究员点开pdf,看到第二页那密密麻麻的“gumbel-box”推导公式时,就直接劝退关闭了。
  “太理论了。”
  “数学杂耍而已。”
  “大概率是过擬合了一些特定任务。”