一个管着上千亿资金的量化大佬,梁文锋,突然在内部会上,对着帮他赚钱的整个团队,扔下一句话。 他说,别跟我提什么中国AI跟美国只差一两年,那都是表面功夫。 说出这话时,梁文锋的办公桌上还摊着DeepSeek-R1模型的最新测试报告——这个由他一手创办的AI模型,刚在全球加密货币交易实战中逆袭登顶,10天收益率123.04%,把GPT-5等美国顶尖模型远远甩在身后,后者最高亏损超70% 。 能做出碾压级的实战成绩,他却偏要泼冷水,不是故作谦虚,而是见过太多行业乱象后的清醒。这位40岁的广东籍大佬,从浙大电子信息专业硕士毕业时就带着算法执念,2008年揣着8万元闯进量化圈,如今一手打造的幻方量化管理规模超千亿,还孵化出能比肩GPT-4o的通用AI模型,他的话语权,全靠真金白银的实战和真刀真枪的技术堆出来的。 梁文锋最不能忍的,是把“应用层创新”当成“核心技术突破”。他在内部会上翻出团队的研发日志,指着其中一页怒怼:“我们用Transformer架构做因子融合,美国早把稀疏注意力机制玩透了;我们花10亿建‘萤火二号’超算,人家的算力生态已经支撑起整个产业的协同创新”。 这话戳中了行业痛点——2025年国内头部量化私募集体跨界AI,有的做医疗场景应用,有的搞垂直领域模型,但真正扎进底层算法研究的少之又少 。 梁文锋自己踩过坑,2018年幻方刚推深度学习交易模型时,过度依赖开源框架,结果在极端行情中差点翻车,后来砸2亿建自研训练平台“萤火一号”,才慢慢摆脱对外依赖。 他的焦虑,藏在对团队的严苛要求里。幻方招聘从不看金融背景,只挖数学家、物理学家和计算机科学家,就是想避开“路径依赖”的陷阱。 有一次,研究员用现成的开源算法做出高收益策略,被他当场否决,要求从底层重构。“别人的框架再好,也是别人的护城河,我们跟着跑永远只能吃剩饭”,他在会上拍了桌子,“DeepSeek能在实战中赢。 不是因为我们比美国团队聪明,而是量化基因让我们更懂风险控制,但论底层创新,我们还差着一个生态的距离” 。这话不是空穴来风,DeepSeek-R1训练成本仅为GPT-4o的1/10,可核心芯片仍依赖英伟达A100/H800,这是他心里绕不开的坎。 行业里总有人拿“后发优势”自我安慰,说中国量化机构没有传统模型负担,能快速应用最新技术。梁文锋却在私下交流中直言这种想法太天真:“后发优势是能少走弯路,但不能跳过基础研究” 。 他见过太多同行,把美国的技术路线换层皮就叫“创新”,把别人的算法微调下就喊“突破”,可一到极端市场环境,这些“表面功夫”就露了馅。 2025年全球AI模型交易实战中,美国模型之所以集体崩盘,不是技术不行,而是缺乏量化实战的风险控制逻辑;但反过来看,中国模型能赢,也只是在应用层面做得出色,底层架构的原创性依然不足 。 梁文锋的清醒,源于他对行业本质的看透。量化投资的核心是数据、模型与算法,AI只是工具,可很多机构却把工具当目的,盲目追求模型复杂度,忽视了底层逻辑的打磨 。 他创办DeepSeek时就定了规矩:每年拿出营收的30%投入基础研究,不搞短期商业化,哪怕暂时不赚钱也要啃硬骨头。2025年,DeepSeek成为首个以“开放权重”形式发布的推理大模型,允许全球研究者免费下载二次开发。 就是想打破闭源的壁垒,慢慢搭建中国自己的AI生态。他在朋友圈转发西蒙斯传记序言时写道:“旧世界分崩离析,新时代正在光速到来”,这话里藏着他的野心——不是做一个赚钱的量化机构,而是要成为中国AI底层创新的推动者。 现在的行业里,太多人沉迷于“表面差距缩小”的幻觉,却忘了核心技术的突破从来没有捷径。 梁文锋在内部会结尾时放了段视频,是DeepSeek团队攻克稀疏注意力机制时的加班片段,屏幕上滚动的代码和白板上密密麻麻的公式,都是看不见的硬功夫。 “我们能管好上千亿资金,靠的不是跟风,是把每个细节做到极致”,他看着团队成员说,“AI竞争也是一样,表面的差距能靠钱补上,底层的鸿沟只能靠时间和耐心填平”。 当大家都在为中国AI的“实战胜利”欢呼时,梁文锋的泼冷水更显珍贵。他不是否定行业的进步,而是怕浮躁的风气掩盖了真实的差距。中国AI真的能在短时间内追上美国吗?是继续在应用层内卷,还是沉下心做基础研究? 各位读者你们怎么看?欢迎在评论区讨论。

评论列表