掛断电话后,朱宋纯並没有坐回办公桌前。
他走到巨大的落地窗边,脑海中预演完这场即將到来的风暴。
“slrm……”
朱宋纯在心中默念著这个缩写。
作为一个在ai领域摸爬滚打三十年的老兵,他太清楚一项新技术从实验室走到產业链,中间隔著多少道鬼门关。
资源是有限的,时间是紧迫的。要想在镁国人的眼皮子底下完成“换道超车”,必须要有精密的战术编排,形成不可逆转的“飞轮效应”。
“第一步,必须是晶片。”
朱宋纯目光一凛。他当然知道“硬体彩票”理论——通常是硬体决定了哪种算法能活下来,而不是反过来。为一个新算法定製晶片是一场豪赌,贏了通吃,输了倾家荡產。
但在slrm面前,这註定是一场值得押上身家性命的赌局。因为这可能是目前华国ai唯一一次掀翻桌子的机会。
“软体优化是有极限的。在gpu架构上跑逻辑推理,就像是在沙地上跑f1赛车。gpu的数千个cuda核心是为矩阵乘法这种『大吞吐、低逻辑』的任务设计的。而slrm的核心是『gumbel-box』,充满了条件判断和非线性变换。”
“如果不解决底层硬体的適配问题,slrm永远只能是个『慢吞吞』的数学玩具。”
“所以,必须由国家队进场。海思、寒武纪,必须在下一代晶片的ip核中,硬化『gumbel-box』算子,设计专用的lpu(逻辑处理单元)。”
专业计算卡相比通用卡的优势是巨大的。当年比特幣挖矿,一开始大家也用显卡。但后来比特大陆搞出了专用asic晶片,能效比直接提升了百倍,瞬间把显卡扫出了挖矿市场。
“slrm也是一样的道理。它对製程不敏感,不需要追求台积电的3nm、5nm极致工艺。哪怕是用国內成熟的14nm甚至28nm工艺,只要架构对了,去掉了gpu里那些为了图形渲染而存在的冗余单元,专攻逻辑推理运算,其能效比也能吊打英伟达的4nm h100。”
“这一步最慢,流片周期至少三个月,所以必须最先启动,作为『矛尖』。”
……
“第二步,是生態的『躯干』——编译器与中间表达(ir)。”
朱宋纯的思绪转向了软体层。
“光有晶片还不够,得让开发者用得爽。”
“英伟达的护城河不仅仅是硬体,更是cuda。那个庞大的算子库,让无数开发者產生了路径依赖。但cuda是为矩阵计算生的,在逻辑推理的新赛道上,它也是个瘸子。”
“我们要定义新的標准。可以让华威的mindspore团队,开发一套专门针对slrm的编译器后端。”
“虽然最终的编译器后端依赖於晶片的指令集,但中间层的框架设计现在就可以启动。我们要打造一套专门针对slrm原生优化的软体栈,让开发者能像呼吸一样自然地迁移过来。”
……
“第三步,才是应用落地。”
“我们需要一个『杀手级』的demo,来点燃资本的热情。”
“比如法律大模型,或者数学解题大模型。用极小的参数量,实现极高的准確率。”
想到这里,朱宋纯停顿了一下,並没有被狂热冲昏头脑。他很清楚,成本优势的建立不是一夜之间的事。
“transformer架构的推理成本从每百万token 100美元降到0.01美元,用了整整八年。slrm作为新生事物,初期的单位算力成本必然高昂,不可能一上来就比成熟的gpu更便宜。”
“但这局棋依然能活。”
“关键在於『共生』。slrm与llm结合,能產生『一加一大於二』的化学反应。因此这个组合中的llm可以用小参数模型,成本会降低。用昂贵但精明的slrm做逻辑引导,用廉价且量大的传统llm做知识填充。只要总体方案能对標同等智力的大参数模型,商业闭环就能跑通。我们不需要等八年,现在就能上牌桌。”
……
布局完进攻路线,朱宋纯的眉头微微皱起。
进攻容易,防守难。
大洋彼岸的对手,可是掌握著全球最顶尖算力和人才储备的超级霸主。一旦他们反应过来,全力跟进,华国这点先发优势能守得住吗?
“专利墙?当然要搞。但这只是防君子不防小人的手段。在国家利益面前,专利法往往就是废纸。”
“真正的防御,也许是『人性』和『商业规律』。”
他想到了两个词:【沉没成本】与【创新者的窘境】。
“英伟达、谷歌、微软,他们在gpu集群上砸了多少钱?几百亿,甚至上千亿美金。”
“他们的数据中心里,堆满了h100。他们的软体栈,全是基於transformer和cuda优化的。那些刚刚建好的超算中心,折旧期才刚刚开始。”
“现在,突然冒出来一个slrm技术,告诉他们:『嘿,你们的gpu架构过时了,未来的ai不需要那么多矩阵乘法了。』”
“他们会怎么做?”
朱宋纯仿佛看到了黄仁勛和皮查伊纠结的表情。
“他们绝不会立刻掉头。因为掉头意味著承认之前的几百亿投资打了水漂,意味著要革自己的命,意味著股价的崩盘。”
“就像当年的柯达,明明发明了数位相机,却为了保护胶捲业务而將其雪藏,最后被时代拋弃。”
“董事会和华尔街不会答应他们立刻转向。资本的惯性是巨大的。”
“所以,他们的第一反应,一定是『抵制』或者『魔改』。”
“他们很有可能会继续在纯transformer架构上修修补补,试图通过堆砌算力来掩盖架构的落后,利用先发优势和成熟的用户认知,继续一条路走到黑。”
歷史上这样的例子比比皆是。想想九十年代的x86架构与dec alpha晶片之战。当时的alpha晶片在技术指標和运算速度上完全碾压英特尔,被誉为当时地球上最快的处理器。但结果呢?英特尔凭藉与微软windows组成的『wintel联盟』,用庞大的软体兼容性和生態壁垒,活活耗死了技术上遥遥领先的alpha。在商业战场上,有时候『好用』比『先进』更重要,而『大家都用』则比『好用』更致命。
“当然,像谷歌这样的巨头可能会尝试跟进slrm,毕竟他们最怕被看不见的敌人打死,也有足够的资金去『赛马』。”
“但这就轮到专利墙发挥作用了。我们在lpu的『分支预测逻辑』和『非线性算子硬化』上已经布下了天罗地网。他们就算有先进位程,也绕不开这些架构设计的底层逻辑。一旦他们选择绕道,就只能採用次一级的方案,这样一来,我们的製程劣势就被抹平了。”
“再加上我们先发构建的软体生態……只要我们的生態足够繁荣,他们为了兼容性,最终只能捏著鼻子融入我们的体系。”
“这就是『创新者的窘境』。他们越是拥有庞大的资產,就越是难以转身。”
“而这,就是我们的机会。”
“我们没有几万张h100的包袱,我们是一张白纸。我们可以毫无顾忌地拥抱新架构,从零开始建设lpu生態。”
“等到他们发现gpu实在撑不住,不得不转身的时候,我们的lpu生態已经成了气候,专利墙已经筑高,开发者习惯已经养成。”
“那时候,他们再想追,就只能看著我们的背影吃灰了。”
朱宋纯长舒了一口气,眼中的光芒愈发坚定。
这是一个完美的闭环。
从技术突破,到產业链布局,再到利用对手的商业弱点进行战略防御。