……
在朱宋纯收到徐辰论文的第二天凌晨两点。
北京,科技部,部长办公室。
窗外的长安街依旧灯火通明,车流如织,但在这间並不宽敞的办公室里,空气却仿佛凝固了一般。
王至刚坐在办公桌后,手里捏著那份刚列印出来的《关於构建国產原生逻辑推理晶片(lpu)生態的战略建议书》。纸张还带著印表机特有的余温,但在他指尖传来的触感却有些发烫。
他对面,朱宋纯正端著一杯早已凉透的茶,目光並没有聚焦在任何一点,而是有些失神地盯著墙上那幅巨大的中国地图。
两人已经这样沉默了足足十分钟。
“我看完了。”
王至刚终於打破了沉默。他合上文件,动作很轻,仿佛怕惊扰了纸面上那些跳动的数学符號。他摘下眼镜,揉了揉有些酸涩的眉心,声音沙哑而平静:“结论?”
“transformer不会死,但它的统治力会终结。”
朱宋纯的声音很低,去掉了所有修饰词,“感性的归矩阵,理性的归几何。slrm模型切走了『逻辑推理』这块蛋糕。未来的算力结构,將是70%的廉价矩阵计算,加上30%的高价值逻辑计算。”
王至刚转过身,镜片在微光下折射出一道冷冽的光:“这意味著什么?”
“意味著英伟达构筑的『万卡集群』护城河,被填平了至少一半。”
朱宋纯抬起头,“因为slrm对显存带宽不敏感。它不需要hbm3那种昂贵的高带宽內存,也不需要台积电3nm那种极致的製程。如果我们將这30%的逻辑算力掌握在手里,就能用成熟工艺,去撬动他们用先进位程锁死的性能天花板。”
“以弱胜强的非对称支点。”王至刚精准地概括道。
“对。而且,这会让h100这种通用晶片变成笨重的代名词。它依然有用,但不再是皇冠上的明珠。”
王至刚站起身,走到落地窗前。
他在计算。
计算地缘政治的筹码和產业链的重构成本。
如果朱宋纯说的是对的,那么目前全球每年投入在ai基础设施上的三千亿美元,其资產定价逻辑將发生根本性重估。
原本属於英伟达的高溢价,会因为“算力通胀”而迅速缩水;而中国手里掌握的成熟製程產能和庞大的应用场景,將从“劣质资產”一夜之间变为“核心资產”。
这是一次千载难逢的“资產置换”机会。
“风险呢?”
“如果这种架构的產业化过程被证明是走不通的,我们浪费的是18个月的时间窗口和十几个亿的流片成本。”
“如果走通了呢?”
“我们將拥有定义下一代ai『智商』標准的权力。”
房间里陷入了死寂,只有墙上的石英钟发出单调的切分音。王至刚的手指在桌面上无声地敲击著,那是他在做重大决策时的习惯——模擬倒计时。
三秒后,他拿起了那部红色的保密电话。
“接办公厅。”
“启动『破壁』预案。级別:绝密。”
“另外,通知那几家在镁国商务部『实体清单』上掛了號的头部企业——海丝、寒武纪、壁仞等。后天上午九点,西山勤务指挥中心三號楼。告诉他们,这是一次关於『產业链重组』的闭门会。”
……
第三天。北京,西山某內部招待所。
这里是京郊一处不起眼的院落,红墙灰瓦,掩映在苍松翠柏之间。没有醒目的招牌,只有门口荷枪实弹的哨兵和那一排排掛著特殊牌照的红旗轿车,无声地昭示著这里的特殊地位。
会议室设在三號楼的地下二层。
厚重的防爆门缓缓关闭,將外界的喧囂彻底隔绝。
会议室大得有些空旷,没有窗户,四壁贴著吸音材料,让室內的空气显得异常凝滯。
长桌两侧,坐著掌控中国半导体命脉的几位巨头。每个人面前,只放著一份用红色铅印標註了“绝密·编號0x”的文件。
只有薄薄的三页纸。
王至刚坐在主位,他没有说话,留足了十分钟,让这几位顶级大脑去消化那三页纸上掀起的数学风暴。
终於,他放下了文件,指节在桌面上轻叩了两下。
“都看完了。我就直接说科技部的想法。”
王至刚的声音不大,但语速很快:“这不是一次简单的技术升级,这是一次换道超车。基於最新的slrm模型,我们计划启动『双轨並行』战略。”
他伸出一根手指:“第一轨,存量市场。transformer架构依然是主流,英伟达的cuda生態我们暂时动不了。壁仞、摩尔线程,你们继续在兼容性上做文章,稳住当下的基本盘。”
“第二轨,也是今天的重点——增量突围。海丝、寒武纪,我要你们牵头,根据这个数学模型,定义全新的『lpu』架构。这不仅仅是晶片设计,还包括配套的eda工具链改造,以及最难啃的软体生態。”
“科技部负责统筹,发改委负责立项。我的设想是:三个月內,跑通全流程验证。”
……
话音刚落,海丝的何亭波率先摘下了眼镜。
“部长,战略我认同。但在工程落地前,我有两个技术顾虑,必须摆在桌面上。”
“讲。”
“第一,是『验证闭环』的死结。”
“在工业界,正常流程是先做fpga原型验证,再做小规模mpw(多项目晶圆)流片,拿著硬体测出的真实数据去修正算法,如此叠代三轮,至少需要两年。但您要求三个月?”
何亭波指著文件上的公式,“slrm算法目前只是数学推导。如果没有硬体,算法跑不起来,我们不知道真实的能效比;反过来,如果不知道算法在硬体上的真实行为,我们没法確定缓存的大小和指令流水线的深度。”
“这是一个鸡生蛋、蛋生鸡的死循环。贸然流片,几十亿打水漂事小,浪费的时间窗口事大。”
王至刚微微頷首,示意她继续。
她顿了顿,继续道:“第二,是『算子硬化』与eda工具库的匹配问题。”
何亭波在白板上画了一个简图:“现在的gpu架构,大约60%的面积是通用的,比如內存控制器、总线、指令调度,这些我们可以直接復用昇腾现有的成熟设计。这也是我们能快速突破的基础。”
“但是,”她在核心计算区域画了个圈,“剩下的40%,也就是『计算核』(core),必须彻底置换。”
“现在的gpu核心,也就是所谓的tensor core,全是为『乘加运算』设计的,里面堆满了乘法器和加法器。但lpu的核心是几何逻辑,它需要的是大量的『比较运算』、『集合运算』以及特殊的『gumbel分布採样』。”
“这意味著什么?”王至刚问。
“意味著我们现有的『宏单元库』失效了。”
何亭波解释道:“我们现有的eda工具,synopsys也好,华大九天也好,它们的综合引擎都是为了『算术逻辑』优化的。当我们输入一个乘法指令,工具能自动生成最优的电路结构。但如果我们输入一个『高维几何交集』指令,现有的工具根本不知道该怎么把这一堆电晶体摆放才是最优的。”
“所以,”何亭波总结道,“这不是简单的把gpu里的乘法器拆下来换个零件。这涉及到最底层的物理实现。我们需要重新设计一种『专用定製单元』,並让eda工具『学会』怎么去调用它。”
她看向王至刚,提出了一个明確的要求:“我们需要华大九天的底层算法团队,直接进驻海丝。我们不能只用通用的商用工具,我们需要他们开放后端综合引擎的源码,配合我们的架构师,现场手搓一套专门针对『几何算子』的物理综合规则。”
“设计与工具协同进化?”
“没错。”何亭波双手紧扣,“我们定义算子,他们修改工具。只有当eda工具能『理解』这种新的几何逻辑时,我们才能在有限的硅片面积上,塞进比英伟达多十倍的逻辑算力。”
……