
在人工智能的浪潮中,一个看似不起眼的技术术语——Token,正悄然成为衡量整个行业价值的核心单位。而站在这场变革最前沿的,正是英伟达创始人兼CEO黄仁勋。他不仅将Token奉为“新货币”,更带领英伟达发动了一场以提升Token生成效率为目标的激烈竞赛。这场“卷Token”的战争,正在重塑AI芯片、模型应用乃至全球经济的底层逻辑。
一、Token:从技术概念到战略货币
Token是什么?在AI大模型中,它是文本处理的最小计量单位:1个汉字约等于1个Token,一句“Hello world”则拆分为2个Token。每一次对话、每一次推理、每一次生成,背后都是海量Token的流动。
黄仁勋敏锐地捕捉到这一本质。在2024年的GTC大会上,他首次明确提出:“Token is the new currency.”(Token就是新的货币。)在他看来,未来的AI工厂不再生产实体商品,而是以最低的成本和功耗,源源不断地生成最具价值的Token。谁能在单位算力下产出最多的Token,谁就掌握了AI时代的定价权。
这一论断,将英伟达从一家显卡制造商,彻底转型为“AI铸币厂”的核心设备供应商。
二、技术“卷”起来:Vera Rubin与Dynamo的算力革命
为了大幅降低生成Token的成本,英伟达启动了近年来最激进的技术路线图。2025年,黄仁勋公布了下一代AI芯片平台——Vera Rubin。该平台将AI推理过程拆解为“理解上下文”与“逐Token生成”两个阶段,并针对后者进行了极致优化。其目标是在2026年至2027年间,实现每瓦性能数十倍的提升。
与此同时,英伟达还发布了开源推理库Dynamo。在最新的Blackwell架构GPU上,Dynamo能够将分布式推理性能提升至Hopper架构的40倍。这意味着原本需要40台服务器才能完成的Token生成任务,现在仅需1台即可完成,能耗和成本大幅下降。
黄仁勋毫不掩饰自己的野心:“我们要将生成Token的成本再降低10倍。” 如果这一目标实现,未来调用大模型API的费用将变得几乎可以忽略不计,AI应用将如当年的移动互联网一样遍地开花。
三、市场“卷”起来:万亿美元的Token经济蓝图
“卷”技术只是手段,“卷”市场才是目的。黄仁勋为英伟达算了一笔清晰的账:全球每年生成的海量Token,如果全部用英伟达芯片来推理,将形成一个规模惊人的商业市场。
他在财报电话会上给出了明确的预测:到2027年,仅AI芯片相关的营收就将超过1万亿美元。这个数字超过了当前全球半导体行业的总和。支撑这一预测的,是来自云厂商、企业级客户以及无数AI创业公司的Token生成需求。
更令人侧目的是,黄仁勋甚至提出,未来英伟达工程师的薪酬可以部分用“AI tokens”来发放。虽然这更像一种象征性的口号,但它清晰地传递了一个信号:Token终将像电力一样,成为一种可交易、可计量的基础资源。英伟达要做Token世界的“国家电网”。
四、卷Token的背后:一场关于AI普惠的豪赌
黄仁勋疯狂“卷Token”,并不仅仅是为了卖更多的芯片。其深层逻辑,是推动AI从“奢侈品”走向“日用品”。
当前,调用顶级大模型的成本依然高昂。例如,GPT-4级别的模型每生成100万个Token需要花费数十美元,这使得许多创意型应用、实时交互场景无法落地。如果英伟达成功将成本降低100倍,那么AI实时翻译、无限记忆的虚拟伴侣、自动生成剧情的游戏……都将成为现实。
正如黄仁勋所说:“我们希望Token像空气一样廉价且无处不在。” 这场战争终局,赢家不会是某一家芯片公司,而是全世界的AI用户。
结语
黄仁勋正在“卷”的,从来不只是Token本身,而是Token背后的效率、成本与商业模式。他将一个冷冰冰的技术单位,淬炼成了英伟达征战AI时代的核心武器。当Token真正成为新货币的那一天,人们或许会想起:这场革命,始于一个穿皮衣的男人,和他对计算本质的极致追求。


