文|崔伟
清华大学博士
浙江大学金融学系校外导师
IEEE PES 中国区常务理事
Token,为什么变得这么热门?
最近半年,你一定在各种场合越来越频繁地撞见同一个词——Token。
在黄仁勋的GTC演讲里,它是“新的GDP”;在众多企业的财报电话会上,它是“下一条增长曲线”;在财经媒体的头条里,它是“Token出海”;甚至在你点开的AI产品账单里,它已经悄悄替代“次数”和“流量”,成为你实际付费的那个单位。
3月23日,在中国发展高层论坛2026年年会上,国家数据局局长刘烈宏明确将Token称为“词元”,“不仅是智能时代的价值锚点,更是连接技术供给与商业需求的‘结算单位’”;他还给出了一组数据:到今年3月,我国日均Token调用量超过140万亿,相比2024年初的1000亿增长了1000多倍。
▲ 央视报道截屏但在我和不同背景的朋友交流时,我发现一个共同的困惑:
Token 到底是字数?是算力?是账单?还是一种新的“电”?它凭什么被黄仁勋抬上“经济学”的高度,说出那句被无数媒体反复转发的判断:
“过去的数据中心是仓库,用来存你的档案和数据;未来的数据中心是工厂,用来生产 Token——AI 思考和说话的最小单位。”
——黄仁勋,GTC 2026
这篇文章,我想花一点时间,用尽可能直白的语言,把这笔账给你从头到尾算一遍:
Token 是什么、为什么突然重要、它怎么收费、你实际要花多少钱、谁在这条赛道上已经下场,以及那个被大量媒体热捧的“Token 出海”故事。
Token 到底是什么?
先从“一道菜”讲起
要理解黄仁勋那句“Token 工厂”,我们得先回答最朴素的一个问题:Token 是什么?
如果说人类的语言由“字”和“词”组成,那么 AI 的语言,就由 Token 组成。你可以把它想象成大模型眼中的“词语碎片”。这也是它叫做“词元”的原因,或者说“词语的基本元素”。
你说出的每一句话,对大模型来说是一道菜;Token 就是这道菜的食材。
例如,你问豆包、DeepSee3k:“帮我写封邀请函。”
它并不会像人一样“一个字一个字地读”,而是先把这句话切成葱、姜、蒜、肉片、酱油一类的“语言食材”——7个 Token——然后在自己的“厨房”里重新组合,做出一封500字的邀请函,这封信又大约对应500-800个Token。
▲ AI 制图按照英伟达的官方定义:Token 是 AI 模型在训练与推理时处理数据的最小单位,模型的所有能力——预测、生成、推理——本质上都是在“读入 Token、吐出 Token”的过程中产生的。
可以说,Token 既是 AI 的“语言”,也是 AI 的“工作量单位”,正在变成 AI 时代的“新货币”,就像蒸汽机时代的“马力”、电力时代的“度电”、互联网时代的“流量“。
它是计量单位,是商品,是货币,也是生产资料。
一个可以记住的换算规则:
配资网站英文里,1 个单词 ≈ 1-1.3 个 Token(因为 understanding 会被切成 understand + ing);
中文里,1 个汉字 ≈ 1-1.5 个 Token(大部分模型最初以英文训练,对中文的“切法”并不高效);
粗略记一个公式:1000 个 Token ≈ 750 个英文单词 ≈ 500 个汉字。
也就是说,你在微信里发的一段稍长的语音转文字,差不多就是 1000 个 Token。以我们上面这句话为例,“帮我写封邀请函”,通过 OpenAI 提供的切词示例,我们可以看到就是对应了 7 个Token。

▲ 截图,来自于 OpenAI Tokenizer 说明网页
(https://platform.openai.com/tokenizer)
用 AI 问一个问题,到底多少钱?
作为每天在使用大模型、“龙虾”的消费者、用户,大家真正关心的,可能是一句大白话:
“用 AI 这件事,我一个月要花多少钱?”
今天主流大模型的计费方式非常统一:按 Token 计价,输入和输出分开定价,输出通常贵数倍。不同厂商、不同档位的差距,可以大到“几十倍”的量级。下面这张对比表,所有数字都来自各家官方定价页:

▲ 数据来源:OpenAI API Pricing、Anthropic Opus、Gemini API Pricing、DeepSeek 官方定价
是不是看到了巨大的差异?
同样是“问AI一个问题”,Claude Opus 4.7的输出价格(25美元,约175元人民币),是DeepSeek-V3.2(3元人民币)的约60倍。这也是为什么,企业在接入AI时,“选哪个模型”已经不是产品问题,而是一个不折不扣的财务问题。
来,我们来实际算一笔账。
我们拿一个典型场景:你向 AI 输入一段 500 字的中文问题,它给你回了一段 1000 字的答案。
换算一下(按照 1个汉字等于 1.5 个 Token 计算)
输入:500 字 × 1.5 = 750 Token
输出:1000 字 × 1.5 = 1500 Token
分别用三个档位的模型跑一遍:

一目了然——同一笔问答,高端模型是“一杯奶茶钱的1/20”,国产模型则是“不到一分钱”。
当然,有朋友会问:我用DeepSeek、豆包,从来没有付过钱啊?
在互联网上有一个铁律:如果一个商品是免费的,你就是它的商品。对于网页端、APP 端的大模型产品,需要的是用户量和数据,所以是免费的。
但是通过“龙虾”这样的智能体产品,或者通过 AI 编程产品,以 API 的形式调用大模型,就需要按照上面的价格表付费。
黄仁勋在 GTC 2026 更进一步指出:未来 Token 将像航空舱位一样分层定价——免费档吸引用户、中档平衡规模与速度、高端档在海量上下文与极致吞吐上收取高昂的每百万 Token 费用。
▲ 黄仁勋在 GTC2026 演讲中用交通工具差异比喻 Token,AI 制图未来你用AI,会越来越像今天出差订机票:
同一条路线,不同速度,不同价格。普通人写周报用绿皮火车就行;高频交易员用头等舱秒级决策;自动驾驶必须坐“超音速专机”,因为延迟每多 0.1 秒,都可能是一场车祸。
你付的钱
不一定等于你以为的 Token 数量
这是整篇文章里,我最想让读者看懂的一节。因为这决定了你“省钱”的姿势对不对。
上面那笔 0.30 元也好、0.006 元也好,都只是“理想状态”下的单次调用成本。在真实世界里,你实际花出去的钱,常常会比这个数字高几倍甚至几十倍。原因是:
你看到的“输入”,只是冰山一角。当你在像“龙虾”这样的 AI 产品里输入一句话时,系统在背后还会悄悄塞进去大量的“隐形输入”:
系统提示词:告诉 AI “你是谁、能做什么、不能做什么”,这段话本身可能就是几百到上千个 Token;
历史对话记录:为了让 AI “记住”你们之前聊过什么,系统会把历史对话全部作为上下文再发一遍;
工具与知识库描述:如果你接入了 MCP、Skill、联网搜索、RAG 检索,每一个工具的说明书、每一段检索回来的文本,都会作为输入一同送入模型。
结果就是:你以为自己只是问了 10 个字,实际发给大模型的,可能是 10000 个 Token。
这就像你去餐厅点了一碗面:你以为付的是面钱,其实账单上还有桌布费、空调费、服务费、餐具消毒费……而且这些“附加费”,几乎都是按 Token 算钱的。
▲ AI 制图这也是为什么,AI 行业去年开始集体强调一个新词——上下文工程(Context Engineering),即如何通过技术手段优化发送给模型的上下文内容,因为每一个多余的 Token,最后都会变成成本;每一个无效的 Token,最后都会变成浪费。
之前笔者在本公众号中发表的“龙虾”介绍文章《这只“龙虾”缘何搅动全球AI圈——OpenClaw现象背后的技术变革与社会启示》,就提到了这一点:为什么大模型厂家、互联网厂家这么乐于推广“龙虾”这样的智能体产品?
因为它们会大幅度增加普通用户的 Token 用量。
更复杂的是,同样 100 万个 Token,在不同时间、不同用户、不同配置下的“真实含金量”也不一样,例如高峰期,模型厂商可能偷偷下调推理深度(俗称“降智”),你花同样的钱,答案却短了、浅了。
结果是什么?华尔街见闻的一份调研数据很说明问题:84%的企业已经报告AI成本对毛利率的侵蚀超出预期,仅15%的企业能把 AI 预算误差控制在10%以内。
所以下次看到“价格又降了”“按量付费真划算”的宣传时,记得多问自己一句:我是在付 Token 的“数量”,还是付 Token 里装的“智力”?
在我看来,这可能是 AI 时代最本质的消费者权益问题。
从数据中心,到“Token 工厂”
理解了 Token 和它的价格,我们再回头看黄仁勋那句看似突兀的断言,就会发现它很好理解:
“数据中心再也不是存放档案的仓库,它是生产 Token 的工厂。”
过去三十年,我们谈数据中心,谈的是“存了多少TB、跑了多少网站、托管了多少企业”。它的核心功能是存储与承载。
而从2026年起,它的核心功能变成了生产——生产的东西就是 Token。这是一种既无形又真实、既虚拟又有单价的“新商品”。
▲ 黄仁勋在 GTC 2026 发布的 Vera Rubin DSX “AI 工厂“参考设计。来源:NVIDIA Newsroom那么,一座“Token 工厂”的产能,由什么决定?
答案朴素得令人吃惊:电。
因为一座1GW(吉瓦)的数据中心,永远不会自动变成2GW——这不是工程问题,是物理问题。电网、土地、变压器、冷却,每一环都在物理世界“卡”着你。
于是,竞争逻辑就变得非常清晰:谁能用同样的一度电,生产出更多、更好、更快的 Token,谁就赢。
这就是“Token 经济学”的核心命题——每瓦 Token 吞吐量(Tokens per Watt),将成为未来数字文明的“GDP”。
未来数据中心之间的竞争,已经不再是“谁的卡多”,而是“谁能用同样的电力,产出更多、更便宜、更高质量的 Token”。
“Token 经济学”为何如此重要?
读到这里,我们可以回答本文最开头那个问题了:为什么一个看起来只有程序员才关心的词,会引起全球科技圈、资本圈、产业界乃至政府的关注?
我想,可能有两个层面的原因。
一、它用一句话重新定义了“AI 生产函数”
经济学上有一个核心概念叫“生产函数”——用什么要素,以什么方式,产出什么商品。
工业时代:煤+钢+机械→商品;
互联网时代:服务器+带宽+代码→信息服务;
AI 时代,黄仁勋给了我们新答案:电×芯片×模型→ Token。
一旦产出被标准化为 Token,一切上游要素——电、土地、芯片、算法、数据、人才——都将按照“单位 Token 成本(cost per token)”被重新估值。这是一场对整个数字经济成本结构的“重写”。
也许,从这个角度,大家可以理解过去这两、三年中,资本市场上一些现象背后的深层原因。
▲ 源杰科技和“易中天”等企业的主要产品,就是“Token 工厂”中的光电转换模块二、它把整个社会拉入一张“Token 协作网”
你可能以为 Token 只是科技行业的事,但实际上,今天无论你是什么职业,都已经不知不觉被卷入这张“Token 协作网”:
能源工程师在建风电、光伏、核电,是在喂饱 Token 工厂;
芯片设计师在调教晶体管,是让每瓦多产出一个 Token;
模型研究员在优化算法,是把 Token 的“智力密度“调到最高;
内容创作者在生产优质文本,是给 Token 的产出提供更好的原材料;
你、我在用 DeepSeek、豆包,则是在消费 Token,把它转化为答案、代码、方案、决策。
从某种意义上,Token 是 AI 时代人类协作的“最小公约数”。它让物理世界的电、硅、水、风,与精神世界的语言、思想、知识、决策,第一次通过同一个量纲被连在了一起。

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
这也是为什么我认为,“Token 经济学”虽然由黄仁勋提出,却远不止是一次商业策略或者科技变革——它是新一轮社会协作范式的浮出水面。
关于“Token 出海“——一个审慎的命题
与此同时,一个更浪漫的词也在产业界、资本市场大火——“Token 出海”。
它的叙事逻辑极具魅力:既然中国的风电、光伏、水电拥有全世界最低的度电成本,那为什么不把它们“封装“成 Token——让海外开发者通过 API 调用中国的大模型,让电力不出境,但价值出境?
过去我们出口衬衫、家电、手机、汽车,都是实物;如今“Token 出海”,意味着中国出口的是一种数字化、虚拟化、绿色化的 AI 服务。
券商研报甚至给出了“中国 AI 算力正在成为下一个千亿美元级出口品类“的判断。
我理解这种兴奋。但我对这个命题持相对审慎的态度——不是否定其价值,而是要看清几个容易被忽视的硬约束。
今年3月,新华社专访了中国信通院人工智能研究所国际发展部主任许珊。她的观点非常克制,也非常值得细读:
“实际上,OpenRouter 上显示的中国大模型服务提供方,其数据中心实体多部署在海外,海外开发者实际使用的是部署在海外云平台上的大模型服务。这意味着这些调用并未回流国内数据中心,所谓的 'Token 出海' 在物理意义上还未实现,本质仍是 '模型出海'。”
——许珊,中国信通院,来源:https://www.news.cn/tech/20260331/fdd3e6c27ded4486b976131c53f14d9a/c.html
换句话说,那个让我们热血沸腾的 “Token 调用占全球61%”数字,来自海外平台 OpenRouter——而这个平台本身全球占比只有约2%,且调用的是已部署在海外的中国模型。真正意义上“电力从中国出去”,并没有发生。
假设我们把海外用户的请求实实在在地传回国内,由国内芯片推理、国内电网供电,再把结果回传——这种“境内处理、结果回传”模式,理论上才能实现真正意义的“电力出海”。
但现实是三道几乎不可逾越的墙:
1、国内层面:中国对数据出境有严格管理要求,重要数据需经过安全评估方可出境(Token 本质上也是一种数据);
2、海外层面:欧盟《GDPR》对违规处罚最高可达公司全球营业额的4%;美国通过多种法案实施长臂管辖;东盟内部,印尼、越南筑起“数据主权高墙”,要求本地数据本地存储;
3、时延层面:大模型推理对时延极为敏感,即便法规允许,跨海缆的往返也很难满足一些智能体场景下的“秒级交互”要求。
三道墙合在一起,几乎把真正意义上的“Token 出海”封得严严实实。
云厂商、运营商即便拼命投资海外数据中心,也不得不把数据“落地存在当地”;真正“中国电力→海外用户”的闭环,在合规、技术、地缘政治层面,都还没有一个清晰可行的路径。
许珊在采访中还有一句话,我深以为然:
“调用模型所产生的 Token 成本,不仅包含算力与电力消耗,还包含模型厂商的研发摊销……中国 Token 定价之所以较低,在相当程度上得益于国内较完善的创新生态与较强的工程化能力所转化而来的综合成本优势,这才是竞争力的根本。”
换句话说,真正的护城河不是便宜的电,而是“便宜的创新”。如果仅靠电价撑起的价格优势,一旦中东、东南亚的绿电项目批量落地,这种优势会在三、五年内被迅速追平。
所以我的观点是:“Token 出海”作为一种想象力、一种叙事、一种愿景,是有价值的;它帮我们看清了算力作为新型生产要素的国际维度。
但如果把它当作一个马上就能落地的商业故事去操作,甚至作为政策推动的主线——我们就需要清醒一点。
真正值得投入的,不是“把 Token 卖出去”,而是像许珊所说——从“能力输出“走向“生态扎根”:建立海外开发者社区、深入理解各国 AI 治理框架、推动模型在各国价值观上的精准对齐、构建“软硬一体化“的长链路方案。
这条路更长、更慢,却也更真。

“Token 经济学”给我们的四点启示
最后,我想从社会和经济的视角,分享我认为“Token经济学”给我们带来的启示。
启示一:Token 正在成为“新的度量衡”
秦始皇统一度量衡,使粮食、布匹、土地可以被标准化地交易;工业革命统一了“马力“与“度电“;互联网时代我们有了“流量”。
今天,Token 将成为数字文明的新度量衡——它使“智力”第一次可被以统一单位计价、计税、计值。
以后每一个知识工作者的贡献,也许都可以反向折算为“多少个 Token 的智力密度”。这对教育、科研、法律、创意产业的意义,也许,不亚于“度量衡统一”之于古代商业。
启示二:能源、芯片、模型,被同一个函数绑定
从今天起,“能源政策”“半导体政策”和“AI 政策”将很难分开——它们都归结到同一个生产函数的同一个产物——Token。
“东数西算”“新型电力系统”“昇腾生态”“大模型备案”这些政策术语,实际上都在 Token 经济学这张全局图上分别扮演角色。
未来的监管、产业政策、税收体系,可能都需要围绕 “Token 产销平衡”来重新搭建。
启示三:个人算力成本,将成为每个知识工作者的新“房租”
黄仁勋在 GTC 2026 上还抛出了一个颇具反常识的预测:未来每一名工程师,将拥有约相当于其年薪一半的 Token 配额。
把这个趋势推广开来:未来每一个律师、会计师、分析师、设计师、编辑,也许都会有自己的 Token 预算。就像今天我们交房租、交电费那样自然——你每月要“喂饱”你的 AI 搭档。
这是一种全新的“数字生计”,也会是一种全新的“数字贫富差距”:有人月 Token 消费几十上百,有人月 Token 消费几千上万。
启示四:Token 时代,普通人最该抓住的东西
如果让我给本文的读者一条最务实的建议,我会说:不要只关注“Token 多少钱”,要关注“你让 Token 为你做了什么”。
一个退休的奥地利程序员,用一台电脑、一个周末,借助大模型的 Token,构建了 GitHub 历史上增长最快的项目之一——OpenClaw,造成了年初席卷全球的“龙虾“现象。
在 Token 经济学时代,个人创造力与个人生产力的放大倍数,史无前例。我们每个人,今天都拥有了一个人类有史以来最为强大,可能也最为陌生的“智力武器”。
差距不在于你会不会编程,而在于你会不会“用 Token”。Token 就是新的电力、新的马力、新的知识原料。善用它的人,将在下一个十年获得复利般的增长。今天,我们在 AI 短剧、AI漫剧和自媒体等领域已经看到了很多这样的例子。
科技进步推动生产关系的演进
所谓“Token 工厂经济学”,说到底不是在发明一个新黑话,而是在提醒我们:AI 正在从“好玩的软件”,变成可计量、可结算、可压成本、可放大产出的新型基础设施。
过去二十多年,全球最有野心的技术叙事是“流量为王”——谁掌握了连接,谁就能定义商业。
而从 2026 年开始,整个叙事正在被悄悄改写为 “Token 为王”——谁能以最低的成本、最快的速度、最高的质量,生产与流转 Token,谁就能定义下一代文明。
这是一场比“流量经济”深得多的变革。因为流量承载的是“信息”,而 Token 承载的是 “思想”。
当思想可以被工业化生产、被货币化定价、被全球化交付时,人类社会的经济关系、劳动分工、治理框架,乃至对“知识”的敬畏方式,可能都将重新塑造。
对企业来说,未来拼的未必只是有没有模型,而是有没有能力把电力、算力、数据、流程和组织,转化为更低成本的 Token 产出;
对个人来说,未来拉开差距的,也未必只是会不会写提示词,而是能不能把 Token 真正变成判断、方案、代码和行动;
对国家来说,真正决定未来竞争力的,不是 Token 卖得有多便宜,而是有没有构建起“能源—芯片—模型—应用—生态”的全链条韧性。
过去互联网按流量收费,今天 AI 按 Token 计价。单位变了,背后的生产关系也在变。
黄仁勋看到了 Token 工厂的经济学,云厂商看到了 Token 经营的战略,普通人看到了 Token 消费的未来。我们应当看到的,是一场围绕 Token 展开的、史无前例的社会协作网络的浮现。
它的下一幕,注定会跟电力、地缘政治、数据主权、国际贸易、教育与就业交织在一起,上演更加跌宕起伏的剧情。
让我们带着好奇与冷静,一起看下去。
END* 所刊专家文章并不代表本中心观点。
* 部分图片来源于网络,如有侵权,请联系我们删除。
【欢迎转载】

请注明“来源:数字社会发展与研究”。
数字社会发展研究中心
元股证券:ygzq.hk专注于数字技术发展及相应经济、社会、人文领域的新现象,新问题的公共性观察和研究。

海量资讯、精准解读,尽在新浪财经APP
元股在线|专业配资炒股门户领军品牌提示:本文来自互联网,不代表本网站观点。