“哥我求你了……就一点点就行，我快不行了，我就写一个因数的量……”

刚刚过去的3月，视频号上一条短视频在程序员圈子爆火，一个白发“程序员老头”对着另一个苦苦哀求，要的不是钱，是Token。3.7万点赞，10万转发。视频的主角是AI制作的，内容是虚构的，但是对token的成瘾反馈，是真的引起了情绪共鸣。

就在同一个月，这条视频爆火前，大洋彼岸曾经上演了一场全球性服务中断。Anthropic的Claude全球宕机，Claude Code彻底瘫痪，几小时内Downdetector涌入超过5000条故障报告。外媒的文章标题是“开发者面对不得不亲自写代码的恐怖”。

一位Meta高级工程师Gauresh Pandit说，Claude挂掉后他直接去干别的了，因为手动写代码“可能更慢”。他说大模型已经变成一种“单按钮操作”，哪怕最简单的事也会习惯性交给它。社交媒体上有人说：“Claude宕机才让我意识到，我已经把半个大脑外包了。”

视频里的老头求的不是随便什么Token，他要的是目前最贵的模型。伙伴递过来的平替，他看都懒得看。这些细节才是整件事最值得深思的地方：程序员不只是对AI上瘾，是对高端Token上瘾。痛苦不来自于“没有AI可用”，而是来自于“没有那个AI可用”。

该图片疑似AI生成

我，怕断电断网，更怕断Token

01 30%的人拿钱都不愿意戒断AI

METR是一家专注于AI能力评估的非营利机构。2026年2月，他们发布了一份令人意外的声明：实验做不下去了。

不是因为缺钱，也不是因为方法论有问题。而是越来越多的开发者拒绝参加，原因仅仅是实验要求一半的任务不能使用AI。据METR披露，30%到50%的受邀开发者因为这个条件直接退出，即便报酬是每小时50美元。这些开发者中的很多人，经验丰富、项目资深，恰恰是最能说明问题的样本。

他们再也不愿意手写代码了。

这组数据比任何生产力统计都更能说明问题。McKinsey在2026年2月发布的调查说AI编程工具让常规编码任务快了46%。Stack Overflow的年度调查说84%的开发者在用AI。在这些数字描述的广度之外，METR的发现描述了另外一个维度，AI已经嵌入了人的认知习惯，拔出来会痛。

02 一杯咖啡和一辆保时捷

到这里，“大模型是类似于电力一样的基础设施”这个提出了近10年，流行了超过三年的说法，需要被认真质疑了。

Andrew Ng在2017年提出这个说法时，强调的是AI像电力一样将渗透到每个行业。这一点他是对的。但比喻的另一半，“电是无差别的标准化商品”，完全不适用于大模型。220伏交流电就是220伏交流电，不管它来自风力发电还是火力发电。你不会因为用了“更好的电”而烤出更好的面包。

Token不是这样。以下是截至2026年3月，各主流厂商大模型API每百万Token的官方定价：

这张表可以清晰看出不同模型价格的差距。

GPT-5.4是OpenAI截至3月的最新旗舰，输入价$2.50；Opus 4.6在多项评测上表现优于GPT-5.4，输入价却是$5.00，贵了一倍。而DeepSeekV3.2输入价仅$0.28，不到Opus 4.6的十八分之一，但在许多通用任务中表现可用。同一个月在售的模型之间，定价可以差两个数量级。

缓存机制又在实际成本上撕开了另一层差异。DeepSeek V3.2的缓存命中价$0.028，不到三分钱处理一百万Token。Opus 4.6的缓存命中价也从$5.00降到$0.50，打了一折。GPT-5.4 nano的缓存价$0.02甚至比DeepSeek更低。在高重复率的生产场景中，实际成本可以比标价再低一个数量级。Token的“挂牌价”和“成交价”之间，又藏着一层巨大的差异。

这不是电力市场的价格结构。电的价格反映发输配的物理成本，与电本身的“质量”无关。Token的价格反映的是智能的种类和等级，推理深度、上下文理解、代理执行能力、可靠性，而这些维度之间无法简单排序。

03 大模型的微笑曲线

企业已经用脚投票了。据AI基础设施研究机构Iternal的分析，成熟的企业级AI部署正在采用“智能路由”架构：70%的简单查询扔给性价比模型，20%给中端模型，只有10%的最棘手、最高风险的任务，才会调用顶级模型。

从宏观来看，Token市场正在形成一条微笑曲线：左端是极致效率，右端是极致智能。

左端是一种新的工业逻辑：当Token足够便宜，它就可以像水电一样大规模灌入自动化流水线的原料。批量数据清洗、日志分类、工单路由、内容审核、表单提取，这些任务不需要模型“极致聪明”，需要的是又快又便宜又稳定。

谁能把每百万Token的成本压到最低，同时保持足够的准确率，谁就能拿下这个市场。这一端的竞争壁垒是推理基础设施的效率，算子优化、芯片利用率、缓存命中率、调度策略。

右端的游戏规则完全不同。Opus 4.6定价$5/$25，它们卖的是一种不可替代的认知能力。右端的壁垒是绝对的智能质量，推理深度、指令遵循的精确度、在复杂约束下保持逻辑一致性的能力。

这是旗舰模型在争夺的领地。但是，一切都不是一成不变的。

一位大模型行业的从业者透露：“我们定价的时候，核心第一原则还是自己的成本，不能亏钱。”

当被问及“如果还有价格战怎么办？”，回答是：“目前大模型行业还没发生过恶性的价格战。所谓的价格屠夫，也是基于他们自己的成本价格。所以必须通过技术创新把成本打下去。”

“成本打下去之后，价格不一定变，但是竞争就有优势了。”

会担心Deepseek V4一旦发布，又会成为“价格屠夫”吗？“担心，但是到现在还没发布，很可能是模型能力不及预期的。”

这是一个变化极快的行业，“人间才一日，AI已千年”。担心如影随形。

站在微笑曲线另外一端的Claude，是否就可以高枕无忧地走高端智能的爱马仕路线了？“竞争对手会努力把它的价格打下来的。”一位从业者说。

微笑曲线两端的商业定律不会变，但是大模型公司的站位会随时变。

这也造成了，大模型公司之间的商业价值也会拉开较大差距。

一位二级市场的分析师说：“我们目前看大模型公司第一位还是看人才密度和技术能力。因为你看不清楚终局，最后对这个人类社会的影响你也看不清楚。但是从产业上来看，它的确是在不断的往前推进的，所以我觉得人才和技术是最核心的一个要素。然后才是商业化数据。”

微笑曲线的左端，是大规模的工业级生产需求。右端，是靠模型的智能能力获得的溢价能力。更需要引起关注的是，能够溢价的背后，是用户的粘性和依赖性。

04 外脑一旦插上，就拔不掉了

回到那个宕机的3月。一家英国基础设施服务商Deployflow做了一笔简单的账：25人的工程团队，4小时的AI中断，直接损失超过9000英镑，还没算下游的项目延期。

但经济损失不是最让人不安的部分。最让人不安的是，开发者在宕机结束后表现出的反应不是愤怒，而是如释重负，一种人类不想承认的依赖感。

这种依赖正在从程序员扩散到所有知识工作者。Claude在宕机前几天刚刚超越ChatGPT，成为美国App Store下载量最大的免费应用。

大模型的订阅套餐一般都有Token使用限额，“对话到一半，限额到了，也无法迁移，只能继续充钱。”一位大模型的深度使用者说。

它的用户不只是写代码的人，还有写报告的人、做研究的人、改合同的人、带团队的人。AI不再是像电那样驱动机器的基础设施，而是直接参与思考的“智能”。

在这个时代，我们害怕断电、断网，也害怕“断token”。

智能的成瘾已经蔓延。更大的噩梦还在于，我的“小龙虾”记忆突然清零，或者龙虾团队领袖的大脑，突然宕机。

用户持续为他所依赖的外脑持续付出成本，也将是大模型公司最深的商业护城河。

切换到网页版

我，怕断电断网，更怕断Token

AI未来指北 2026-04-03 22:59:08