简体 | 繁体
loading...
新闻频道
  • 首页
  • 新闻
  • 读图
  • 财经
  • 教育
  • 家居
  • 健康
  • 美食
  • 时尚
  • 旅游
  • 影视
  • 博客
  • 群吧
  • 论坛
  • 电台
  • 焦点新闻
  • 图片新闻
  • 视频新闻
  • 生活百态
  • 娱乐新闻
您的位置: 文学城 » 新闻 » 焦点新闻 » 我,怕断电断网,更怕断Token

我,怕断电断网,更怕断Token

文章来源: AI未来指北 于 2026-04-03 22:59:08 - 新闻取自各大新闻媒体,新闻内容并不代表本网立场!
被阅读次数

“哥我求你了……就一点点就行,我快不行了,我就写一个因数的量……”

刚刚过去的3月,视频号上一条短视频在程序员圈子爆火,一个白发“程序员老头”对着另一个苦苦哀求,要的不是钱,是Token。3.7万点赞,10万转发。视频的主角是AI制作的,内容是虚构的,但是对token的成瘾反馈,是真的引起了情绪共鸣。

就在同一个月,这条视频爆火前,大洋彼岸曾经上演了一场全球性服务中断。Anthropic的Claude全球宕机,Claude Code彻底瘫痪,几小时内Downdetector涌入超过5000条故障报告。外媒的文章标题是“开发者面对不得不亲自写代码的恐怖”。

一位Meta高级工程师Gauresh Pandit说,Claude挂掉后他直接去干别的了,因为手动写代码“可能更慢”。他说大模型已经变成一种“单按钮操作”,哪怕最简单的事也会习惯性交给它。社交媒体上有人说:“Claude宕机才让我意识到,我已经把半个大脑外包了。”

视频里的老头求的不是随便什么Token,他要的是目前最贵的模型。伙伴递过来的平替,他看都懒得看。这些细节才是整件事最值得深思的地方:程序员不只是对AI上瘾,是对高端Token上瘾。痛苦不来自于“没有AI可用”,而是来自于“没有那个AI可用”。

该图片疑似AI生成

我,怕断电断网,更怕断Token

01 30%的人拿钱都不愿意戒断AI

METR是一家专注于AI能力评估的非营利机构。2026年2月,他们发布了一份令人意外的声明:实验做不下去了。

不是因为缺钱,也不是因为方法论有问题。而是越来越多的开发者拒绝参加,原因仅仅是实验要求一半的任务不能使用AI。据METR披露,30%到50%的受邀开发者因为这个条件直接退出,即便报酬是每小时50美元。这些开发者中的很多人,经验丰富、项目资深,恰恰是最能说明问题的样本。

他们再也不愿意手写代码了。

这组数据比任何生产力统计都更能说明问题。McKinsey在2026年2月发布的调查说AI编程工具让常规编码任务快了46%。Stack Overflow的年度调查说84%的开发者在用AI。在这些数字描述的广度之外,METR的发现描述了另外一个维度,AI已经嵌入了人的认知习惯,拔出来会痛。

02 一杯咖啡和一辆保时捷

到这里,“大模型是类似于电力一样的基础设施”这个提出了近10年,流行了超过三年的说法,需要被认真质疑了。

Andrew Ng在2017年提出这个说法时,强调的是AI像电力一样将渗透到每个行业。这一点他是对的。但比喻的另一半,“电是无差别的标准化商品”,完全不适用于大模型。220伏交流电就是220伏交流电,不管它来自风力发电还是火力发电。你不会因为用了“更好的电”而烤出更好的面包。

Token不是这样。以下是截至2026年3月,各主流厂商大模型API每百万Token的官方定价:



这张表可以清晰看出不同模型价格的差距。

GPT-5.4是OpenAI截至3月的最新旗舰,输入价$2.50;Opus 4.6在多项评测上表现优于GPT-5.4,输入价却是$5.00,贵了一倍。而DeepSeekV3.2输入价仅$0.28,不到Opus 4.6的十八分之一,但在许多通用任务中表现可用。同一个月在售的模型之间,定价可以差两个数量级。

缓存机制又在实际成本上撕开了另一层差异。DeepSeek V3.2的缓存命中价$0.028,不到三分钱处理一百万Token。Opus 4.6的缓存命中价也从$5.00降到$0.50,打了一折。GPT-5.4 nano的缓存价$0.02甚至比DeepSeek更低。在高重复率的生产场景中,实际成本可以比标价再低一个数量级。Token的“挂牌价”和“成交价”之间,又藏着一层巨大的差异。

这不是电力市场的价格结构。电的价格反映发输配的物理成本,与电本身的“质量”无关。Token的价格反映的是智能的种类和等级,推理深度、上下文理解、代理执行能力、可靠性,而这些维度之间无法简单排序。

03 大模型的微笑曲线

企业已经用脚投票了。据AI基础设施研究机构Iternal的分析,成熟的企业级AI部署正在采用“智能路由”架构:70%的简单查询扔给性价比模型,20%给中端模型,只有10%的最棘手、最高风险的任务,才会调用顶级模型。

从宏观来看,Token市场正在形成一条微笑曲线:左端是极致效率,右端是极致智能。

左端是一种新的工业逻辑:当Token足够便宜,它就可以像水电一样大规模灌入自动化流水线的原料。批量数据清洗、日志分类、工单路由、内容审核、表单提取,这些任务不需要模型“极致聪明”,需要的是又快又便宜又稳定。

谁能把每百万Token的成本压到最低,同时保持足够的准确率,谁就能拿下这个市场。这一端的竞争壁垒是推理基础设施的效率,算子优化、芯片利用率、缓存命中率、调度策略。

右端的游戏规则完全不同。Opus 4.6定价$5/$25,它们卖的是一种不可替代的认知能力。右端的壁垒是绝对的智能质量,推理深度、指令遵循的精确度、在复杂约束下保持逻辑一致性的能力。

这是旗舰模型在争夺的领地。但是,一切都不是一成不变的。

一位大模型行业的从业者透露:“我们定价的时候,核心第一原则还是自己的成本,不能亏钱。”

当被问及“如果还有价格战怎么办?”,回答是:“目前大模型行业还没发生过恶性的价格战。所谓的价格屠夫,也是基于他们自己的成本价格。所以必须通过技术创新把成本打下去。”

“成本打下去之后,价格不一定变,但是竞争就有优势了。”

会担心Deepseek V4一旦发布,又会成为“价格屠夫”吗?“担心,但是到现在还没发布,很可能是模型能力不及预期的。”

这是一个变化极快的行业,“人间才一日,AI已千年”。担心如影随形。

站在微笑曲线另外一端的Claude,是否就可以高枕无忧地走高端智能的爱马仕路线了?“竞争对手会努力把它的价格打下来的。”一位从业者说。

微笑曲线两端的商业定律不会变,但是大模型公司的站位会随时变。

这也造成了,大模型公司之间的商业价值也会拉开较大差距。

一位二级市场的分析师说:“我们目前看大模型公司第一位还是看人才密度和技术能力。因为你看不清楚终局,最后对这个人类社会的影响你也看不清楚。但是从产业上来看,它的确是在不断的往前推进的,所以我觉得人才和技术是最核心的一个要素。然后才是商业化数据。”

微笑曲线的左端,是大规模的工业级生产需求。右端,是靠模型的智能能力获得的溢价能力。更需要引起关注的是,能够溢价的背后,是用户的粘性和依赖性。

04 外脑一旦插上,就拔不掉了

回到那个宕机的3月。一家英国基础设施服务商Deployflow做了一笔简单的账:25人的工程团队,4小时的AI中断,直接损失超过9000英镑,还没算下游的项目延期。

但经济损失不是最让人不安的部分。最让人不安的是,开发者在宕机结束后表现出的反应不是愤怒,而是如释重负,一种人类不想承认的依赖感。

这种依赖正在从程序员扩散到所有知识工作者。Claude在宕机前几天刚刚超越ChatGPT,成为美国App Store下载量最大的免费应用。

大模型的订阅套餐一般都有Token使用限额,“对话到一半,限额到了,也无法迁移,只能继续充钱。”一位大模型的深度使用者说。

它的用户不只是写代码的人,还有写报告的人、做研究的人、改合同的人、带团队的人。AI不再是像电那样驱动机器的基础设施,而是直接参与思考的“智能”。

在这个时代,我们害怕断电、断网,也害怕“断token”。

智能的成瘾已经蔓延。更大的噩梦还在于,我的“小龙虾”记忆突然清零,或者龙虾团队领袖的大脑,突然宕机。

用户持续为他所依赖的外脑持续付出成本,也将是大模型公司最深的商业护城河。

  • 北美最大中英文保健网“母亲节特大酬宾”!美国专利[骨精华][心血通][益脑灵]健骨強心护脑,用过的都说好!
查看评论(0)
  • 文学城简介
  • 广告服务
  • 联系我们
  • 招聘信息
  • 注册笔名
  • 申请版主
  • 收藏文学城

WENXUECITY.COM does not represent or guarantee the truthfulness, accuracy, or reliability of any of communications posted by other users.

Copyright ©1998-2026 wenxuecity.com All rights reserved. Privacy Statement & Terms of Use & User Privacy Protection Policy

24小时热点排行

华人父女家中身亡 剑桥博士女儿去世时仅重24公斤
疑似美军机搜救跳伞飞行员画面曝光 营救或已失败
美军“黑鹰”直升机搜救时疑被击中 另一战机坠毁
县委书记爆红 6秒闭幕发言只为让孩子早点休息
06年“张雪追车”当事记者易军:每次回看视频会哭




24小时讨论排行

耗光国库?特朗普政府寻求明年国防开支11万亿
伊朗开始招募12岁儿童“保卫家园”,手持武器巡逻
油价上涨 民众叫苦 美议员:可以再找一份工作
俄罗斯发动大规模袭击,并提出“停止热战”条件
半个娱乐圈都在为它道歉,谁该负责?
英国绕开美国和40多国讨论开放霍尔木兹海峡,可行吗?
为什么中国人比俄国人更怀念苏联?
最新快讯!敏昂莱高票当选缅甸新任总统
小米发布新SU7,逼急特斯拉?
金正恩与女儿视察宠物商店等,与猫狗现场互动
模拟夺岛作战,五角大楼发布美军两栖突击训练照片
重庆“没给一个子儿”,为何诞生了创业天才张雪?
赫格塞斯撤换陆军参谋长,开始新一轮军方高层清洗
被“养废”的985山东姑娘,不想上桌
人类重返月球,大家关心的却是一个坏掉的马桶
俄罗斯面临人口危机 怀孕女学生也能拿10万补贴
文学城新闻
切换到网页版

我,怕断电断网,更怕断Token

AI未来指北 2026-04-03 22:59:08

“哥我求你了……就一点点就行,我快不行了,我就写一个因数的量……”

刚刚过去的3月,视频号上一条短视频在程序员圈子爆火,一个白发“程序员老头”对着另一个苦苦哀求,要的不是钱,是Token。3.7万点赞,10万转发。视频的主角是AI制作的,内容是虚构的,但是对token的成瘾反馈,是真的引起了情绪共鸣。

就在同一个月,这条视频爆火前,大洋彼岸曾经上演了一场全球性服务中断。Anthropic的Claude全球宕机,Claude Code彻底瘫痪,几小时内Downdetector涌入超过5000条故障报告。外媒的文章标题是“开发者面对不得不亲自写代码的恐怖”。

一位Meta高级工程师Gauresh Pandit说,Claude挂掉后他直接去干别的了,因为手动写代码“可能更慢”。他说大模型已经变成一种“单按钮操作”,哪怕最简单的事也会习惯性交给它。社交媒体上有人说:“Claude宕机才让我意识到,我已经把半个大脑外包了。”

视频里的老头求的不是随便什么Token,他要的是目前最贵的模型。伙伴递过来的平替,他看都懒得看。这些细节才是整件事最值得深思的地方:程序员不只是对AI上瘾,是对高端Token上瘾。痛苦不来自于“没有AI可用”,而是来自于“没有那个AI可用”。

该图片疑似AI生成

我,怕断电断网,更怕断Token

01 30%的人拿钱都不愿意戒断AI

METR是一家专注于AI能力评估的非营利机构。2026年2月,他们发布了一份令人意外的声明:实验做不下去了。

不是因为缺钱,也不是因为方法论有问题。而是越来越多的开发者拒绝参加,原因仅仅是实验要求一半的任务不能使用AI。据METR披露,30%到50%的受邀开发者因为这个条件直接退出,即便报酬是每小时50美元。这些开发者中的很多人,经验丰富、项目资深,恰恰是最能说明问题的样本。

他们再也不愿意手写代码了。

这组数据比任何生产力统计都更能说明问题。McKinsey在2026年2月发布的调查说AI编程工具让常规编码任务快了46%。Stack Overflow的年度调查说84%的开发者在用AI。在这些数字描述的广度之外,METR的发现描述了另外一个维度,AI已经嵌入了人的认知习惯,拔出来会痛。

02 一杯咖啡和一辆保时捷

到这里,“大模型是类似于电力一样的基础设施”这个提出了近10年,流行了超过三年的说法,需要被认真质疑了。

Andrew Ng在2017年提出这个说法时,强调的是AI像电力一样将渗透到每个行业。这一点他是对的。但比喻的另一半,“电是无差别的标准化商品”,完全不适用于大模型。220伏交流电就是220伏交流电,不管它来自风力发电还是火力发电。你不会因为用了“更好的电”而烤出更好的面包。

Token不是这样。以下是截至2026年3月,各主流厂商大模型API每百万Token的官方定价:



这张表可以清晰看出不同模型价格的差距。

GPT-5.4是OpenAI截至3月的最新旗舰,输入价$2.50;Opus 4.6在多项评测上表现优于GPT-5.4,输入价却是$5.00,贵了一倍。而DeepSeekV3.2输入价仅$0.28,不到Opus 4.6的十八分之一,但在许多通用任务中表现可用。同一个月在售的模型之间,定价可以差两个数量级。

缓存机制又在实际成本上撕开了另一层差异。DeepSeek V3.2的缓存命中价$0.028,不到三分钱处理一百万Token。Opus 4.6的缓存命中价也从$5.00降到$0.50,打了一折。GPT-5.4 nano的缓存价$0.02甚至比DeepSeek更低。在高重复率的生产场景中,实际成本可以比标价再低一个数量级。Token的“挂牌价”和“成交价”之间,又藏着一层巨大的差异。

这不是电力市场的价格结构。电的价格反映发输配的物理成本,与电本身的“质量”无关。Token的价格反映的是智能的种类和等级,推理深度、上下文理解、代理执行能力、可靠性,而这些维度之间无法简单排序。

03 大模型的微笑曲线

企业已经用脚投票了。据AI基础设施研究机构Iternal的分析,成熟的企业级AI部署正在采用“智能路由”架构:70%的简单查询扔给性价比模型,20%给中端模型,只有10%的最棘手、最高风险的任务,才会调用顶级模型。

从宏观来看,Token市场正在形成一条微笑曲线:左端是极致效率,右端是极致智能。

左端是一种新的工业逻辑:当Token足够便宜,它就可以像水电一样大规模灌入自动化流水线的原料。批量数据清洗、日志分类、工单路由、内容审核、表单提取,这些任务不需要模型“极致聪明”,需要的是又快又便宜又稳定。

谁能把每百万Token的成本压到最低,同时保持足够的准确率,谁就能拿下这个市场。这一端的竞争壁垒是推理基础设施的效率,算子优化、芯片利用率、缓存命中率、调度策略。

右端的游戏规则完全不同。Opus 4.6定价$5/$25,它们卖的是一种不可替代的认知能力。右端的壁垒是绝对的智能质量,推理深度、指令遵循的精确度、在复杂约束下保持逻辑一致性的能力。

这是旗舰模型在争夺的领地。但是,一切都不是一成不变的。

一位大模型行业的从业者透露:“我们定价的时候,核心第一原则还是自己的成本,不能亏钱。”

当被问及“如果还有价格战怎么办?”,回答是:“目前大模型行业还没发生过恶性的价格战。所谓的价格屠夫,也是基于他们自己的成本价格。所以必须通过技术创新把成本打下去。”

“成本打下去之后,价格不一定变,但是竞争就有优势了。”

会担心Deepseek V4一旦发布,又会成为“价格屠夫”吗?“担心,但是到现在还没发布,很可能是模型能力不及预期的。”

这是一个变化极快的行业,“人间才一日,AI已千年”。担心如影随形。

站在微笑曲线另外一端的Claude,是否就可以高枕无忧地走高端智能的爱马仕路线了?“竞争对手会努力把它的价格打下来的。”一位从业者说。

微笑曲线两端的商业定律不会变,但是大模型公司的站位会随时变。

这也造成了,大模型公司之间的商业价值也会拉开较大差距。

一位二级市场的分析师说:“我们目前看大模型公司第一位还是看人才密度和技术能力。因为你看不清楚终局,最后对这个人类社会的影响你也看不清楚。但是从产业上来看,它的确是在不断的往前推进的,所以我觉得人才和技术是最核心的一个要素。然后才是商业化数据。”

微笑曲线的左端,是大规模的工业级生产需求。右端,是靠模型的智能能力获得的溢价能力。更需要引起关注的是,能够溢价的背后,是用户的粘性和依赖性。

04 外脑一旦插上,就拔不掉了

回到那个宕机的3月。一家英国基础设施服务商Deployflow做了一笔简单的账:25人的工程团队,4小时的AI中断,直接损失超过9000英镑,还没算下游的项目延期。

但经济损失不是最让人不安的部分。最让人不安的是,开发者在宕机结束后表现出的反应不是愤怒,而是如释重负,一种人类不想承认的依赖感。

这种依赖正在从程序员扩散到所有知识工作者。Claude在宕机前几天刚刚超越ChatGPT,成为美国App Store下载量最大的免费应用。

大模型的订阅套餐一般都有Token使用限额,“对话到一半,限额到了,也无法迁移,只能继续充钱。”一位大模型的深度使用者说。

它的用户不只是写代码的人,还有写报告的人、做研究的人、改合同的人、带团队的人。AI不再是像电那样驱动机器的基础设施,而是直接参与思考的“智能”。

在这个时代,我们害怕断电、断网,也害怕“断token”。

智能的成瘾已经蔓延。更大的噩梦还在于,我的“小龙虾”记忆突然清零,或者龙虾团队领袖的大脑,突然宕机。

用户持续为他所依赖的外脑持续付出成本,也将是大模型公司最深的商业护城河。