人工智能的真正变革不在于编码,而在于我们的思维方式
前几天应了一位大学同学的邀请。
和他的CS学生们聊AI。
所以原稿是英文,中文是google翻译的。我大致看了一下,改了几个错误。如果还有不通的地方,请包涵。
聊了将近两个小时,有点长。
先贴中文。
现在,让我们都伸出三根手指……在脸前挥动……然后向大家问好。
张教授,别担心——我没疯……至少现在还没。
但我为什么要你这样做呢?
前几天,我的一位同事跟我讲了他偶然看到的一个视频。视频里的人做了各种各样的事情——但有一件事他们就是不做。
他们不会在脸上挥舞三根手指。
原来……这是一段人工智能生成的视频。
这其实是识别深度伪造技术的常用技巧。
但是——不要过于自信地认为你已经找到了可靠的测试方法。
因为人工智能领域变化非常迅速。
就在上周五,我参加了在麻省理工学院举办的人工智能峰会。
其中一位小组成员,一位教授,正在解释人脑的工作原理。他说:“人类可以将我们学到的知识转化为图表。人工智能做不到这一点。”
主持人打断了他,说道:
“不,教授——那都是老新闻了。人工智能现在就能做到。”
教授很惊讶,问道:“从什么时候开始的?”
主持人说:“大约两周前。”
我和张教授大学时一起学计算机科学。那时候,我们人工智能课上用的语言是LISP。你可能从来没听说过——没关系。它现在已经不太常用了。
如今……人工智能会说英语。
大学毕业后,我在一家纺织公司负责维护库存系统。我的家乡在台湾中部,那里的夏季气温经常达到90到100华氏度(约32到38摄氏度)。
我在公司里有很多朋友……因为我的办公室里有大型机机房——而且是唯一有空调的房间。
大型机,运行 COBOL。
大约一年后,我离开了,来到了波士顿。
研究生毕业后,我留在波士顿,从此一直从事编程工作。我的第一份工作是初级程序员,主要使用 C++ 编程。
然后Java出现了。
正如你可能知道的那样——软件工程师往往……观点强烈。
当时,至少在我所在的圈子里,我们都相信 C++。
Java?那是给那些不会管理内存的人用的。
当然……这花了几年时间,但Java最终占据了主导地位。
我从事这个领域几十年了,见证了很多“最佳实践”的兴衰更替。
人们通常需要数年时间才能接受新事物。部分原因是惯性——我们习惯了现状。一旦我们认为某种方法有效,就很难改变。
但有趣的是:
那周期越来越短。
以人工智能为例。
ChatGPT 于 2022 年 11 月 30 日发布——短短几天内,就有数百万人开始使用它。
说实话,当时我并没有太在意。
对我来说,它感觉就像……一个崭新的玩具。
直到 2025 年下半年,我才真正开始尝试使用 Cursor、Copilot 和用于编写测试的代理等工具。
说实话?感觉……还行。
但随后情况发生了变化——而且变化非常快。
自 2026 年 1 月以来,尤其是在达沃斯(世界经济论坛)之后,感觉一夜之间每个人都开始谈论 Anthropic。
我们从3月10日开始使用Claude Code。
我清楚地记得那个日期。
氛围编码
那天我开始用氛围编码。
换句话说,我开始花更多的时间认真思考我的提示——准确地描述我想要什么,它应该如何运行,以及输出应该是什么样子。
还有件趣事:
当 Claude 处理您的提示时……需要花费一定的费用。代币。
到三月底,我每天都会查看我的代币使用情况。
如果你不熟悉代币——这有点像游乐园。
你用代币……去玩游乐设施。
说实话?感觉就是这样。
我正在花费代币……乘坐克劳德·科德的坐骑。
那么,这在我的日常工作中究竟意味着什么呢?
我们现在使用 Claude 等工具来加快工作流程的设计速度。
在人工智能出现之前,当产品经理提出新的功能需求时,我们会围坐在白板旁,将这些需求分解开来。
例如:
“我们希望在用户完成操作 A 后弹出一个对话框来执行操作 X。”
很简单,对吧?但是我们如何告诉机器这样做呢?
我们会将其转化为详细的规格说明:
我们如何检测到动作 A?
对话框出现在哪里?
它是什么尺寸的?
它长什么样?
而那只是很小的一部分。
将产品需求转化为可靠的技术规范需要时间,而且需要团队协作。我们会进行讨论、互相挑战,并努力寻找各种极端情况。
现在?
我们可以同时进行多个项目。
如何?
我们每个人都有一群 Claude 特工居住在我们的 IDE 中。
这个过程本质上其实是一样的——但现在我们这样做。通过代理人(agent)。
是的——我编码多了提示,少了代码。
但这并不意味着我减少了工程方面的工作。
这只是意味着工作的开始方式不同而已。
我没有直接开始编写代码,而是:
描述问题
定义预期行为
解释它在系统中的位置
我和克劳德反复讨论,直到我们达成一个切实可行的计划。
但关键在于:
你不能盲目信任人工智能。
它会把事情搞砸。
理解这一点非常重要——因为它解释了力量的来源,和风险。
生成式人工智能从根本上来说是基于几率。
它不是我们通常意义上的“思考”方式。
它根据从海量数据中学习到的模式来预测下一个词,然后从最有可能出现的词中进行选择。
然后它又重复一遍。
一遍,又一遍。
感觉像是智慧……
实际上,这是一系列非常复杂的猜测。
一个简单的比喻:
它就像你手机的自动补全功能……只不过是加强版。
它不知道答案。
它只是知道最有可能的答案是什么。
而有时候,这样做会出大问题。
你可能听说过……Mata诉Avianca纽约的案例。
对于那些没听说过的人来说,它讲述的是……
一位律师使用 ChatGPT 撰写了一份法律文书——而且它自信地引用了案例。
问题?
这些案例并不存在。
法官判处律师罚款5000美元。
所以教训很简单:
人工智能听起来很有说服力——但你仍然需要验证所有事情。
怎么做?
你要求人工智能逐步解释其推理过程:它是如何得出该结论的,以及它从哪里获得信息来源?
我有一个故事可以很好地说明这一点。
我的一位朋友是法学教授,发表过很多论文。最近,他正在撰写一篇新论文,需要一些例子和案例来佐证他的观点。他使用人工智能模型来辅助搜索,不出所料,人工智能模型自信地找到了一些似乎支持他理论的案例。
但我的朋友是一位经验丰富的学者,他总是会要求提供资料来源。而人工智能再次提供了引用。
他与众不同之处在于:他用另一个人工智能模型对这些引文进行了交叉核对。
而且根本找不到来源。
于是他回到原模型,非常直接地问道:“我无法核实来源。这是你编造的吗?”
人工智能也承认了这一点——而且毫无羞耻之心。
我向你保证,这种情况会一而再再而三地发生。
教训很简单:永远要分析,永远要验证。
所以在我看来,最大的变化是这样的:
我过去常常花时间为机器编写代码…
现在我花在这件事上的时间出乎意料地多向机器解释事物。
这就是 Prompt Engineering 的意义所在。
如果你曾经使用过 ChatGPT,并且想过:
“为什么这个答案这么糟糕?”
再仔细看看你的提示,问问自己:为什么模型不理解我的问题?缺少了什么?我该如何用清晰的方式解释它?
Prompt Engineering的真正意义在于:
我该如何发出指令才能让AI真正按照我的意愿行事?
事实证明,这与编写规范并没有太大区别。
我听说有人开始把这种方法称为规范驱动开发(SDD)。
好的提示需要具备哪些要素?
我发现好的提示通常包含以下要素:
明确的目标
足够的背景信息
限制条件很重要,您不希望代理未经许可删除您的数据。
以及预期的输出格式
如果说有什么东西真正重要——那就是内容。
人工智能只知道你告诉它的内容。
所以,如果你省略某些内容,它会填补空白……有时会非常有创意地填补空白。
所以在实际工作中,我包括:
在哪里寻找现有模式
需要更改哪些文件
以及系统详情
缺乏详细背景信息,人工智能只能靠猜测和臆想来判断。
基本功为何重要
Agentic Coding取决于基本功。
因为你需要:
理解问题
区分好方案和坏方案
发现细微错误
如果你不这样做……人工智能听起来可能很正确——但实际上却完全错误。
所以人工智能并不能取代工程技能。
它提高了标准。
所以最大的变化不仅仅是生产力。
这正是我们对软件开发的理解。在团队中,我们协作,但每个人都负责一部分工作。现在,我把这些工作分配给了不同的agents。
我觉得自己就像一个交响乐团的指挥——我设定方向,agents 则各司其职。
如今免费资源如此之多,几乎什么都能学到。
实际上,我使用 ChatGPT 来帮助规划自己的学习路径,甚至可以跟踪学习进度。
所以,没错——要使用人工智能。
但不要滥用它。
我说的“滥用”是什么意思?
不要只看摘要。
摘要就像快餐。
它们制作快捷,但营养价值不高。
如果你真的想学习:
放慢速度,喝杯咖啡,好好读读书。
我喜欢几个 YouTube 频道:
3Blue1Brown(非常适合学习基础知识)
IBM Technology(更多实用建议)
说到判断,
没有基本功,就无法做出正确的决策。
同样重要的是——你需要知道你不知道。
在人工智能的世界里,一切最终都归结于:
批判性思维
你必须:
怀疑结果
深入分析
持续验证
这不是周末就能学到的东西。
你的毕业证书并不代表学习的结束。
这是终身学习习惯的开始。
我们很幸运——因为已经有很多知识可供利用。
不仅在网络上,而且在书籍中,几十年来……有时甚至几个世纪以来,书籍一直在塑造着人们的思维方式。
如果你不知道从哪里开始,这里有几本书真的改变了我的思维方式。
-丹尼尔·卡尼曼的《思考,快与慢》。
卡尼曼的书能帮助你注意到你的大脑何时处于“滑行”状态……这样你就可以真正慢下来思考。
所以,与其仅仅相信自己的直觉,不如开始问自己:“我真的经过深思熟虑了吗……还是只是在做出反应?”
尤瓦尔·诺亚·赫拉利——《人类简史》和《Nexus》。
在 《人类简史》,
哈拉里的观点是,人类一直以来都依赖于共同的故事。而那些有机会……写这些故事蕴含着巨大的力量。
《人类简史》让你质疑我们所相信的故事。
在 Nexus 中,
哈拉里指出,“更多信息并不意味着更多真相”。
实际情况是,谁控制了信息流,谁就获得了权力。
读完这本书,你会产生疑问是谁在给你讲这些故事?为什么?。
亚当·格兰特的《再想一遍》。
这一篇是关于重新思考的——如何质疑你自己的假设。
如果卡尼曼向你展示了你的思维方式是如何出错的,
格兰特会告诉你该怎么做。
祝您阅读愉快!
【我一般都会交叉检查,然后告诉他错了。他就会很matter of fact地说,是的,就是你说的这样,完全忘了刚才犯过错的事实。还有就是阿谀奉承的手段越来越娴熟】
我们这些“文科生”目前还只是用AI做research多,经常被欺骗。而且都很脸大。我一般都会交叉检查,然后告诉他错了。他就会很matter of fact地说,是的,就是你说的这样,完全忘了刚才犯过错的事实。还有就是阿谀奉承的手段越来越娴熟 :-{