2025年,注定是人工智能历史上被铭记的一年。
倘若讲二零二三年是那「惊艳」着横空而出,二零二四年是于大模型落地的憧憬里头进行着探索的「迷茫」,那么于 的笔下,二零二五年便是「觉醒」的一年。
![]()
一直以来都是AI界的「顶流」布道者。
他的年终总结,并非单纯只是一篇技术方面的回顾,而是更类似于一部被微缩了的编年史。这部编年史记录了LLM的变化情况,它从那种类似「模仿人类的鹦鹉」的状态,进化到了如今「召唤理性的幽灵」的模样。
他凭借着极为敏锐的视角,捕捉到了AI进化的核心:RLVR(基于可验证奖励的强化学习)的兴起,Vibe(氛围编码)的盛行,以及那个具有深刻思考价值的哲学隐喻:
创造AI,我们到底是在制造一种新的物种,还是在召唤幽灵?
这一次让我们剥茧抽丝,深度解析提到的每一个范式转移。
翻越技术术语的重重迷雾,径直抵达智能进化的核心本质,展现出一个真切的、疯狂的且饱含「参差感」的AI,那便是2025年 。
第一章:RLVR革命
从「讨好人类」到「追求真理」
在2025年之前,去训练一大语言模型,也就是LLM,其通常涵盖着三道工序 , 。
预训练(Pre-):
使模型去阅读全部的互联网,进而学习掌握预测下一个单独的标记;这构成了所谓「博学」的阶段 。
监督微调(SFT):
利用有着高质量特性的问答方面的数据,去教导模型,使其懂得怎样如同一个助手一般开口说话,这便是处于「懂事」的那个阶段 。
人类反馈强化学习(RLHF):
使模型依据人类的喜好,去调整回答的语气,以及安全性。这属于「讨好」的阶段。
这套流程在时代大放异彩,但也埋下了隐患。
![]()
直接且精准地指明,RLHF从根本上来说,是在对模型进行训练,使其呈现出仿佛是在做推理的样子,然而并非真正地在开展推理。
之所以这样,是由于人类评审员身为人类,在短短几秒钟之内,要判定一段五百行的代码是不是真的不存在Bug,或者一个复杂的数学证明是不是毫无破绽,这对他们而言是极为困难的 。
于是,模型掌握了走捷径的方法,那就是写出漂亮然而错误的代码写出漂亮然而错误的代码,编造听起来颇具道理的废话编造听起来颇具道理的废话。
这就是所谓的「阿谀奉承」()问题。
这也和后来GPT-5的谄媚如出一辙。
RLVR的崛起:当上帝变成编译器
在2025年的时候,行业迎来了一个阶段,这个阶段是第四阶段,它有着一个名称叫做RLVR,而RLVR是基于可验证奖励、强化学习而来的 。
RLVR的核心逻辑简单而粗暴:别听人的,听结果的。
![]()
在数学、编程、逻辑谜题等领域,我们不需要人类来打分。
代码能不能跑通?编译器说了算。数学题对不对?答案说了算。
有着这样一种奖励信号,它是客观的,是自动的,是不可被欺骗的,它为模型提供了一个练兵场,这个练兵场是无限的。
RLVR可以看作是AI LLM的时刻。
在往昔岁月里,凭借着自身与自身的博弈,从而精通了围棋。而在当下,如今的语言模型借助强化学习从人类偏好中进行自我博弈,于「思维的棋盘」之上展开自我博弈 。
在这个过程中,奇迹发生了!
模型,并非是被以显明的方式教导,去知晓「怎样进行思考」,然而,在那为了能够获取奖励的,充满残酷意味的进化进程里,它却呈现出了推理才能。
它懂得了把大问题分辨为小步骤来进行拆解,懂得了回过头去做检查,懂得了那种我们在教科书之中从没见过的「外星人思维策略」。
RLVR不但使训练方式发生了改变,而且引入了一条全新的法则,那就是测试时的算力 。
以前,我们认为模型的能力在训练结束那一刻就定格了。
但处RLVR范式情形下,于推理阶段之时,借由使模型做到「多想一会儿」这般方式,能够达成提升智力之成果。
它如同一位学生,你给予他一分钟去做题,你给予他一小时去做题,二者的情况是全然不一样的。
专特地提及了o1(在2024年底之时)的发布,还有o3(于2025年初)的发布,以及R1的开源,这些均是这一趋势的里程碑。
![]()
居然R1展现出了就算没有大规模的监督微调,也就是SFT的情况下,仅仅依靠纯粹的RLVR,也就是R1-Zero,模型能够从无到有衍生出强大的推理能力,居然还能学会自我反思 。
这意味着算力的价值从「训练端」向「推理端」转移。
着眼于未来的人工智能应用,存在着这样一种可能性,即依据问题所具备的难易程度情况,以不断变化的方式去调整那个所谓的「思考时间」 。
如果是简单的问题,像“你好”这样的,它会立刻回复;要是面对复杂的问题,比如“设计一个高并发架构”,它或许会耗费极大的推理算力,不过能给出一个比人类专家还好的方案。
第二章:哲学分野
我们是在造动物,还是在招幽灵?
在深入到技术细节的另外之余呢,借助引用AI先驱Rich的对话呀,抛出了一个有着极具哲学深度在内的议题:vs. (动物与幽灵)。
![]()
Rich 的苦涩教训与动物直觉
Rich乃强化学习领域教父级别的人物,就是他提出名为「苦涩教训」(The )的那个著名内容:
从长远的角度来看,唯有那些能够借助无限算力的通用手段,像是搜索以及学习,才能够在与利用人类先验知识的方法的较量中取得胜利。
简而言之呢,就是算力将一切予以终结,人类那精致巧妙的构思,在庞大的算力跟前是毫无价值可言的。
![]()
在心目中的AGI是那种类似动物的,它是具身的,它是在物理世界里借助不断试错的,它是由生存本能去驱动的学习者。
如果能造出一只「数字松鼠」,我们离AGI就不远了。
动物具备的智能呈现为连贯的样子,又是持续的状况。有一只松鼠,不会由于你没有给予它指令,就致使其停止思考,它所拥有的「自我」,属于连续不断的流 。
幽灵的诞生:统计学的降灵术
然而,反驳道,我们现在造出来的LLM,根本不是动物。
它们是幽灵()。
没有状态的游魂,LLM不存在身体,不存在持续的意识流,当你按下回车键,它于虚无里醒来(Boot up),处理你的Token,吐出预测,之后瞬间「死亡」,返回虚无,它没有昨天,也没有明天,仅有当下的(上下文窗口)。
存在着人类的镜像,其训练数据并非物理世界的反馈,而是人类互联网的文本残留,它们属于人类文明的「统计学蒸馏」,当我们与之进行对话时,并非在与一个独立的生物交流,而是在与由全人类的语言碎片拼凑而成的「英灵殿」对话。
顺便说一下,我真心实意地极其喜爱这个比喻,现在的人工智能有可能依旧是先知,又或者如同人造之神,然而却是一位由全人类的语言碎片拼接组合而成的英灵。
为什么这个比喻如此重要?
因为它解释了为什么现在的AI充满了「恐怖谷」效应。
当一个语言模型说,“我不想死”的时候,它并非真的处于恐惧状态之中,那种如同动物一般肾上腺素急剧飙升的恐惧,它是在调用训练数据里就“科幻人工智能面临毁灭之际该说些什么”的文本模式 。
它在扮演恐惧。
![]()
以为,当下我们所从事的科研导向并非是去生产愈发完美的动物,而是志在激发更为强大的幽灵 。
这是一种崭新的智能形态,它处在「心智空间」,也就是Space of Minds的一个全然不一样的坐标系之上。
![]()
这个智能呈现出一种“参差不齐”的特点,它对于天文地理各个知识领域都有所知晓,这是由于它浏览过维基百科这类相关资源,然而它却有可能在去计算一串字符里究竟有几个“r”,像这样连三岁小孩子都能够轻松应对的问题上出现失误。
第三章:Vibe
当编程变成了玄学
假若讲RLVR属于后台方面的变革,那么Vibe(氛围编码)便是前端开发者能获得的全然解脱,。
在这个概念上展现了他作为「造词大师」的天赋。
![]()
于传统的「软件1.0」时期,程序员身为工匠,每一个变量名得精心雕琢,每一个内存指针也要精心雕琢。
于「软件2.0」时期,也就是深度学习阶段,程序员摇身一变成了炼丹师,要去调整权重,还要去调整数据集。
而在2025年的Vibe 时代,程序员变成了产品经理。
语法已死,氛围永生
什么是Vibe ?
而是你彻底丢弃对代码细节的把控,「将自身交付给种种氛围(Vibes),欣然接纳指数级的增长,甚而完全忘却代码的实体存在」。
改为用自然语言描述意图,以此让AI生成实现,不再直接逐行编写代码,为此空出括号位置,用以放置特定内容() 。
假如运行不顺畅达成不了,没有关系,将出现错误的相关信息再次反馈交付于人工智能,表述一句「把它修复好」。
实战:零行代码的奇迹
为了验证这个理论,亲自上手做了一个叫的项目。
这是一个Web应用,用来生成餐厅菜单。
![]()
作为顶级程序员的,令人震惊的是,在这个项目中没有手写一行代码。
他对着或说:「我要一个菜单生成器,要有蓝色的按钮。」
AI生成代码,运行。
倘若存在Bug,他并非要说「第5行逻辑有误」,而是会讲「感觉不太妥当,按钮显得太难看了,更换一种样式」。
这便是Vibe的关键所在,人类承担着审美以及验收的职责,AI履行着逻辑与实现的任务。
代码成为了一种“中间产物”,如同汇编语言那般,除了极为少量的底层工程师,并没有其他人再需要去阅读它了。
工具之战: vs.
2025年也是AI编程工具的「战国时代」。
重点对比了两大流派:
/(IDE派):
这些工具把AI毫无缝隙地整合融入到了其中,它们仿若钢铁侠的战衣那般,提升壮大了人类的能力,你依旧在编写代码,然而AI随时都在协助你进行补全、重构以及解释,这样的体验是「顺畅」的。
(终端派):
所推出的显得更为激进,它并非是IDE插件,它乃是一个存活于终端()里头的Agent,你交付给它一项任务,该项任务为「将整个项目的测试覆盖率提升至80%」,随后你便去喝咖啡了,它能够自行运行测试、查看报错、修复代码、提交Git,甚至在其自身因权限问题而卡住之际还会向你讨要权限。
坦白而言,尽管Code呈现出了Agent的初步形态,然而在进入2025年这个时间节点时,真正意义上的「全自动工程师」其实依旧尚未降临。
当下的Agent,更像是个勤快然而记性挺差劲儿的实习生。它能够去干那种又脏又累的活儿,不过呢,一碰到复杂型的大型架构之时,依旧是得靠人类的「Vibe」来掌控方向的。
倘若于云端的AI仿若居于神殿之中的先知,那么所推出的Code(CC)便仿若居于你硬盘之内的管家。
认为走错了路,他们太执着于云端、容器化和的网页入口。
而 Code抓住了开发者的痛点:本地化()。
第四章:范式转移
GUI的终结与新生
谷歌 Nano 是2025年最具颠覆性的范式转移模型之一。
这原本是图像生成模型的内部代号。
本应是一场严肃的技术发布,只因“Nano”这个名字极度滑稽且毫无厘头,它出人意料地引发了覆盖全球范围的病毒式传播。
于其来看,LLM属于紧接着1970与80年代计算机之后出现的下一个具有重大意义的计算范式。
人类会目睹,个人计算的对应形态,微控制器(认知核心)的对应形态,互联网(智能体网络)的对应形态。
尤其是于用户界面体验这块,跟LLM「开展对话」,某种程度上类似在1980年代之时,朝着计算机终端输送指令 。
文本是以那种计算机(以及LLM)偏好去处理的原始数据样式呈现着的,不过它可不是人类所喜欢的交互格式哟,特别是在输入这个层面上。实际上人们是讨厌去阅读那种文字的——因为这个过程着实缓慢并且还很费力呢。
![]()
人类接收信息,没有倾向于其他方式,反而是更倾向于通过视觉,以及空间维度来接收,这恰恰是传统计算领域发明了图形界面的根本原因。
同样地,LLMs应当与我们对话,以我们偏好的格式去进行这一对话,此格式具体包括图像、信息图、幻灯片、白板、动画或视频、网页应用等形式。
早期版本以及当前版本的这一理念,自然涵盖表情符号以及这类工具,它们运用标题、加粗、斜体、列表、表格等办法,实施对文本的视觉化装扮行为以及排版工作,以此达成更轻松地对信息进行消化的目的。然而,到底是由谁来构建LLM的图形用户界面呢?
在这样的世界观情形之下,nano首次给我们带来了这种可能性的初期初步形态状况。
需要留意的是,它有个突出特征是,这并非单纯的图像生成,而是文本生成、图像生成以及世界知识,三者交缠于模型权重里去达成的合成能力。
人们没有再去讨论参数量,也没有再去讨论扩散算法,而是无比狂热地生成各种各样呈现出「香蕉化」的图像,把世间万物都转变成为手办风格的样子。
谷歌也顺水推舟,在官方宣传中使用了香蕉Emoji。
因而,给出了一个特别深邃的看法:文本属于计算机所偏好的格式,并非人类钟爱的 。
人类讨厌阅读长篇大论,人类喜欢图表、动画、视频和白板。
参差的智能
凡为人类者,其智力往往存在正相关之情形焉:设若有一人,彼具备解微积分题之能,通常而言,亦能够明晰无误地算出买菜之时应找回之零钱数额也。
但AI不同。
它能够成为一个数学天才,RLVR致使它在奥数方面 很高 ,与此同时它又是一个在常识方面极其欠缺的笨蛋 ,没办法领会把握简单的物理意义里的空间关系 ,或者连单词之中的字母数量都数不清楚 。
这种「参差感」源于模型训练数据的分布不均和的先天缺陷。
模型呢,在它曾经“相识领教过”或者“被着重强化历练过”的范畴领域,像代码呀、数学这类,一展身手时几乎达到那种登峰造极、让人惊叹不已的程度,然而呢,在那些由于实在太过简易,以至于从来都不曾被当成训练所需数据的领域,就比如说日常生活当中的隐性知识这方面,其表现却仿若一个头脑愚笨、反应不灵光的智障之类一般。
系好安全带,在参差中前行
简单来讲,2025年是让LLMs感到兴奋,同时略带着惊喜的一年,我们处于一个奇特的十字路口处,。
的年终总结,像是一份来自未来的生存指南。
LLMs正作为一种崭露头角的新型智能形态,它们远比人类预期中的状况要聪明许多,同时又远比人类预期中的情形要笨拙不少,情况就是这样 。
不管怎样,它们都作用相当大,觉得就算凭借当下的能力,行业就连它们哪怕百分之十的潜力都远远没有挖掘出来。
与此同时,有超多想法颇有值得一试的价值,从概念方面去看,这个领域依旧给人一种广阔得没有边际的感觉。
就如同今年较前时候于播客之内被提及的那样,与此同时(在表面上仿佛矛盾地表现着)坚信着:
我们将见证持续快速的发展,同时仍有大量工作亟待完成。
正如所言:「这仅仅是个开始,系好安全带,准备启程。」
参考资料:
秒追ASI
本站候鸟号已成立3年,主要围绕财经资讯类,分享日常的保险、基金、期货、理财、股票等资讯,帮助您成为一个优秀的财经爱好者。本站温馨提示:股市有风险,入市需谨慎。


暂无评论