人工智能引发的思考:第四范式创始人戴文渊的探索与发现

进不了网站?换个网络试试!

人工智能引发的思考:第四范式创始人戴文渊的探索与发现插图

人工智能引发的思考:第四范式创始人戴文渊的探索与发现插图1

美景网记者 柯阳 美景网编辑 张海妮

由史蒂文·斯皮尔伯格执导的电影《人工智能》讲述了一个小男孩最终发现自己是人工智能的故事。

人工智能什么时候才能达到这样的水平?人工智能的目的是为了创造像人一样的智能体吗?这是第四范式创始人兼董事长戴文元初入人工智能行业时困惑的两个问题。

最后他在图灵奖得主詹姆斯·格雷(绰号Jim Gray)2007年的演讲《科学发展的四大范式》中找到了答案。其中,第四范式阶段指的是数据科学——随着数据的爆炸式增长和技术的演进,科学理论被计算机从海量数据中发现。

戴文远创办的人工智能公司“第四范式”的名字也由此而来。这家企业级人工智能平台公司成立于2014年,伴随着人工智能的跌宕起伏而成长。戴文远向《每日经济新闻》记者分享了自己的经历,认为我们不要太在意AI(人工智能)是不是万能的,因为这对于市场来说并不重要,客户关心的才是最重要的:“我是卖鸡翅的,AI能做的所有事情跟我有什么关系?重要的是,我能不能(通过AI)把我的鸡翅卖得更好。”

在大模型时代,第四范式主张“量身定制”模型,以最“经济”的方式打造领先的AI。在戴文渊眼中,通用大模型和行业大模型是实现AGI(通用人工智能)的不同方式,两条路径的区别在于用一个模型实现AGI,还是用很多个模型实现AGI。相比两者,他认为行业大模型是最经济的方式。

热情与误解并存,市场期待AI解决所有问题

第四范式创立的第十年,新一波热潮涌动,也促使戴文元做出一些改变。

2023年,许多人找到戴文元,问他:“这对我的生意有什么帮助?”上次他被问到类似的问题是在2016年,当时问题的主题是。

更有意思的是,这一次,几乎所有客户、投资者、媒体记者都在用“技术语言”提问,“参数”成为高频词,这与之前的情况有很大不同。

戴文元说:“要做好人工智能,首先不要谈人工智能问题,而是先谈公司是做什么的。这些问题搞清楚了,我们再回头看人工智能能不能帮助到公司。”

在市场和客户对新技术感到兴奋的同时,戴文渊希望借此机会引导正确的“AI价值观”:“我们不能先达到1000亿个参数,再去想这1000亿个参数能做什么。”

市场期待AI解决一切问题,这反映出一种恐慌:如果AI能做一些事情,而他们不去用,就可能失去一些机会。戴文渊将此视为机遇,“担忧”打开了世界渴望了解AI的窗口,但误解也随着热潮而涌动。第四范式要做的,是把AI的价值带给每个人。

作为当下最火爆的大模型应用,它把大模型带到了人工智能圈外的世界。热浪之下,或许有人会把大模型理解为:跟AI一模一样的技术。

到今天,市面上最流行的大模型还是以大语言模型为主,也就是“预测下一个词”的模型,年初火起来的Sora就是“预测下一帧”的模型。

但应用更注重实际。对大多数公司来说,“预测下一个词”并不能解决核心问题。比如金融机构需要解决风控问题,但这不是语言问题;大型语言模型可能协助金融机构解决客户服务问题,但这可能不是它的核心问题。真正的行业大模型应该是针对不同的场景构建不同的模型,预测下一个“事物”。

这背后还有一个更大的误解——很多人问,能否基于开源大模型库或者 GPT 来训练出业界需要的新型模态模型。但即便是同一手,直接在 GPT 模型上对 Sora 进行微调,也是不可能的。

戴文远介绍,大部分行业大模型都需要基于具体业务积累的具体模态数据,训练出一个基础大模型,就像现在在基础之上训练出来的大型语言模型、视频模型等。

行业大模型其实已经存在十年了,2014年第四范式推出人工智能平台 1.0,通过模型构建挖掘业务数据的价值,改善业务结果。目前已升级至5.0版本,旨在降低门槛,让企业能够构建高价值场景所需的行业大模型,比如预测疾病风险、欺诈、灾害风险、设备故障等,打破了大型语言模型只能生成文本、图像、视频的局限性。

信心不再是问题,但市场耐心有限

1956年夏天,达特茅斯学院召开了一次人工智能研讨会,主题是研究“使机器能够像人一样感知、思考和学习,也就是用计算机模拟人类智能”。这次会议被广泛认为是人工智能发展的开端,从此,人工智能开始沿着波浪般的曲线前行,经历着巨大的起伏,在失望与希望之间穿梭。

戴文元认为,两到三年的时间,是市场对一次科技繁荣所能给予的最大耐心。

最近的一次热潮,相信要追溯到2016年,当时人类围棋选手李世石基于强化学习算法战胜了后者。当时,机器是否会取代人类的问题引起了市场的关注。包括商汤科技、旷视科技在内的一批人工智能公司,“独角兽”走上了舞台前列。

是一家幸运的公司,它成立于 2014 年,从诞生第一天开始就做企业端的业务。然而当时,很多公司告诉戴文远,他们没有人工智能的预算。一石激起千层浪,突然间所有的客户都来找他,问他,“你是人工智能公司,告诉我你能为我做什么?”“我们有预算,我们想要。”

近两三年来,人们梦想的AI工具并未诞生,市场信心在2019年崩塌,猎豹全球智库的数据显示,相较于2018年,2019年中国AI企业融资金额从1484.53亿元下降至12967.27亿元,减少了34.8%;融资数量也从737笔下降至431笔,减少了40%。

直至它成为下一块石头,这场“寒冬”结束,AI市场再度迎来繁荣。

戴文远认为,2023年之前,市场对AI的信心是一个问题。从2023年开始,就不再是信心的问题,而是找对路的问题。“不要担心客户觉得AI没用,需要解决的是引导客户反过来思考业务问题。”戴文远说。

潮起潮落似乎已经成为人工智能行业的常态。戴文渊认为,潮落的原因与价值有关。2016年,每家公司都陷入了“它怎么帮我”的问题,这股潮落了。今天同样,如果每家公司都在思考“它怎么帮我”,这股潮落或许也会消退。

戴文元认为,在两三年内,大模式如果不能创造巨大的价值,就可能再次退却,等待下一块“石头”——也许是新的吸引眼球的东西,或者是某种能够以合理的投入和产出创造足够价值的技术。

现在的机会是市场的注意力重新被吸引,但挑战是大模型的价值是否能在两到三年内实现?

市场在关注人工智能这个“+”,戴文渊认为,这个加号很重要,意味着未来两三年人工智能可能创造很大的价值,如果大家都在想它能不能帮助企业,那可能不一定能创造市场期待的价值。

“以语言模型为例,去年主要的应用场景都是客服。如果关注度这么高,落地的应用都是问答场景,两三年后可能就会让人失望了。”他说。

人工智能是一个实验过程,目标是改进“北极星指标”

目前来看,大模型赋能的行业还是一个值得期待的故事,因为理论上没有哪个行业不能被大模型赋能,在人的效率方面我们可以发挥出最大的想象力。

目前,大多数企业的核心业务决策都由人类来决定,但人类在决策时往往面临两个困境:技能参差不齐和精力有限。当AI能力提升时,即使其能力尚未超越人类,即使只是接近人类的平均水平,但如果能够复制出大量的“人”,就很有可能提供更好的商业价值。

企业在招聘员工时,并不需要每一位员工都达到顶尖水平,而是注重每一位员工是否能为企业做出积极的贡献,因此戴文渊认为,虽然第四范式的目标是让AI的表现超越大多数业务专家,但从实际角度来看,即便AI只达到专家的平均水平,也很可能为企业带来重大价值。

从数字化时代伊始到数智时代来临,赋能传统企业与实体经济始终是市场对于技术的期待,而随着大模型的出现,数字技术也逐渐从传统的信息采集、传输、组织、存储走向辅助决策甚至替代决策阶段。

戴文元指出,部分企业还在以数字化时代的惯性思维运用AI,即过于依赖同行业成功案例,试图将成熟的解决方案直接移植到自身企业。但其实,AI关系到企业核心竞争力之后,不同的企业有着不同的目标。

理想情况下,大模型应该能够帮助企业做出核心决策,为此,第四范式将企业的战略目标转化为计算机能够记录和追踪的语言,即企业的“北极星指标”,作为企业最核心的关键指标。

戴文远认为,企业在使用人工智能之前,需要先了解,对于提升“北极星指标”,哪些是好的,哪些是坏的。以实体零售企业为例,其核心效率体现在面积大小上,从贡献的效益来看,这可能就是一个零售企业的“北极星指标”。所有围绕这个指标的改进,都需要量化其对“北极星指标”的实际影响,无论是增加还是减少。

在实践中,人工智能的应用并不意味着每一步都会带来进步。

“AI其实就是一个实验的过程。”戴文远举了一个例子。假如有百万的客户群,可能会以90万作为基线,剩下的10万,每1万作为一个实验组,不断尝试模型的优化和迭代。“早期的实验基本都是成功的,每次实验都比‘90万’好。但到了一定阶段,大部分实验都失败了,也没关系。往往到了一定规模之后,一百次尝试成功一次,就能把之前九十九次失败的成本全部赚回来。”戴文远说。

戴文元认为,人工智能是一个实验的过程,但是这一点还没有得到客户的一致认可。

提高客户认知是AI行业发展至关重要的一环,如果认知不转变,AI就变成了“需要一个大模型,交付一个大模型,不管这个大模型的参数是不是1000个”,“验收付款完工”的过程就是“千亿级”,可能再过一两年,客户就觉得这个大模型好像没什么用了。

至此,这股热潮或许将再次遗憾落幕。

人工智能是科学问题,人工智能应用是经济问题

在通向AGI的路上,通用大模型和行业大模型是两条不同的技术路线,戴文渊认为大家都在向AGI迈进,区别在于是用一个模型实现AGI,还是用很多个模型来实现AGI。

他认为,用一种模型来解决所有问题并不是最经济的。

戴文元还提出了一个比较少见的观点:不存在真正意义上的通用大模型,所谓通用大模型,本质上就是把多种场景整合成一个模型。

第四种范式方法是将模型定制为垂直行业模型。如果模型只应用于特定场景,则首先基于该场景的数据模态构建专用模型。相同的参数数量往往可以达到更好的效果。相反,如果将模型设计为通用大模型,将通用大模型应用于特定场景往往不经济。

“经济性”在一小时的采访中被戴文元至少提到了五次。“我们致力于解决这个问题或者发展这个技术,如果我选择一条不经济的路,最后可能赔钱是不行的。我们需要综合考虑每个方向、每条路线面临的问题,最终找到最有可能的解决方案。”戴文元说。

“制造最先进的人工智能是极其昂贵的,需要投入大量的资金。”或许正因为如此,在技术信徒与商业信徒之争中,戴文元认为自己处于两者之间。

人工智能显然是一个科学问题,但创造最先进的人工智能技术是一个需要计算的经济问题。

戴文渊认为,经营一家人工智能科技公司需要从商业的角度去思考:最先进的人工智能技术需要海量的算力和数据,如果不能和业务更好地结合,长期持续的资金投入就成为资源浪费。很难持续,既需要技术,又需要业务,如果你想把东西做出来,必须两者兼备。

此外,关于人工智能从业者的自身修养,戴文远认为,他们还需要有韧劲和毅力。“人工智能是一个有起有落的赛道,可能这两年受到大家的关注,甚至被炒作得沸沸扬扬。不要在被人践踏的时候,以为自己是神。同时,不要在被人践踏的时候,以为自己一文不值。”

当我们波浪式前进时,可以肯定的是,通往 AGI 的道路上没有标准的路标。

“AGI是我们所有人的理想,AGI是我心目中的无限。”戴文远从不认为AGI是三年、五年甚至十年就能实现的事情,相反,他认为AGI是一个永远做不到,但一直在做的事情。

本站候鸟号已成立2年,主要围绕财经资讯类,分享日常的保险、基金、期货、理财、股票等资讯,帮助您成为一个优秀的财经爱好者。本站温馨提示:股市有风险,入市需谨慎。

相关推荐

暂无评论

发表评论