字节跳动豆包全家桶新成员亮相,火山引擎Force冬季大会揭示大模型应用新进展

进不了网站?换个网络试试!

12月18日的火山引擎原力冬季大会上,字节跳动的“豆宝全家桶”迎来了新成员。豆宝视觉理解模型正式亮相。具有较强的内容识别、理解推理、视觉描述等能力;明年1月,豆宝视频一代大模型也将向企业开放。

除了新成员的加入,豆宝大模的各类产品也得到了更新和迭代。例如,豆宝通用模型pro已与GPT-4o全面对齐;音乐模型从60秒生成简单结构升级为3分钟生成完整作品; 图模型2.1版本接入极萌AI、豆宝App...

字节跳动豆包全家桶新成员亮相,火山引擎Force冬季大会揭示大模型应用新进展插图

用户正在使用豆宝视频理解模型,图片来源豆宝微信公众号

无论是基础层还是应用层,Byte都在全面布局并持续迭代升级。截至目前,Byte正在运营约20个AI应用程序,其中大部分将在2024年之后发布。

进入今年下半年,随着越来越多的大机型应用的出现,行业达到了一个新的高度:C端量用户,B端量价格。

豆宝的“饱和”进攻,在各个领域都起到了“后来者追赶”的作用。

用户方面,数据显示,今年9月字节豆宝App日活跃用户达到760万,成为国内最大的AI产品。

价格方面,本次豆宝视觉理解模型的输入价格仅为3厘米,比行业价格便宜85%。此前,豆宝文字大机型可以以0.8厘米的价格处理1500多个汉字,比行业价格便宜99.3%。

“劳斯莱斯之王”豆包豆袋的另一面,是行业正式进入混战后的生存之战。虽然现在谈论“APP”还为时过早,但商业化却是一个无法回避的话题。疯狂投资之后,豆宝也需要学会赚钱。

这与年初字节跳动CEO梁如波在全员大会上反思“慢”完全不同。今年,字节与豆宝家族一起进攻大型模型行业,速度又快又狠。豆宝在行业的成长,再次验证了字节“用力量创造奇迹”的路线,也给行业带来了新的影响和思考。

1、降价多买,豆宝求增长

今年年初,字节跳动CEO梁如波在一次内部演讲中提到了“慢”这个词,指出字节跳动不像初创公司那样对大模型敏感。

“直到2023年才开始讨论GPT,行业里做得比较好的大型模型初创公司都是2018年到2021年创立的。”梁如波直言。

今年5月,大车型名称统一为“豆宝”后,字节正式走上了大车型发展的高速路。据研究院不完全统计,从去年8月至今,字节跳动在AI领域共上线了17个大模型和2个智能体开发平台,其中就包括豆宝大模型家族。

在大车型从“百款之战”走向应用落地期之际,各家企业都在紧跟行业趋势,以求走在最前列。

在应用层面,有“APP工厂”之称的Byte则更加坚定。据不完全统计,2024年以来,字节已在国内外推出包括豆宝在内的20余款应用,涵盖AI聊天助手、AI视频工具、AI娱乐应用、办公等领域。

字节跳动豆包全家桶新成员亮相,火山引擎Force冬季大会揭示大模型应用新进展插图1

其中,有与Sora竞争的《豆包》、与Sora竞争的《吉萌》、与其社交AI星野竞争的《猫盒子》、与妙雅相机竞争的《星花》、以及与Sora竞争的《海绵音乐》。与Suno AI竞争。 ……

在12月18日的火山引擎原力冬季大会上,字节跳动正式发布了豆包视觉理解模型和豆包3D模型。会上,火山引擎宣布将于2025年春季推出具有更长视频生成能力的豆宝视频生成模型1.5版本,豆宝端到端实时语音模型也即将推出。

其中,速度最快的是以豆袋为中心的大模型生态。

量子位智库数据显示,今年5月至7月,豆宝APP日新增用户从20万飙升至90万,9月成为国内首个用户突破亿的AI应用; 11月,平均新增下载用户80万,单日活跃用户近900万,MAU排名第二;截至11月底,豆宝2024年累计用户数已突破1.6亿。

“黑马”豆宝跑得这么快,与字节的“大奇迹”密不可分。

今年年中以来,大型模式C端应用展开了激烈的流量争夺。无论是线上平台还是线下公共场所,都可以看到大型模型厂商的身影。初创公司和互联网巨头无一例外地陷入了大模应用的“用户焦虑”。

据统计,截至11月15日,国内十款AI原生应用总投资金额达15亿元,其中10月份投资金额超过3.5亿元,创历史最高。其中,基米和豆宝是最受欢迎的两款产品,投资额分别为5.4亿元和4亿元。

从更长的时间来看,豆袋的流动显然更加激烈。据统计,2024年4月至5月,豆袋投放金额预计为1500万元至1750万元。 6月初,豆宝再次发起新一轮大型广告活动,投资金额高达1.24亿元。

背靠抖音庞大的流量池,豆袋的出现频率越来越频繁。在抖音,字节已经屏蔽了除了豆宝之外的几乎所有AI应用,只留下了自己的豆宝。

不得不承认,面对同质化的市场竞争,烧钱换取流量是移动互联网时代的通行做法,而豆宝有着背靠强大字节生态的天然优势。

字节跳动豆包全家桶新成员亮相,火山引擎Force冬季大会揭示大模型应用新进展插图2

大模型的特殊性在于,AI产品在用户接受度和留存方面仍面临挑战。巨额投入能否换来超级应用还不得而知,但至少迄今为止给豆宝带来了看得见的用户增长。

也是花钱,而不是花钱去C端投资。随着大模型推理成本的下降,今年B端的大模型厂商集体降价,行业从“分毛价”走向了“分毛价”时代。

豆袋的降价也很明显。今年5月的火山引擎动力秋季发布会上,豆宝主力机型在企业市场的定价比行业价格低99.3%,0.8厘米的价格可处理1500多个汉字;在本次火山引擎原力冬季发布会上,豆宝视觉理解模型的投入价格仅为3%,1元即可处理284张720P图片,比行业价格便宜85%。

厂家降低利润、降价的意图显而易见。让算力技术触手可及的同时,也让企业用户更愿意使用AI应用。数据显示,截至12月中旬,豆宝万能模式日均使用量已突破4万亿,较刚发布7个月时增长了33倍。

回望2024年,字节围绕豆宝生态做AI的决心非常坚定,也从资源和速度上证明了自己作为互联网巨头的实力。现在我们有了增长的信心,下一步的关键是让大模型变得更好用。

2、在推广技术的同时“脚踏实地”,豆宝能否更贴近用户是关键

AI浪潮已汹涌澎湃两年,行业不断进入新阶段。不变的是玩家对技术的迭代。

今年下半年,一个明显的变化是,以思维为代表的大语言模型的局限性日益显现。

大型语言模型无法与物理世界交互,也不具备理解人类价值观的能力。玩家正在寻找下一个更“类人”的模型或应用程序。 9月,思维o1推理模型上线; 12月,李飞飞推出了3D世界模型,两者都是基于这个想法而应运而生。

大型火车模型正在高速行驶。对于玩家来说,最重要的就是拿到门票。相比之下,豆宝也算得上是国内科技前沿的大模型玩家了。

本次大会上,豆宝发布的视觉理解模型在内容识别、理解推理、视觉描述等方面具有更强的能力。

新的视频理解模型下,用户可以同时输入文字和图像相关问题,使用起来更加方便;同时,该模型可以基于综合理解能力提供准确的答案。

也就是说,与之前的文森特视频大模型相比,这种视觉理解模型能够更好地理解人们的需求,也能够帮助人类提高复杂工作的效率。比如在教育场景中,为学生优化作文、科普知识;在旅游场景中,帮助游客阅读外文菜单、讲解照片中建筑物的背景知识等。

据火山引擎介绍,豆宝视觉理解模型已集成到豆宝App和PC产品中。从某种意义上说,对大模型的视觉理解是行业技术迭代的标志。与语言大模型相比,视频大模型可以扩展大模型的能力,同时也降低了人们与大模型交互的门槛,解锁了大模型更丰富的应用场景。

视觉能力是大模型能力的核心已是共识。视觉输入占据了人类交互信息的绝大多数。为了让大型模型离AGI更近一步,大家都在加速。

事实上,Byte 对可视化和多模态模型的重视明显增加。 12月11日,据智萌报道,字节提高了极萌的产品优先级,尝试用新路径打造AI时代的“抖音”。未来字节计划将更多的资源转移到更多模态的产品形态上,这意味着孟将承载更大的希望。

极萌AI隶属于字节跳动旗下编辑业务,定位为支持通过自然语言和图像输入生成高质量图像和视频的AI内容平台。

在本次发布会上,剪辑业务负责人张楠表示,“这是一个梦想,希望成为想象世界的相机。”看来它也是在响应这一策略。具体动作方面,极萌AI图片模型2.1正式上线。它可以“一句话生成海报”,通过简单的指令控制文字的颜色、位置等元素,支持快速生成中英文图像海报。

字节跳动豆包全家桶新成员亮相,火山引擎Force冬季大会揭示大模型应用新进展插图3

值得一提的是,豆宝还发布了3D生成模型,与火山引擎数字孪生平台配合使用,完成智能训练、数据合成和数字资产生产,成为支持AIGC创作的物理世界模拟模拟器。

不仅如此,豆宝车型家族的多款产品都获得了重要更新。

新版豆宝通用模型Pro综合任务处理能力较5月提升32%,全面向GPT-4o看齐。使用价格仅为后者的1/8,推理提升13%;

豆宝音乐模型4.0支持三分钟整首歌创作、歌词部分修改、音乐风格连贯;

豆宝文生图模型2.1支持“一键P图”,可以高精度理解命令,中文、英文、专有名词“皆可”。

至此,豆宝全家桶升级的同时,弥补了豆宝在视觉交互上的短板,拓展了自身模型的场景边界,同时也降低了算力成本。本质上,都是为了让大模型之间的距离更近。用户。

今年5月,字节跳动产品与战略副总裁朱军分享道,字节跳动为豆袋等产品定义了三大产品设计原则:一是“拟人化”;二是“个性化”;三是“个性化”。二是贴近用户、随时可用。陪伴用户,嵌入不同使用环境的用户,豆宝应该来到用户身边,而不是用户走向豆宝;第三个是个性化。

豆宝要回归用户,让用户了解AI、满足用户对AI的好奇心非常重要。据中国企业家报道,在豆宝官方用户群中,每当有新功能发布时,豆宝助手都会在群中发布公告,并鼓励用户提供高质量的反馈。

这也证明了Byte打造产品的思维同样适用于大模型领域。如今,大机型已经经历了推出技术、推出应用、推出用户的阶段。想要拿到下半场的门票,字节也必须带上豆袋,同时“提升技术”和“脚踏实地”。

3、拓展场景、商业化是豆宝必须探索的。

今年,大模型行业除了技术迭代和产品更新速度的竞争外,还有一个更重要维度的竞争,那就是商业化赚钱的速度和场景落地的速度。

玩家进入的热情有多高,市场对回报周期的需求有多迫切。

对于字节这样的巨头来说,无论赚钱的速度有多快,都敌不过大机型的烧钱速度。算力成本、用户扩张等都需要真金白银。

尚处于投资阶段的豆宝,无法回避商业化的命题。

字节跳动豆包全家桶新成员亮相,火山引擎Force冬季大会揭示大模型应用新进展插图4

在经历了C端的烧钱投资之后,豆宝是国内日活用户最多的AI产品,但一个突出的问题在于用户留存。

这让Byte对豆袋商业化有了新的思考。据Smart 报道,虽然豆宝的AI对话产品月活跃度不错,但豆宝目前的活跃度并不高。豆宝每周仅活跃2至3天,用户每天发送消息仅5至6次,每次持续约2分钟,每个用户的平均使用时间仅约10分钟。过去一年这些数据的增长并不显着。

基于此,字节管理层认为,像豆宝这样的AI对话产品可能只是AI产品的“中间状态”。字节内部的判断是,付费订阅模式在中国不太可能成功。但时长和轮次过低,导致潜在的广告空间较小,这对此类产品构成了无形的天花板。

从长远来看,更低的门槛、更多“多式联运”的产品形态更有可能落地。切割和梦想可能是合适的入口。这也是豆宝本次大会将部分重点放在视频模型上的本质原因。

如果说C端的豆宝不断探索应用与用户付费意愿的契合度,那么在用户更愿意付费的B端,豆宝的重点就是探索豆宝大模式与用户付费意愿的契合度。顾客。

今年5月,豆宝确定了B端的业务实现思路:火山引擎负责基础模型和开发者生态建设,豆宝负责应用开发和调试。

得益于火山引擎“模型更强、成本更低、实施更容易”的开发理念,在视觉理解模型进入“分毫价格”范畴的同时,火山引擎也将火山方舟、按钮等三个平台产品升级为帮助企业建立自己的AI能力中心,高效开发AI应用。

字节跳动豆包全家桶新成员亮相,火山引擎Force冬季大会揭示大模型应用新进展插图5

事实上,按照字节预期的飞轮效应,算力调用测试带动了豆宝大型号产品的价格。大机型降价吸引B端客户合作,客户使用数据给豆宝带来更多来电。

目前,据火山引擎数据显示,豆宝车型已与80%的主流汽车品牌合作,并已接入手机、PC等众多智能终端,覆盖约3亿终端设备。智能终端对豆宝模式的调用次数已超过半年。时间上增加了100倍。

此外,豆袋椅在与企业生产力相关的场景中也出现了新的增长。近三个月,信息处理场景的豆宝大模型调用次数增长了39倍,客服和销售场景增长了16倍,硬件终端场景增长了13倍,AI工具场景增长了13倍。 9次。

除了面向B、C客户开放申请外,豆宝还开始研发今年的智能硬件新产品——Ola。据介绍,耳机内嵌了豆宝大模型,并与字节对话AI应用豆宝App结合:戴上智能耳机后,用户可以随时通过语音对话使用豆宝,还可以控制耳机在豆宝App上。 。

此外,据悉,字节AI硬件团队还积极推动豆宝大机型与其他手机厂商智能助手的合作,以期在更广泛的场景中发挥大机型的强大能力。

种种信号表明,豆宝正在以各种方式打开大模型商业化的大门。商业化是所有玩家面临的共同问题。学习赚钱也是豆宝的必修课。

对于豆宝来说,用“实力创造奇迹”卷起应用后,还必须拥有下半年挺进的资本,这是一条更加清晰的商业路径。

(本文头图来自火山引擎微信公众号。)

本站候鸟号已成立3年,主要围绕财经资讯类,分享日常的保险、基金、期货、理财、股票等资讯,帮助您成为一个优秀的财经爱好者。本站温馨提示:股市有风险,入市需谨慎。

相关推荐

暂无评论

发表评论