在这背后,对于云厂商来说,行业仍处于AGI转型的早期阶段,大模型的“降价趋势”尚无结束的迹象。
“过去一段时间,模型推理的成本呈指数级下降,远超摩尔定律。过去一年,阿里云百联上统一财经API调用价格下降了97%,百万次调用成本最低降到5毛钱。”吴永明在9月19日上午的演讲中透露。
当天下午,阿里云Qwen-Turbo最低调用费用再次刷新至0.3美分,阿里云智能集团首席技术官周敬人宣布Qwen-Turbo价格下降85%,Qwen-Plus和Qwen-Max价格分别下降80%和50%,阿里云开启新一轮降价潮。
与此同时,阿里云还发布了新一代开源模型Qwen2.5,其视觉语言模型Qwen2-VL-72B也正式开源,可以识别不同分辨率和长宽比的图片,并能理解20分钟以上的长视频。阿里云统一旗舰模型Qwen-Max也迎来了全面升级,周敬人称其性能接近GPT-4o。统一官网和统一APP的后台模型均已切换为Qwen-Max,“并继续免费为所有用户提供服务”。此外,周敬人还宣布统一万向已全面升级,发布全新视频生成模型。这款AI视频制作工具完全免费,“APP端每天开放无限使用”。
阿里云一系列动作背后,一个现象是,花钱引流、引新客,依然是大模型行业的常态。
“开源和降价都是基于同一个逻辑,就是让生态怎么发展。”周敬人接受记者采访时表示。他表示,从去年阿里云坚定做开源开始,一年来阿里云看到模型生态建设表现超出预期,大模型不再高高在上。截至2024年9月中旬,统一千文开源模型累计下载量已突破4000万。
周靖人表示,阿里云的每一次降价都经过了非常严肃的内部讨论。除了成本之外,云厂商还要权衡整个行业的发展、开发者、企业用户的反馈等各方面,未来通过规模经济、技术进步、资源调度等进一步降低成本。从长远发展来看,大模型的能力需要让所有人都能用得起,从而刺激更多产业级的创新。吴永明在演讲中也表示,模型推理的成本是影响应用爆发的关键问题。
“有句话说,今天的AI相当于1996年前后的互联网,也就是BBS时代。那时候上网费很贵。后来随着互联网的发展,包括移动互联网的发展,运营商大力投入基础设施建设,流量费就下来了。”阿里云副总裁张奇说,阿里云现在也在疯狂发展大规模AI基础设施。只有把费用降下来,才谈得上未来应用的爆发。这个长远目标才是阿里云更多考虑的,“而不是今天要算数,马上能赚多少钱。”
在大模型降价侵蚀毛利甚至转为负毛利的情况下,大模型降价的底线在哪里?对此,周靖人表示,阿里云降价主要是通过技术优化,不仅模型本身快速迭代,模型的推理效率和结构优化也在同步进行,推动模型推理成本的进一步降低。阿里云想把技术的红利传导给企业客户,推动整个行业的发展。
“我们也认识到,今天模型的应用,包括模型的各种创新,都还处于早期阶段。如果这时候把模型的推理放到一个昂贵的阶段,大量的开发者就没法有效、批量或者大规模地去使用它们,这在一定程度上会影响大家对(AGI变化的)关注。”周敬人说。
(本文来自第一财经)
本站候鸟号已成立2年,主要围绕财经资讯类,分享日常的保险、基金、期货、理财、股票等资讯,帮助您成为一个优秀的财经爱好者。本站温馨提示:股市有风险,入市需谨慎。
暂无评论