2024 云栖大会：阿里云多款产品降价，模型推理成本指数级下降

进不了网站？换个网络试试！

在这背后，对于云厂商来说，行业仍处于AGI转型的早期阶段，大模型的“降价趋势”尚无结束的迹象。

“过去一段时间，模型推理的成本呈指数级下降，远超摩尔定律。过去一年，阿里云百联上统一财经API调用价格下降了97%，百万次调用成本最低降到5毛钱。”吴永明在9月19日上午的演讲中透露。

当天下午，阿里云Qwen-Turbo最低调用费用再次刷新至0.3美分，阿里云智能集团首席技术官周敬人宣布Qwen-Turbo价格下降85%，Qwen-Plus和Qwen-Max价格分别下降80%和50%，阿里云开启新一轮降价潮。

与此同时，阿里云还发布了新一代开源模型Qwen2.5，其视觉语言模型Qwen2-VL-72B也正式开源，可以识别不同分辨率和长宽比的图片，并能理解20分钟以上的长视频。阿里云统一旗舰模型Qwen-Max也迎来了全面升级，周敬人称其性能接近GPT-4o。统一官网和统一APP的后台模型均已切换为Qwen-Max，“并继续免费为所有用户提供服务”。此外，周敬人还宣布统一万向已全面升级，发布全新视频生成模型。这款AI视频制作工具完全免费，“APP端每天开放无限使用”。

阿里云一系列动作背后，一个现象是，花钱引流、引新客，依然是大模型行业的常态。

“开源和降价都是基于同一个逻辑，就是让生态怎么发展。”周敬人接受记者采访时表示。他表示，从去年阿里云坚定做开源开始，一年来阿里云看到模型生态建设表现超出预期，大模型不再高高在上。截至2024年9月中旬，统一千文开源模型累计下载量已突破4000万。

周靖人表示，阿里云的每一次降价都经过了非常严肃的内部讨论。除了成本之外，云厂商还要权衡整个行业的发展、开发者、企业用户的反馈等各方面，未来通过规模经济、技术进步、资源调度等进一步降低成本。从长远发展来看，大模型的能力需要让所有人都能用得起，从而刺激更多产业级的创新。吴永明在演讲中也表示，模型推理的成本是影响应用爆发的关键问题。

“有句话说，今天的AI相当于1996年前后的互联网，也就是BBS时代。那时候上网费很贵。后来随着互联网的发展，包括移动互联网的发展，运营商大力投入基础设施建设，流量费就下来了。”阿里云副总裁张奇说，阿里云现在也在疯狂发展大规模AI基础设施。只有把费用降下来，才谈得上未来应用的爆发。这个长远目标才是阿里云更多考虑的，“而不是今天要算数，马上能赚多少钱。”

在大模型降价侵蚀毛利甚至转为负毛利的情况下，大模型降价的底线在哪里？对此，周靖人表示，阿里云降价主要是通过技术优化，不仅模型本身快速迭代，模型的推理效率和结构优化也在同步进行，推动模型推理成本的进一步降低。阿里云想把技术的红利传导给企业客户，推动整个行业的发展。

“我们也认识到，今天模型的应用，包括模型的各种创新，都还处于早期阶段。如果这时候把模型的推理放到一个昂贵的阶段，大量的开发者就没法有效、批量或者大规模地去使用它们，这在一定程度上会影响大家对（AGI变化的）关注。”周敬人说。

（本文来自第一财经）

本站候鸟号已成立2年，主要围绕财经资讯类，分享日常的保险、基金、期货、理财、股票等资讯，帮助您成为一个优秀的财经爱好者。本站温馨提示：股市有风险，入市需谨慎。

2024 云栖大会：阿里云多款产品降价，模型推理成本指数级下降

赫美集团拟投 31.35 亿建设风力发电制氢及绿色甲醇一体化项目

中国 70 多万亿政府债务管理新部署：统筹风险化解与稳定发展

暂无评论

发表评论取消回复

2024 云栖大会：阿里云多款产品降价，模型推理成本指数级下降

赫美集团拟投 31.35 亿建设风力发电制氢及绿色甲醇一体化项目

中国 70 多万亿政府债务管理新部署：统筹风险化解与稳定发展

相关推荐

暂无评论

发表评论 取消回复

搜索

2024 云栖大会：阿里云多款产品降价，模型推理成本指数级下降

2024 云栖大会：阿里云多款产品降价，模型推理成本指数级下降

发表评论取消回复