没有任何公告或促销活动,在开源平台面上默默地推出的新的V3迭代版本今天仍然引起了很多关注。
3月25日晚上,这位官员终于正式宣布了该消息,即V3模型已在国内外的官方帐户上完成了小型版本的升级,并介绍了新版本改进的详细信息-V3-0324模型,包括推理,前端开发,中文写作,中文和中文搜索方面的能力优化。
值得一提的是,在25日下午,海外专业AI模型评估机构发布的最新排名表明,新版本的V3模型现在是得分最高的非推动性模型,超过了XAI的GROK3和GPT-4.5()。
“这是开放权重模型首次成为领先的非推断模型,它是开源的里程碑。”官员说,这个版本可以说比R1模型更令人印象深刻,并且可能表明R2模型将是另一个重大飞跃。
这次发布的新版本的V3模型已由MIT许可(允许该模型蒸馏和市售),这意味着可以自由地将其用于商业目的。
根据官方比较图表,V3模型的新版本在数学和代码相关的评估集中排名第一,超过了GPT-4.5,-3.7和 Cloud的Qwen-Max,但就百科全书知识而言,新模型比GPT-4.4.5稍弱。
介绍的新版本的V3模型借鉴了-R1模型训练过程中使用的强化学习技术,从而大大提高了推理任务的性能水平。
此外,在诸如HTML之类的前端任务中,新版本的V3模型生成的代码更可用,并且视觉效果更漂亮,并且具有设计感。官方示例是由模型生成的程序。屏幕是一个屏幕,其中多个球在指定的空间范围内移动,并包含几个可以调节引力和摩擦等参数的滑动按钮。
在中文写作和搜索任务方面,新的V3模型提高了中文和长文本创建的内容质量,并且可以为报告生成指令提供更详细和准确的结果,并且在网络搜索场景中更清晰,更漂亮的布局。
该官员还表示,新的V3模型在工具呼叫,角色扮演,问答聊天等方面还具有一定的改进水平。
对于新模型,用户将登录到官方网页,应用程序和Mini程序并输入对话接口,关闭深入思考并体验它。 API接口和使用方法保持不变。如果它不是复杂的推理任务,则官员建议使用新版本的V3模型,该模型可以具有更顺利的速度和改进的对话体验。
根据评估,新的V3模型就SMART指数提高了7个百分点,目前在所有其他非推理模型之前。尽管它在智能指数以及其他推理模型和阿里巴巴的推理指数方面落后于自己的推理模型R1,但其成就仍然令人印象深刻。由于非推断模型可以立即回答而无需花费时间“思考”,因此这使得该模型在对潜伏期更敏感的情况下非常有用。
在发布新的V3模型后,一些开发人员立即使用它来编写代码,并认为新模型超过-R1,甚至-3.7。 “很难想象这不是推理模型。”开发商表示,在20次小球碰撞测试中,新的V3模型取得了明显的进步。 -v3的小球被挤入球,现在体力模拟非常好。
一些海外开发人员还使用新模型一次创建了网站,编写了800多行代码,并且没有任何故障。他在X上分享道:“很高兴看到这些开源模型如何给大型科技公司施加压力,要求以较低的成本建立更好的模型。”
本站候鸟号已成立3年,主要围绕财经资讯类,分享日常的保险、基金、期货、理财、股票等资讯,帮助您成为一个优秀的财经爱好者。本站温馨提示:股市有风险,入市需谨慎。
暂无评论