Meta 发布全新人工智能模型 Llama 3.1,号称比肩最好闭源模型

进不了网站?换个网络试试!

北京时间7月24日,母公司Meta Inc.发布了全新的人工智能模型“Llama 3.1”,这是该公司迄今为止推出的最强大的开源模型,号称可以与最好的闭源模型相媲美。

与此同时,Meta 首席执行官马克·扎克伯格 · 发表了一封公开信,解释了他为什么支持开源 AI。

扎克伯格称其为“艺术的开端”,他说Llama 3.1具有广泛的新功能,包括改进推理以帮助解决复杂的数学问题,或者即时合成整本书。

Meta 评估了多种语言的 150 多个基准数据集的性能,Llama 3.1 模型在所有基准测试中都表现良好。此外,还进行了广泛的人体评估,以将 Llama 3.1 与真实场景中的竞争模型进行比较。实验评估表明,Llama 3.1 能够在一系列任务中与领先的基础模型竞争,包括 GPT-4、GPT-4o 和 ..

Meta 发布全新人工智能模型 Llama 3.1,号称比肩最好闭源模型插图

Llama 3.1 405B 与其他模型的比较,用于 Meta 官网上的多个基准评估

官方表示,开发人员提高了模型的响应能力、质量和遵循详细说明的能力,同时确保了高水平的安全性,使其能够跨功能扩展和微调数据量。

根据 Meta 的发布,Llama 3.1 模型包含 4050 亿个参数,使其成为近年来最大的模型之一。这些模型支持多种语言,将上下文长度显着增加到 128K,使用最先进的工具,并且推理能力更强。这使我们的最新模型能够支持高级用例,例如长格式文本摘要、多语言对话代理和编码助手。

Meta 发布全新人工智能模型 Llama 3.1,号称比肩最好闭源模型插图1

Llama 3.1 模型与 Meta 官网文件的对比

作为 Meta 迄今为止最大的模型,Llama 3.1 从 16 位 (BF16) 量化为 8 位 (FP8) 数字,有效降低了所需的计算需求,并允许模型在单个服务器节点内运行,在超过 16,000 个 H100 GPU 上训练,是迄今为止世界上最强大的、参数规模最大的开源模型。

该模型主要旨在为 Meta 内部和外部开发人员的聊天机器人提供支持,具有广泛的新功能,包括改进的推理能力,以帮助解决复杂的数学问题或立即合成整本书文本。它还具有生成式 AI 功能,可以生成带有文本提示的图像。

与此同时,扎克伯格发表了一封公开信《开放人工智能是道路》,解释了“为什么开源对开发者、对Meta、对世界都有好处”。

自爆炸以来,对开源的呼声一直没有停止。但刚发布,它就选择了闭源开发。阿里云、智普、清华心电图、百川智能等选择了开源,而华为则出于数据隐私和商业利益的考虑选择了闭源。

在扎克伯格的公开信中,Llama 需要演变成一个完整的生态系统,包括工具、效率改进、芯片优化和其他 Meta 无法单独使用的集成。骆驼有信心在竞争激烈的环境中保持优势,而成为行业标准的道路是一代又一代地保持竞争力、效率和开放性;最后,出售对人工智能模型的访问权不是公司的商业模式。这意味着Llama的公开发布不会削弱公司在收入、可持续性或投资研究方面的投资能力。

扎克伯格还指出,开源将确保全球更多人能够享受到人工智能带来的好处和机会,权力不会集中在少数公司手中,并且该技术可以更均匀、更安全地应用于整个社会。

扎克伯格认为,最好的策略是建立一个强大、开放的生态系统,在这个生态系统中,行业领导者与政府和盟友密切合作,以确保他们能够最好地利用最新的进展,并在长期内实现可持续的先发优势。

关于中国,他提到,“一些人认为美国必须采取封闭的消息来源,以防止中国获得这些模式”,但“这是行不通的,只会使美国及其盟国处于不利地位”。

据彭博社报道,扎克伯格还补充说,期望美国在人工智能方面领先中国数年是不现实的。但他指出,即使是几个月的微小领先优势也会随着时间的推移“积累”,这给美国带来了明显的优势。

本站候鸟号已成立2年,主要围绕财经资讯类,分享日常的保险、基金、期货、理财、股票等资讯,帮助您成为一个优秀的财经爱好者。本站温馨提示:股市有风险,入市需谨慎。

相关推荐

暂无评论

发表评论