中国DeepSeek发布推理模型DeepSeek-R1,性能比肩OpenAI,开启真正开放的人工智能时代

进不了网站?换个网络试试!

2025年已经风靡全球(深度搜索)。 1月20日晚,上演了一场“偷袭珍珠港”——推理模型-R1正式版发布,同步开源模型权重,允许用户使用模型输出、训练其他通过模型蒸馏等方法建立模型。这个大型模型在数学、编码和自然语言推理等任务上的性能可与 o1 的官方版本相媲美。

R1版本的推出,被海外惊叹为“这才是真正开放的人工智能”。 高级研究科学家 Jim Fan 在评价 R1 模型时这样说道:“我们生活在这样一个时代,一家不是美国公司的 AI 公司已经实现了创立之初的使命——做真正开放的前沿技术。研究并赋予每个有能力的人。”

凤凰网科技在之前的文章《英伟达最大短板浮现》中详细介绍了深搜(英伟达)及其系列大模型的核心竞争力来源。现在看来,的创新含量还在不断上升。

随着中国的创新实力成为世界范围内的热门话题,外界也越来越关注。这家中国本土科技公司及其背后的人有何特别之处?

浙大霸王勇闯无人区

1985年,梁文峰出生于广东五线城市湛江。他具体的童年成长轨迹已无从考证。从公开信息中唯一可以得知的是,梁文峰在接受采访时提到,他的父亲是一名小学老师。

2002年,17岁的梁文峰以优异的成绩考入浙江大学电子信息工程专业。 2007年,22岁的梁文峰考入浙江大学信息与通信工程硕士学位。师从向志宇,主要从事机器视觉研究。

中国DeepSeek发布推理模型DeepSeek-R1,性能比肩OpenAI,开启真正开放的人工智能时代插图

2008年,23岁的梁文峰在浙江大学攻读硕士学位期间,与同学组成团队,开始收集市场行情、金融市场相关数据以及宏观经济数据。今年,他带领团队利用机器学习技术探索全自动量化交易,恰逢全球金融危机爆发。

据悉,大疆创始人王涛邀请梁文峰一起创业。当时大疆创新还处于起步阶段。如果梁文峰加入,他或许也能在大疆的发展中实现财务自由。但梁文峰坚信人工智能会改变世界,最终决定独立创业。

2010年6月,25岁的梁文峰从浙江大学毕业,获得信息与通信工程硕士学位。毕业论文题目为《基于低成本云台摄像机的目标跟踪算法研究》。

硕士毕业第三年,28岁的梁文峰将人工智能与量化交易相结合,与浙江大学校友徐进创立了雅可比投资(杭州雅可比投资管理有限公司)。 2015年,他们共同创立了杭州欢放科技有限公司,即今天的浙江九章资产管理有限公司,并于次年设立了宁波欢放量化投资管理合伙企业(有限合伙)。

所谓量化投资,通俗地说,就是用计算机代替人,以量化的方式、程序化的方式发出买卖指令,从而使投资收益相对稳定。

几年后,魔方量化在国内迅速兴起。 2016年10月,魔方量化推出首个AI模型,第一个由深度学习生成的交易头寸在线执行。截至2017年底,几乎所有量化策略都是通过AI模型计算的。 2019年,欢放量化管理规模突破100亿,成为国内量化私募“四巨头”之一。

此后,魔方量化甚至成为中国首家市值突破千亿的私募量化公司。准确来说,也是业内唯一一家突破千亿大关的量化私募公司。在此期间,梁文峰在量化投资领域积累了雄厚的技术实力和算力资源。魔方量化以其强大的算力支持而闻名。

2023年,全球人工智能热潮爆发,梁文峰也进入了创业第十个年头。

当年5月,38岁的梁文峰宣布要打造通用人工智能(AGI)。 7月,杭州深搜人工智能基础技术研究有限公司()成立,专注于大型AI模型的研发。梁文峰也成为量化投资人中投资AI创业的“第一人”。

之后,出现了“AI世界的拼多多”的爽文剧本式崛起。就连大厂商也只能效仿。 “在豆宝和阿里云之前,他们是第一个在全网降低模型成本的。”一位AI算法工程师告诉凤凰科技,这给他留下了深刻的印象。

2024年5月,V2开源模型发布,业内掀起了价格战。 V2提供了前所未有的成本效益:推理成本降低至每百万代币仅1元,约为70B的七分之一,GPT-4 Turbo的七十分之一。

中国DeepSeek发布推理模型DeepSeek-R1,性能比肩OpenAI,开启真正开放的人工智能时代插图1

同年12月26日,仅仅7个月后,V3发布,再次颠覆业界对价格的认知。 V3的API定价为每百万输入0.5元(缓存命中)/2元(缓存未命中),每百万输出8元,与byte-pro-256k定价相同每百万输入5元,5元每百万产量。 9元级别具有可比性,性价比在国产车型中持续提升。

中国DeepSeek发布推理模型DeepSeek-R1,性能比肩OpenAI,开启真正开放的人工智能时代插图2

如今,当业界还沉浸在V3的震撼中时,-R1正式版又来了。这一次,确实引发了硅谷的恐慌。

微软首席执行官萨蒂亚·纳德拉 (Satya ) 在瑞士达沃斯世界经济论坛上表示:“我看到的新模型确实令人印象深刻。他们有效地开发了一种开源模型,该模型在推理计算方面非常有效,具有出色的性能和极高的超级计算效率。”

“我们必须非常非常认真地对待中国的这些发展,”纳德拉说。

最有价值的还是创新

“确实很出色,业内大家都觉得他们可能用了一些O1的数据进行蒸馏,但他们在算法层面做了更好的创新。”一位行业从业者认为。

成立一年多来,一直沉寂。据凤凰网科技介绍,该公司甚至没有公关团队。于是,大多数大型模特公司在争夺话语权和时间的时候,却在默默地尝试着创新。

创新也是自下而上的,几乎存在于整个公司内部。比如,时至今日,梁文峰的日常依然是看论文、写代码、参加小组讨论。他是公司领导者中为数不多的能力可与一线研究人员相媲美的人之一。

由于从一开始的目标就是 AGI,所以我们从未遵循该策略。也就是说,像其他商业公司一样,我们选择遵循世界上最先进的模式,并以短而快的方式应用它们。相反,我们在模型结构层面从 0-1 开始。的创新。

在接受《暗流》采访时,梁文峰也明确表示,“因为我们觉得现在最重要的是参与到全球创新浪潮中来。过去很多年,中国企业已经习惯了别人的技术创新”。 ,而我们采用应用货币化并不是理所当然的事情,我们的出发点不是趁机发财,而是走在技术的最前沿,推动技术的发展。整个生态系统。”

过去,由于人才构成和资本实力的限制,中国企业的创新往往很有限,但现在,字节这样的企业年利润高达数百亿美元。凤凰科技此前获悉,字节豆宝大模型团队已成立内部AGI长期研究团队,代号“Seed Edge”。

这意味着创新不再是问题。困难的是如何保持人才密度和信心。

据多位接触过的业内人士介绍,其优势在于人才密度极高,大部分来自中国本土市场。

“团队从一开始就有一百人左右,但大家都很抗拒。”一位AI行业猎头告诉凤凰网。 “其实Kimi早期也想走这条路,但并不是特别成功。”

另一位与该公司接触过的业内人士表示,“提供的薪资待遇非常有竞争力,这一直使得该公司对人才非常有吸引力。”

此前,据多家媒体报道,雷军亲自“挖人”,支付了数千万元的工资。此人就是罗福利,V2的主要开发者之一,95后。

根据量子位整理的信息,该团队最大的特点就是年轻。其中应届毕业生和在校学生尤其是北清学生非常活跃。

“只招1%的天才,就能做99%中国企业做不到的事情。”面试过的应届毕业生是这样评价其招聘风格的。

这也使得全体员工能够保持最终的创新动力。

梁文峰在接受《暗流》采访时也表达了一个观点:招人的时候,主要是看能力,而不是经验。 “我们的核心技术岗位基本上都是应届生和毕业一两年的人。”而梁文峰也表示,“V2模式没有海外归来的人,都是本地人。前50名的顶尖人才可能不在国内,但也许我们可以自己造出这样的人。”

与上一代的成功故事不同,它代表着一个硬核创新时代的到来。上一代的成功人士都属于互联网。他们在技术层面并没有取得太多突破。他们更关注速度、资本和规模。

一个令人欣慰的信号是,这并不是一个孤立的案例。同样来自杭州本地市场。玉树科技最新推出的机器人B2-W也令全球惊叹。御数科技创始人兼CEO王星星,本科毕业于浙江科技大学机械与自动控制专业。大学期间主修机械与电气工程。本科毕业后,他进入上海大学攻读机械工程专业研究生学位。

我们也有理由相信,中国科技创新的故事已经翻开了新的一页。

参考

1.揭秘:中国科技理想主义更极端的故事,浪潮的暗流,作者:余丽丽

2、整个互联网都在追捧的团队,就是撑起天空的清北应届毕业生,量子比特

3、创始人梁文峰,广东人,仅靠一百名中国程序员奋起直追,一封CEO的信

本站候鸟号已成立3年,主要围绕财经资讯类,分享日常的保险、基金、期货、理财、股票等资讯,帮助您成为一个优秀的财经爱好者。本站温馨提示:股市有风险,入市需谨慎。

相关推荐

暂无评论

发表评论