光有好的技术是没用的,一年过去了,没有了“AI滤镜”,商业化进程才是关键。
文|《中国企业家》记者孔月欣
责任编辑:马继英
图片来源:受访者
在2024年世界人工智能大会(WAIC)的展位上,出现了戏剧性的一幕:当记者提到一名员工的真实姓名时,公司同事很难将其与员工本人联系起来。
这和管理方式有关,在公司内部,同事之间只叫昵称,很多人的微信昵称也是昵称,对于创始人严俊杰,员工也叫他IO(昵称)。
在员工眼中,颜俊杰是一位非常友善的管理者,说话轻声细语,脸上总是挂着笑容,在展台上和媒体交流时,他始终保持着倾听的心态,说话慢条斯理、语速缓慢。
作为一位低调的科技创业者,闫俊杰曾担任商汤科技副总裁、研究院副总裁、智慧城市事业群CTO等职务,2021年12月,商汤科技上市前夕,闫俊杰离开商汤科技,创办了百度。
明势资本早期投资人、创始合伙人黄明明认为,从创业的时机来看,闫俊杰是真正相信AGI的。
目前,A+轮融资已完成,最新一轮融资由阿里巴巴领投,金额达6亿美元,公司估值已超过25亿美元,其投资者还包括腾讯、红杉中国、高瓴资本、IDG、米哈游等。
从创业第一天起,颜俊杰就坚持两条腿走路:模型和产品。在他看来,一切都以技术为基础,只有把大模型基地建起来,才能“种出”更多有价值的应用。
因此,在2023年6月,当国内大部分公司还在迭代密集模型、MoE(混合专家系统)模型还没有成为行业共识的时候,他们把80%以上的精力押注在了MoE上。
虽然过程坎坷,但颜俊杰最终做出了正确的选择。
2024年1月,国内首个基于MoE架构的千亿级参数模型abab 6发布;4月底又快速迭代推出abab 6.5系列模型。在各项核心能力测试中,abab 6.5也接近GPT-4、-3、-1.5等国际领先的大语言模型。
探索萌系带来的好处不止于此,在颜俊杰看来,这段经历让他们不局限于做公开的事情,也敢于去做天花板更高、需要自己探索的事情。
不过,颜俊杰也认为,光有好的技术是没用的,一年后,一旦失去“AI滤镜”,人们就会从商业角度来评价这家公司。“我觉得短期内最重要的是AI技术的进步,一年后,商业化肯定非常重要。”
2024世界人工智能大会上,闫俊杰接受了《中国企业家》等媒体的采访。
以下为采访内容编辑版本:
价格竞争不是坏事,它可以推动技术创新
问:您对世界人工智能大会的第一印象是什么?
闫俊杰:大会的主题是安全治理,提出这些问题还是挺及时的,比如AI安全、治理、版权等等。如果我用你的新闻来做训练,算不算侵权?我觉得这些都是很迫切的问题。
我们确实在去年就开始遇到这样的问题了,面对这样的问题,单靠一家公司是不可能解决的,比如拿文章做培训,算侵权吗?如果侵权,是侵犯平台的权利还是侵犯文章作者的权利?
问:您现在开始思考这些问题了吗?
颜俊杰:我没有想过,其实是遇到过。比如在海外,有好几家公司起诉我们。在中国,我们也开始遇到类似的挑战。
例如,训练数据。你的模型是否使用公开数据?如果数据很快出来,并且你的模型受益,你是否应该向提供数据的人付费?
另外,还有监管问题,比如模型的输出是否超过红线?如何计算?
比如说,如果你要付费使用一个语料库,但是如果用这个语料库训练出来的模型说错了话,提供这个语料库的人要不要赔偿?这样的问题还有很多。
坦白说,这个问题不是一家公司就能解决的。首先这得由政府来组织,有时候会涉及到不止一个国家,可能还有海外的用户,有相应的数据。其次,就算只在中国,我觉得技术已经向前迈了一步,但各项法律法规还是要跟上。
问:有些从业者觉得国内竞争有点太激烈了,国外可能没那么激烈,您觉得是这样吗?
颜俊杰:我觉得海外竞争很激烈,我觉得核心还是中国和美国的基本面不一样,比如美国最好的模式明显比中国最好的模式要好,这是事实,海外公司的品牌也比中国公司的品牌要好,至少海外公司是这样的。
但它也有缺点,就是没有工程师奖金。比如同样价值30亿美元的公司,中国公司的工程师数量肯定比硅谷多很多。虽然顶尖的可能还有差距,但平均水平其实更强。
如果把平均水平乘以工程师数量,那么同等水平或者同等估值的中国公司肯定拥有更多的工程师。
问:主要是关于人才吗?
颜俊杰:对,我个人认为中国确实有工程师奖金,这是客观事实,差距可能不是30%、50%,而是3到5倍。
第二,在移动互联网时代,中国公司有很多优秀的产品和业务,其实是非常强的。所以我觉得,虽然我们一开始没有品牌优势,没有技术优势,但是我们可以有工程师红利,还有很多其他的积累,其实就是“田忌赛马”。
问:您如何看待行业头部效应日渐明显?
颜俊杰:其实中国的情况没有美国这么明显,你看看美国那些创业公司,Adept等都没了,AI可能也快没了。
问:你对人工智能有什么看法?它们有点像你们的产品。
颜俊杰:今年你可以看到他们的很多功能都是基于我们的,我觉得这就是工程师的红利,商业化肯定是很重要的一个事情。
问:它们未来还会继续被大公司收购吗?因为它们很难维持下去。
颜俊杰:我觉得他们(美国创业公司)被大公司收购了也没关系,很正常,他们也不觉得自己失败了。
Q:作为一家初创公司,你们是否有这样的担忧?
颜俊杰:我觉得核心还是自主开发。因为不管一个公司独立不独立,核心还是看你给用户创造了多少价值,这个是最本质的东西。不管怎么样,本质还是看你的技术有多好。好的技术加上好的用户服务,才是最本质的东西。
问:与国外相比,在中国需要解决哪些挑战?
颜俊杰:坦白讲,我觉得国内大部分企业还没有形成差异化,车型水平、产品都差不多,所以会变成价格竞争。但我不觉得这是坏事,其实倒逼大家在技术创新上做得更好。
问:主要的区别是什么?
颜俊杰:我觉得这个并不是说要和别人不一样,根本原因还是想有什么东西或者有某个问题,然后针对这个更大的问题去努力,这个过程自然就会有差异。
问:你最大的问题是什么?
颜俊杰:我觉得这个很明显,我们需要渗透更多的用户,在这个过程中,我们需要在技术上更加先进。
技术为先,三年后将出现APP
Q:主力机型是C吗?C和B的规模完全不一样。
颜俊杰:我们C的规模现在比别人大很多。
问:有的竞争对手可能会明确说to B占80%,to C占20%,你们有这样的比例定位吗?
闫俊杰:我们没有这个定位,我们只有一个点,就是用户渗透率,简单来说就是我们的模型被使用的次数。
问:你们同时在做效率产品和娱乐产品,你认为这两个产品哪个会更快推出?
颜俊杰:技术其实是在不断进步的。比如说一年之后的技术很可能就不是现在的技术了,而产品的体验很大程度上是来自于模型的能力。所以基于假设,我觉得很有可能明年最大的产品可能就不是现在的产品了。
问:但是星野,你们现在跑得很快。
颜俊杰:我觉得今年DAU最大的产品可能到年底在中国有1000万DAU,我们今年的目标是做一个1000万DAU的产品,但明年可能会有一个1亿DAU的产品,可能不是现有的产品,可能是另外一种形式。
Q:你们现有的产品明年不会达到1亿DAU吗?
颜俊杰:我觉得我们现在的产品应该可以达到几千万的DAU,但是还达不到几亿的DAU。
问:您认为我们现在还看不到APP(杀手级应用)吗?
闫俊杰:比如说抖音现在大概有6亿DAU,今日头条有1亿DAU,今日头条算APP吗?
但是在今日头条之前,当时最大的是内涵段子,可能有2000万的DAU,这算吗?
如果我能成为这个时代最大的APP,或者AI时代最大的APP,我觉得我还有很大的机会。但现在这个APP肯定没有那么大,我觉得可能要三年才能火起来。不过没关系,当你能成为第一的时候,你的能力更强,你的资源更多,你的技术能力更好,你大概就能成功。
我们要一步一步来,我不认为我现在做的会是三年后的APP。
Q:完成MoE之后,您认为下一步应该朝什么方向发展?
闫俊杰:我们做了很多技术上的创新,不只是 MoE。比如说对如何让它支持无限上下文做了一些改进;对我们的合成数据也做了很多改进。我觉得 MoE 给我们带来的好处不仅仅是 MoE 本身,对我们最大的价值是当有一个方向可以提升几倍,但是它不开源,没有公开的东西的时候,我想凭借自己的能力做出比它好几倍的东西,这个过程里面的收获是比较大的。
我们完成这个任务之后,现在有一些比较新的技术,比如如何支持无限长的图上下文,如何创建合成数据,如何训练精度更低的模型,这些事情我们都敢做。
这意味着我们不会局限于只做公益的事情,我们敢于做天花板更高、需要自己探索的事情。
问:你们会开发新产品吗?
颜俊杰:以前我们不敢做,但是教育部出来之后就敢做了。我觉得教育部出来之后,我们基本上就更敢于做大(创新)。
视频可能会在下个月发布,而且在兴业、海螺AI也可能会有应用场景。
问:你有没有和 Sora 做过比较?
颜俊杰:是的。
问:Sora 还没有公开,你们如何进行比较?
闫俊杰:我们不是靠算法去评价模型的,我们公司里面有一些非常专业的视频创作者、音乐创作者。比如音乐模型的运营者就是非常专业的音乐创作者,视频模型的评价者就是非常专业的视频创作者。比如我们生成40首歌给他盲听,看他觉得哪首好听,哪首不好听。当他分不清真实音乐和AI生成的音乐的时候,它的能力就足够强了。
问:现在有文声文、文声音,很快还会有文声音乐,这三个方向哪个能最快在全国做到顶尖?
闫俊杰:我们的文声语音现在是业界最好的,但是我觉得没那么重要,文本模型才是最重要的,如果文本模型能提高10个点,其他模块自然也能提高,语言模型还是最本质的,其他的东西其实都是自然衍生的。
问:这是否意味着 的音乐和视频将于下个月一起发布?
颜俊杰:更重要的是我们的文本模型变得更强大了,我们只是把音乐和视频当做副产品去做了。
Q:好像有一个专门的团队在制作视频。
颜俊杰:这个东西在中国也一样,做GPT的团队可能有几百人,几万张卡;但是做视频的团队可能只有十几个人,只有一千张卡,其实是非常少的,但是在中国,大家都觉得很多,其实不然。
问:您短期内最具体的一两个目标是什么?
闫俊杰:首先是错误率。我们的错误率还有降低的空间。包括GPT-3,为什么没有那么多用户?原因就是错误率太高了。
问:现在发布 GPT-5 的标准是什么?
颜俊杰:我觉得一个标准就是错误率能够变得比较低,比如说错误率变得3%左右。
问:在商业化方面,你们的首要目标是什么?
颜俊杰:用户规模。
Q:如何平衡技术与商业化?
闫俊杰:你的技术是否在线决定了你是否是一个合格的AI公司,如果技术不够好,就可能会被淘汰。
但光有好的技术是没用的。现在(大家)还有AI滤镜,但一年后可能就不完全是技术问题了,公司可能要从商业角度来看。所以我觉得短期内最重要的是AI技术的进步,一年后商业化肯定很重要,其实这方面的进步也很快。
新闻热线及投稿邮箱:
本站候鸟号已成立2年,主要围绕财经资讯类,分享日常的保险、基金、期货、理财、股票等资讯,帮助您成为一个优秀的财经爱好者。本站温馨提示:股市有风险,入市需谨慎。
暂无评论