吉文奇在4月18日报道说,本周,在2025年大阪堪萨斯世界博览会(大阪世界博览会),中国亭子是这个世界上最大的外国自我建造的博物馆之一中国馆之一,无疑已成为重点。
从“ Chang'e 5”和“ Chang'e 6”带回的月球土壤样品中,到了“ ”深潜水的经验机舱,一个代表中国科学和技术实力的“重力武器”的“重型武器”令人愉悦。在AI领域,中国馆还带来了一个引人注目的互动展览-共同创建的“ Ai Sun ”。
中国第一部彩色动画片《天上的伟大战斗》中的“太阳狼”的形象是中国人心中当之无愧的动画英雄。这次,随着的技术增强能力,“ AI Sun ”使用中文,日语和英语语言实时与观众进行交流,传播中国文化,并成为中国世界博览会中的“指南专家”,引入了真实的中国食品和古代诗,并在图片和文本中具有深刻的艺术概念。
这些出现的硬核技术和创新成就正在成为中国科学和技术实力的生动脚注。
1。“ Ai Sun ”转变为中国馆的宣传大使,并将语言自由切换到三个国家。
在1960年代,在上海艺术电影制片厂制作的“天堂宫的大麻烦”中,魔王的形象深深植根于人民的心中。为了反映传统文化和AI大型模型的结合,穿着一条老虎皮裙子移动了“ Ai Sun ”,并拿着金色的箍到世界博览会的中国馆。这个大型模型展览是由共同创建的。屏幕上“ AI Sun ”的外观效果令人惊讶。依靠的技术,语言互动和AI绘画功能使Sun 的“七十二个变化”技能变得实用和有形,吸引了许多观众进行交流和互动。
事不宜迟,让我们来看看大阪世界博览会中国馆的“ Ai Sun ”的出色表现。
进入国际舞台,“ AI Sun ”的外语能力自然没有问题。面对观众的问题,用中文,日语和英语的“ AI Sun ”自由切换,并顺利回答观众的问题。他不仅在多语言对话中很深刻,而且他对中文,日语和英语的回答完全忠于角色特征,即使说日语和英语时,他也可以保持与动画片中的角色相同的风格。
自世界博览会开放以来,就有无数的观众来访问,繁华的场地充满了人们。但是,即使在如此嘈杂的环境中,“ AI Sun ”仍然可以准确捕捉观众的声音并迅速给出准确的答案。可以看出,太阳旺旺的“听力”技能也非同寻常。
仅仅能够说外语是不足以反映“ Ai Sun ”的多功能性。它还可以“写诗歌和画”。与屏幕一起显示图片和文本,“ Ai Sun ”直接绘制了“古代诗的场景”“沙漠中的孤独烟雾是直的”。
Gao 说,团队致力于在数字人类和Spark Big 的问答能力上建立“ AI Sun ”的能力。基于为Sun 构建的3D模型,进行了大量的AI工作,这不仅使Sun Move,而且还结合了大型模型在答复,动作表现和与人互动方面恢复Sun 形象的能力。
为世界博览会定制的“ AI Sun ”已成为世界博览会上非常引人注目的“中国名片”。
2。拆卸“ AI Sun ”背后的技术守则
在“ Ai King”的强大能力之后,想要传达的是中国在AI中的深远积累。在当前的全球科学技术圈中,大规模模型能力的快速崛起已成为新的科学和技术竞争以及国际发展模式重塑的关键变量。
在“ AI Sun ”感到惊讶的“ AI Sun ”后面,一系列尖端技术的支持是必不可少的。
首先,在拥挤的场地,高噪声场景的演讲识别技术,允许“ Ai Sun ”听到足够清晰的声音。
在许多情况下,声音已成为人们的高频互动方法,但是在实际应用中,他们经常遇到许多问题,例如对嘈杂环境的不明确识别以及使多人语音识别感到困惑,这是语音识别领域“鸡尾酒会”的问题。解决此问题的关键在于处理“反噪声”技术,也就是说,如何在多人对话方案中准确识别多个说话者的声音。
的技术团队长期以来解决了这个问题。去年9月,在国际权威性事件和语音领域认可的“最困难的语音识别任务”中,在“会议室场景远处多人语音识别”()任务中赢得了所有两首曲目的第一名。它在2020年连续五次赢得了冠军,这标志着“鸡尾酒会”问题的重大突破。根据 Asia研究所主任Sun 的说法,团队在多个干扰噪声方案中实现了多频道语音识别和演讲者的分离。多通道轨道上的语音识别错误率()降低到10.8%,远远超过第二名18.7%,在细分的七个声学场景中的表现比其他团队更好。
Sun 还提出,提高语音识别精度的阈值集中在三个方面:数据,模型算法和复杂的环境处理。
具体而言,围绕输入方法,翻译机,智能驾驶舱,虚拟人类互动和其他相关方案积累了大量真实的多语言数据。基于上述语音识别场中的数据积累,结合了无监督的预训练和多模式融合技术,是第一个释放用于语音信号的空间时间和时间分离的空间语音建模方法,并改善了复杂环境中语音识别性能。
正是这三个维度的深层培养是在语音识别领域领先的。在去年的 Spark 4.0的新闻发布会上,一个讲话识别场景,其中三个人被别名并发表了惊人的首次亮相。
太阳金华透露,目前,的语音识别也可以在三人的混叠语音场景中获得86%的准确性。在-5db的信号到噪声的情况下,噪声比人的声音响亮得多,其识别精度可以达到85%以上,远远超过了语音识别模型-V3。
在大阪世界博览会期间,发布了一款新的双屏幕翻译机2.0产品,该产品解决了诸如高分辨率噪声干扰和多语言混合对话之类的疼痛点。它的1米声音障碍是降低降噪功能,使用户可以在嘈杂的环境中实时翻译。
第二个是多情感超级人性化语音合成技术,它高度恢复了Sun 的语音线。
实际上,这项技术并不神秘,并且已用于诸如MAP导航和数字人类声音之类的场景中。 Spark还在去年4月推出了“一句句子的语音复制”功能。用户只需要在一个句子中自定义AI助手声音,这大大降低了语音综合的收集成本。
Sun 介绍了“ Ai Sun ”通过语音模型解耦技术来控制合成声音的语气,完美地复制了Sun 的声音演员Li 先生,Sun 的声音演员在1986年的“ To to The ”的前五集中,并让Sun “ Learn ” “ Learn to Speak to Speak to clays as Speak ofers and and Conth”。这样,Sun 的声音在时间和空间上传播,并在当今世界博览会上与观众交谈。
At the same time, in order to make the of "AI Sun " more in line with the image of Sun in to the West, the R&D their multi-ring and role- based on the multi- model of Spark, and from the of , , , , and , the image of Sun , a 中文的名字,日语。
第三个是“ AI Sun ”的多模式相互作用能力。
大型模型的功能已经从单模式转变为多模式融合,并且具有生成图片,视频,音频等能力的大型模型正在又一个地出现。去年4月,推出了第一个“三合一” Spark多模式的互动模型,具有长文本,长文本和长声音,直接交叉模式的互动。
通过深入整合多模式的互动能力和超构形数字人类技术,“ AI Sun ”可以根据与游客的语音对话的内容产生丰富的运动和表达方式,以使每个动作与每个表达式都完全符合语言表达;同时,依靠 Spark模型的视觉处理图像理解和创造力,可以根据语义需求生成高质量的视觉内容,从而创建这个可以“写诗歌和绘画”的AI Sun 。
最后,可以自由地处理各种问题的“ AI Sun ”取决于的“奇怪问题”产品的技术积累多年。
在世界博览会上,“ Ai Sun ”的读书很精彩,可以轻松地解决观众关于中国传统文化和人文主义风格的各种问题。这项丰富的知识储备以及允许AI大型模型能够实现自由对话,对问题的准确理解,大量的科学知识和科学家的逻辑推理能力,也是在教育场景中持续积累的结果。
科学教育产品线总经理Liu Jun表示,产品的研发的最初意图是在学校调查中发现矛盾:学生的奇妙想法是无限的,但教师的知识储备有界限。当孩子提出有关跨学科甚至“普遍”问题的问题时,他们有时会敷衍,被教师忽略甚至责骂。因此,决心使用技术来“捕获”每个问题,并制造一种“随时满足儿童100,000的产品”。她补充说,依靠 Spark大型模型和数字人类技术,构建了AI虚拟图像,其中10位中国和外国科学硕士和文化名人,例如爱因斯坦()()和Li Bai(人文科学)。通过深厚的语义理解和多模式对话技巧,可以实时回答儿童的问题,并通过启发式问题和答案指导逻辑推理。截至2025年4月,“ Qi si Miao问题”已针对180,000名中学和中学生回答了超过362万个问题,而98.7%的孩子则获得了令人满意的答案。
这四个关键的技术代码以及多年的数据积累和实践经验的积累,构成了大阪世界博览会上生动的“ AI Sun ”,并以其强大的实力在这个世界博览会上变得很受欢迎。
3。根据国家生产计算电源基础培训,展示了中国的科学和技术实力
这次,“ AI Sun ”是世界中国博览会中唯一的大型模型展览,它不仅反映了在AI领域的长期积累,还反映了中国科学和技术发展的信心。
在2022年底,大型模型被猛烈袭击,迅速制定了计划,并以目标为“国家生产”布局。去年10月, Spark 4.0 Turbo释放出来,在各个方面都达到了七个超过GPT-4 Turbo的核心功能,其数学和代码功能超过了GPT-4O;今年1月,该行业首个基于国家计算电源平台培训的深入推理模型。
可以看出, Spark模型是从赶上先进的国际模型到基准或赶上赶上的一步。
此外,AI行业的发展正在迅速变化,但主要问题之一是计算能力生态系统的布局。因此,在理解这一行业趋势的同时,将同时促进基本模型的培训并建立国内计算能力生态系统。
2023年7月, Spark模型和华为的独立创新计算电源平台的结合开始了国家计算功率平台的构建。三个月后,启动了支持数万亿美元参数大型模型的第一个Wanka国内计算功率平台“ Star One”。 10月24日,由 ,和Hefei Big Data Asset Co.,Ltd。共同创建的国内超大规模智能计算平台“ Star 2”。
这也使 Spark Big Model成为唯一具有完整堆栈国内计算功率训练和双重推理实施的国内大型模型。
在AI越来越激烈地发展的那一刻,先前的技术布局和积累正在实现跨集成。其语音技术和大型模型的结合进一步扩大了业务方案,并逐渐将其转变为实际场景中软件和硬件服务的实施,并且已经在许多情况下实施了教育,办公室和医疗服务。以数字人物为例,一直在不断探索AI和数字人物形象的结合,从传统的电话客户服务,公司营销和其他领域逐渐将场景扩展到流行的文化传播轨道,这可以使AI大型模型技术能够在丰富的工作和生活场景中实施。这也是这次赋予“ AI Sun ”能力并成为该世界博览会上唯一的大型模特展览的能力的关键。
同时,这也是提供的全得分答案,它积累了很多钱。
结论:的剑正在炫耀其剑的全球AI竞技场
在大阪世界博览会上,“ Ai Sun ”的身影也是中国人工智能发展的生动缩影。它向世界证明,接受国家生产计算能力基础训练的国内大型模型也可以突破技术界限,并显示出惊人的互动能力和文化创造力。
这不仅标志着中国的人工智能产业从芯片,框架到应用程序建立了完整的生态链,而且还象征着在全球人工智能竞争中,中国正在发展成为一个“第二极”,它与全球最高水平的独立创新相等。 AI的发展不仅为传统的动画特征赋予了新的生活,而且代表了智力浪潮中技术力量的兴起。
4月21日, Spark的深度推理X1将再次升级。 Spark将继续在国家计算能力平台上进行训练,以对抗世界领先的技术水平。
本站候鸟号已成立3年,主要围绕财经资讯类,分享日常的保险、基金、期货、理财、股票等资讯,帮助您成为一个优秀的财经爱好者。本站温馨提示:股市有风险,入市需谨慎。
暂无评论