魔法!人类和海豚能够真正实现跨物种的交流吗?呢
4月14日,当地时间(也是世界海豚纪念日),首席执行官Picha兴奋地宣布:
为了突出关键点,该海豚模型只有400m参数,该参数很小,可以直接在 Pixel 9手机上运行。
皮希还说,预计将在今年夏天开源以促进科学合作。
该消息也很快吸引了许多网民,并且评论部分充满了完整的“哇声”:
更有趣的是,这次和这个老敌人再次面对面,GPT 4.1在那里释放。
一些网民直接评论:GPT 4.1非常好,但我对此更感兴趣。 (您知道如何拉和踩狗)
模型破裂海豚尖叫
这次发布的基本AI模型可以学习海豚的人声结构,并在训练后生成类似的声音序列。
这类似于通过识别输入海豚音频,预测可能后续的声音并最终解锁这些声音的潜在含义,从而预测大语言模型中的下一代币。
根据引言,该模型使用独特的音频技术。
其中,单词分割可以迅速将海豚声音变成一个可以由计算机理解的信号,然后通过适合处理复杂序列的模型体系结构进行处理。
当然,除了培训技术外,最重要的部分是获取数据。
这次,已咨询了WDP(WILD)进行合作,该机构研究了海豚学会已有数十年了,并且拥有非常丰富的数据集。
具体来说,自1985年以来,WDP研究了巴哈马的跨代野生大西洋斑点()社区。
通过这一“世界上最长的水下海豚研究项目”,积累了数十年的水下视频和音频,并且每个海豚的身份,生活史和观察到的行为都仔细匹配。
例如,以下可以连接海豚声音和行为的示例:
下图显示了第一种情况。
左图:斑点海豚的母亲在觅食时观察了她的小狗。小狗完成觅食后,它将带着自己独特的哨子回电。
右:通过频谱图显示的哨声。
因此,最终,它是基于WDP的大西洋海豚声学数据库,用于广泛的培训。
另一方面,除了研究海豚的交流方法外,WDP还进一步探索了“人类计算机相互作用”方法。
该机构与佐治亚理工学院合作开发了水下应用程序聊天(),该聊天不是直接解释海豚的复杂自然语言,而是构建一组简单的共享词汇。
具体而言,聊天将生成的合成哨声与研究人员使用的海豚,海藻或围巾等海豚般的特定物体联系起来。
然后,通过人类的教义,自然好奇的海豚学会模仿这些哨子以要求这些物品。
最终,随着对海豚自然声音的更多了解,这些声音也可以添加到系统中。
聊天图
总而言之,聊天设备可以通过水下扬声器和麦克风进行声音传输和接收,从而通过模仿海豚发出的哨子来创建基本的通信桥。
表示,Pixel 6(由于2021年10月发行)已经可以实时处理高保真性海豚声音分析,并且即将到来的Pixel 9(原定于2025年夏季使用)将在此基础上升级。
还有一件事
有些人也很好奇为什么选择海豚而不是更常见的猫和狗学习?
尽管官员没有清楚地提及这次的原因,但在审查了广泛的研究材料之后,可以得出一个结论:
这是因为海豚的“语言”与人类语言高度相似。
一项发表在《真实社会生物学新闻通讯》上的研究表明,海豚以与人类接近的方式相互交流。
当某些海豚发出像哨声一样的声音时,这些声音会被特定组织中的振动发出,后者以类似于人类和许多陆地生物的声带振动的方式起作用。
彼得·麦德森(Peter )曾经说过:
实际上,与海豚类似,还在2024年9月推出了鲸鱼声音识别模型,该模型可以识别八只鲸鱼的独特呼叫,并很好地区分了其中两种的不同声音类型。
鲸鱼就像海豚一样,它们的语言与人类语言相似。
今年早些时候发表在《科学》杂志上的一项研究惊讶地发现,通过模仿儿童的语言学习,鲸鱼的歌声与人类使用的声音具有统计相似之处。
这一发现不仅揭示了鲸鱼歌曲的一些秘密,而且还提供了一种新的观点,可以理解跨物种交流甚至AI语言模型。
可以看出,首先考虑了这些物种更接近人类语言的物种。
但是不用担心。从和首席执行官揭示的想法来看,也许下一个是狗。 (Doge)
本站候鸟号已成立3年,主要围绕财经资讯类,分享日常的保险、基金、期货、理财、股票等资讯,帮助您成为一个优秀的财经爱好者。本站温馨提示:股市有风险,入市需谨慎。
暂无评论