精准学将公布中国首个语音端到端大模型

作者:昆布
发布时间:8/23/2024, 8:44:59 PM

教育科技公司精准学宣布,公司已在AI语音交互技术上取得领先性的突破,成功训练了中国首个语音端到端大模型“心流知镜-s(V02)”,可直接实现语音输入-语音输出的交互,使其更适配辅学场景,使大模型达到“真人老师”级别的自然对话交流体验。

“心流知镜-s(V02)” 使用端到端语音结构,避免了级联ASR+LLM+TTS方式额外延迟,同时也更好的改善纯文本模型损失的情感节奏等丰富信息,接近人类的语音交互体验。

精准学也提供时间表开放基础模型供学术和非商用使用,致力于为中文AI社区的科研和技术探索作出贡献。

“心流知镜-s(V02)”的发布,不仅将在高质量中文语音Codec和中文自监督预训练Encoder基础设施上填补中文开源社区的空白,还将在全球范围内成为首个开放给技术社区的语音端到端大模型。

11.png

精准学将于近期对外展示这项技术的应用成果。5月,公司获得了阿里2亿元投资,目前其AI辅学机Bong系列已在天猫京东上线。不久后用户也可以在精准学AI辅学机上体验到这项技术突破成果。

1、本文是 芥末堆网转载文章,原文:
2、如果你也从事教育,并希望被芥末堆报道,请您 填写信息告诉我们。 填写信息告诉我们。
来源: 芥末堆
芥末堆商务合作:18710003484 王老师

编辑推荐