- 2018.01 中国每年有1800万新生儿,声联网想让机器听懂新生儿的语言
父母希望有效发现婴幼儿啼哭等声音,并了解背后的含义,同时获得相应的应对方法。
主要从事婴幼童音视频的行为分析和情感计算。
目前已研发基于人工智能技术的婴幼儿音频行为监护平台(BabyABAM),通过芯片和云后台,实现实时精确监测婴幼儿发出的啼哭等声音,并已经与国内一些合作伙伴达成了合作及合作意向,有望在软硬件终端产品中迅速落地这一技术。
团队表示,公司用来训练的婴儿音频数据超过了1000GB,上万小时的录音文档;采用了统计建模和神经网络建模的算法,目前的错误率可以低至5%以内,是国内可量产方案中最低的。
已经组建了包括技术、战略和育婴方面的顶级专家顾问团队。公司成立后,获得了中科院声学所、东南大学、北京理工大学语音实验室的大力支持,协助组建起了技术研发团队。
首席科学家颜永红是中科院声学所研究员、博士生导师、语言声学与内容理解重点实验室主任,美国俄勒冈OGI研究院终身教授,2002年入选中科院百人计划,Intel中国研究中心首任主任。
首席战略顾问倪光南是全国政协委员、中国工程院院士,联想集团创始人、首任总工程师,国家科技重大专项“核高基”相关项目主要负责人。
团队人工智能顾问Björn W. Schuller是德国慕尼黑工业大学博士,研究领域集中在机器学习、复杂系统、视听信号处理、人机交互、情感计算等,著有6本专著,在相关国际期刊和会议中发表过500余篇文章,被引用10000余次,被世界经济论坛评为40岁以下40位最杰出科学家之一。
母婴领域顾问郭建国则是中华育婴协会会长,国内久负盛名的实战派育婴专家,人力资源与社会保障部“育婴师职业”专家委员会专家,中国儿童基金会教育专家委员会专家,《育婴师职业师资培训教材》主编。
目前,声联网的这一技术,主要通过SDK软件包或AVS7516音频识别芯片的方式提供,两款产品都已经更新至2.0版本,可以对宝宝哭、笑、喷嚏、咳嗽、饱嗝等监测和分析,可适用于智能摄像头、机器人、小夜灯、智能音箱、智能摇篮、智能玩具等产品。产品推广方面,团队表示,SDK和芯片样品已经送至多家知名智能硬件制造商、母婴用品商、机器人公司进行测试,目前进展顺利。
声联网科技是由国内智能语音合成技术公司北京宇音天下科技有限公司、国内最大的可穿戴方案企业深圳金康特、新三板上市传感器芯片公司深圳贝特莱三家公司共同筹资注册成立,并获得了中科院声学所的投资入股。金康特和贝特莱两家股东方可以提供芯片、方案、客户、量产等多方面的帮助。
团队预计,最近几年的工作重心都会围绕婴幼儿语音做研究,目前已经实现了婴儿啼哭声的探测和捕捉,下一步会做持续的大数据分析,从而进行背后意义的解读,即婴幼儿情感、心理和健康趋势的解读。