人工智能的自动语言识别能力大大提升了

2017-11-03 11:25阅读:43

作者 : 千讯咨询   来源 / 本站整理

字号

千讯咨询发布的《中国人工智能市场发展研究及投资前景报告》显示,人工智能(AI)设备已经能处理来自独立个人的请求,但跟我们一样,它们在嘈杂的鸡尾酒会上或几个人同时发言的情况下,也会感到“纠结”。美国剑桥三菱电机研究实验室的研究人员开发出的声音识别AI设备,能实时分离多个声源,大大提升了自动语言识别能力。

这项技术首次在日本东京先进技术综合展览会上公开展示,被团队称为“深度聚类”机器学习,可识别多个声源“声纹”中的独特功能。然后,将每个演讲者声音的不同特征组合在一起,允许它从多个声音中将特定特征的声音选出来,最后重建每个人的话语。智能技术使用了多名人士讲的英语进行了培训和学习,即便说话人是日本人,也能轻松地分辨出来。

据介绍,传统识别语音的方法,利用两个收音器模拟听众两耳朵的位置,只能达到51%的准确性,形成的“鸡尾酒会效应”困扰了AI研究几十年。

新智能系统可以将两个人的语音成功分离,而且,重建单人语音的精确度高达90%,新技术可帮助家庭和汽车更好地执行智能任务,一次可分离多达5个人的声音,可用于电梯、空调机组和家用产品的智能操控。

相关研究报告:

人工智能项目可行性研究报告

中国人工智能行业发展趋势分析预测报告

中国人工智能行业发展研究报告

广告、内容合作请点这里:
关于我们| 组织与团队| 产品与服务| 客户案例| 媒体合作| 寻求报道| 加入我们| 常见问题| 联系我们| About Us

全国统一热线:400-650-6508 / 400-118-6508 / 400-835-6608 / 010-58769018 / 010-58769098

可行性研究/商业计划书专线:400-650-6508    IPO咨询专线:400-118-6508    产业园区咨询专线:400-835-6608

地址:北京市朝阳区光华路5号世纪财富中心西座六层    邮编:100020

版权所有 千讯(北京)信息咨询有限公司 [京ICP备09012209号]

Copyright © 2002-2025 Qianinfo.com Inc. All Rights Reserved.

法律顾问:北京市隆安律师事务所|周日利律师    媒体合作:010-58769098