妩妩资讯网

IBM宣布语音识别错误率接近人类水平

2020-06-30 16:49:03

undefined

3月10日消息,据IBM官网报道,人们在说话时,对方每听20个单词都会漏掉或听错1-2个单词。在5分钟的对话中,可能会听错80个单词。但我们多数人在听懂说话上没有问题。然而,就不一样了。

去年,IBM宣布在自然对话环境中的语音识别上取得重大成就:开发出单词错误率为6.9%的系统。此后,该公司不断取得进步。现在IBM宣布创造新的业界纪录:5.5%的错误率。这是对非常困难的语音识别任务:纪录人与人之间日常对话如“买汽车”,计算出来的结果。这种纪录的语料库被称为“SWITCHBOARD”,20多年来一直用于检验语音识别系统。

IBM研究人员在实现这个突破时,专注于应用深度学习技术,将LSTM(长短期记忆)和WaveNet语言模型与三个强大的声学模型结合起来。在被使用的3个声学模型中,前2个为双向6层LSTM,其中一个为多特征输入,另一个有对话多任务学习能力。最后一个模型有个独特的地方,其不仅能从积极的例子中学习,也能利用消极的例子,因此会变得越来越聪明,在重复出现类似说话风格时表现更好。

实现人类同等水准——错误率与2个人说话相当——长期以来都是行业的终极目标。行业里的其他人也在努力追赶IBM的纪录,一些人最近声称达到5.9%。在达到今天的成就过程中,IBM发现人类同等水准应该是错误率为5.1%。在确定这个数字上,IBM与合作伙伴Appen合作再现人类水平的结果。虽然IBM实现了5.5%的错误率是一次大的突破,但发现人类同等水准是5.1%证明要达到与人类相同水平还有一段距离。

在研究中,IBM联系了不同的行业专家,让他们对此事发表意见。蒙特利尔大学MILA实验室的主任Yoshua Bengio认同IBM还有很多工作要做才能实现人类同等水准。IBM意识到,发现人类同等水准的标准比原先想象更复杂。除了SWITCHBOARD外,还有另一个行业语料库CallHome,提供了不同的可测试的语音数据集。(木秀林)


电影123 http://www.dianying123.com

推荐
·《超时空英雄》iOS首测 卓越布局第四代卡牌手游
·IBM宣布语音识别错误率接近人类水平
·名校名师齐聚百度高考APP 互联网技术助力个性化备考
·环信移动客服亮相O2O EXPO,现场签约成功20余家O2O客户
·联想x故宫文创联名版上市 以东方审美获消费者青睐
·OLED屏幕需求太大 三星调用LCD电视生产线加造
·ofo小黄车App上线小游戏:暂时无盈利计划
·Android推出新功能:根据位置推荐应用
·搜狗汪仔现身QQ热聊,开启“群聊”技能带你分分钟“涨知识...
·网易尚品商城宣布12月31日关闭 上线不足一年
排行榜
·IBM宣布语音识别错误率接近人类水平
·已研发3nm工艺?传台积电2019年拟试产5nm工艺
·名校名师齐聚百度高考APP 互联网技术助力个性化备考
·环信移动客服亮相O2O EXPO,现场签约成功20余家O2O客户
·谷歌已展示实力 苹果会在WWDC大会上奋起反击吗
·联想x故宫文创联名版上市 以东方审美获消费者青睐
·OLED屏幕需求太大 三星调用LCD电视生产线加造
·杨超斌:华为已布局15000个5G基站
·完美世界飞流九天再创佳绩《射雕英雄传3D》斩获ios付费榜TOP1
·ofo小黄车App上线小游戏:暂时无盈利计划
图片
已研发3nm工艺?传台积电2019年拟试产5nm工艺
杨超斌:华为已布局15000个5G基站
关于我们   |   联系我们  |  本站导航   |   网站留言   |   本站招聘