达人网-万达广场社区-全球最劲爆的达人俱乐部

 找回密码
 立即入住
查看: 943|回复: 0
打印 上一主题 下一主题

百度深度语音识别系统入选MIT2016十大突破技术

[复制链接]
跳转到指定楼层
楼主
发表于 2016-2-24 18:33 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
2月23日消息,美国权威杂志《麻省理工评论》日前将语音接口列为2016年十大突破技术,新一代深度语音识别系统Deep Speech2作为百度硅谷人工智能实验室(SVAIL)最新的研究成果也位列其中。
百度深度语音识别系统入选MIT2016十大突破技术 - 万达广场社区 - 4BC67E19C31D7E82C8C2485C7611ED9C.jpeg
蓝鲸TMT网讯,同时入选的还有免疫工程、精确编辑植物基因、DNA商店、太阳能电池工厂、特斯拉自动驾驶、可回收火箭,及空中取电、知识分享机器人、slack通信软件等产品和技术,分别来自谷歌、微软、SpaceX等多个领域的知名前沿科技公司,和加州大学伯克利分校、华盛顿大学、首尔大学等科研机构。值得注意的是,百度的这款系统是本次评选入选的唯一一家来自中国科技公司的科技成果。

《麻省理工评论》在文中评价表示:“随着百度在语音技术方面的不断进步,语音接口变得更为实用和有效,人们可以更为便利的与身边的设备进行互动。百度的深度语音识别系统(Deep Speech 2)包含了一个非常大的、“深”的神经网络,它引入了数以百万计的转录语音。有时它在识别汉语语音片段方面,要比人为识别更加准确。”

早在2014年底,百度的首席科学家吴恩达及其团队发布了第一代深度语音识别系统Deep Speech,该系统使用了端对端的深度学习技术,在噪音环境下,Deep Speech系统出错率要比谷歌、微软以及苹果的语音系统低10%以上。此外,研究人员还加入了汉语语音查询功能,识别准确率高达94%。这也推动端到端的深度学习算法成为业内改进语音识别最重要的手段。

深度语音识别系统的成功,很大程度上要取决于百度规模庞大的基于GPU的深度学习基础设施。通过使用批处理技术将DNNs部署在GPUs上,Deep Speech的语音识别表现出了极高的训练效率。目前,该系统支持超过26万亿次浮点运算,可在几天内完成深度语言的集中训练。

随着百度在语音技术方面的不断进步,语音接口变得更为实用和有效,将深度语音模型在更小的系统上运行是重要的趋势之一。百度正致力于将该语音模型缩小并植入手机等移动设备,未来,人们可更为便利的与身边的设备进行交流互动。

来源:蓝鲸TMT网

免责声明:本文仅代表作者个人观点,与万达广场社区无关。其原创性或转载以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容,如有发现有任何问题或侵权行为请联系:http://www.wandaclub.cc/ 处理,我们将在24小时内给予删除,并向所有持版权者或相关主体致最深歉意!


您需要登录后才可以回帖 登录 | 立即入住

本版积分规则

关于我们|触屏版|万达广场社区_达人网 ( 京ICP备12002076号-1 京公网安备 11011502002931号 )

GMT+8, 2026-6-11 20:48

快速回复 返回顶部 返回列表