您的位置: 海东信息港 > 游戏

百度语音开放平台三周年逐日在线语音辨认调

发布时间:2019-05-15 05:36:02

11月22日,百度宣布在其语音开放平台上线三周年之际,向公众开放四项全新语音技术的接口,以使用户在使用语音与机器进行交流时,享受到更奇妙的交互体验。

百度公司首席科学家吴恩达在演讲中对百度的语音技术进展表示满意,他简单介绍了这四项深具革命性的语音技术,即情感合成、远场方案、唤醒二期技术和长语音方案,并宣布即日起百度将这几项技术免费开放给用户和开发者同享。

(百度公司首席科学家吴恩达进行现场演讲)

这些技术有很大的潜力,去完全改变人机交互的效率和办法。未来语音技术在很多运用场景有很好的机会,将为人机交互带来巨大的改变。吴恩达表示。

这些技术旨在解决用户在使用语音交互的场合时,普遍感到困扰的一些关键问题。例如,百度情感合成技术主要聚焦在为合成语音加入情感,目前可达到接近真人发声效果,百度今年早些时候曾利用此技术,复原已逝明星张国荣的声音。

类似地,开发者还可以利用新的接口,使语音辨认距离增加到米,将设备的语音唤醒率提升到95%以上同时更省电误报更少,或提升长时间语音识别的准确率问题。这将为语音技术带来远比现在更多的想象空间,而不只是遥控电视或解锁。

例如,前两者的代表是百度的小度机器人人机语音交互点餐,已在上海肯德基旗舰店投入应用,可远距离随时应答点餐。后者则已在诸多内容记录、智能客服、视频转写等运用场景表现出巨大的想象空间。

(极智开放共语未来百度语音开放平台3周年庆现场)

在这场名为极智开放共语未来的庆典上,来自斯坦福大学的人工智能专家James Landay,也分享了一项与百度合作的研究成果,该研究发现智能在语音输入时,输入速度比键盘输入快3倍。他表示,近两年,受益于大数据和深度学习技术的不断发展,语音辨认技术突飞猛进,速度及准确性都有了长足进步。

吴桂林打开视频运用爱奇艺的客户端,说VIP续费,系统准确跳转到了相应的充值页。这位爱奇艺技术总监指出,借助百度语音开放平台,每天有百万以上的爱奇艺用户使用语音搜索,其中80%以上转化为有效点击。

读者甘肃数码科技有限公司总经理金大时认为,语音开放平台的价值并不止于商业。读者数字农家书屋已在甘肃庆阳市试点成功,完成了65个新农村数字农家书屋。他表示,很多不识字的老年人和留守儿童,语音合成让他们也享受到了阅读的乐趣。

(百度语音开放平台宣布四大语音新技术开放)

目前,百度语音开放平台的合作伙伴已涵盖多个领域和场景,包括智能领域的联想、中兴;智能家居领域的长虹智能电视、康佳智能电视、SONY智能电视;汽车行业的特斯拉、途胜;智能设备领域的惠普、艾米通讯;智能服务领域的携程、阅读等。

语音是人类交流自然的方式,通过开放语音技术,百度希望可以引领语音功能产品的繁荣发展。吴恩达表示。

作为国内为开放的语音技术开放平台,百度语音开放平台自2013年10月上线以来,每日语音辨认要求从2013年的500万上升到今天的1亿4千万,语音合成每日请求达2亿,开发者数量超过14万。

在技术指标方面,百度语音辨认准确率目前已高达97%,居于全球。今年2月,百度深度语音识别系统Deep Speech 2入选MIT 201610大突破技术。包括语音技术在内的百度大脑,入选2016第三届乌镇世界互联大会15大科技成果,成为国内入选的综合型人工智能技术。

产后预防感染吃什么好
人流后恢复要多久
什么症状是产后感染
猜你会喜欢的
猜你会喜欢的