MSN中国首页|Outlook邮箱|OfficePLUS微软官方模板

MSN中文网 > 首页 > 数字家电 >正文

正文

分享至新浪微

转播到腾讯微博

转播到腾讯微博

无声语音识别暂难成消费级产品

2019-02-20 16:00:36 责任编辑：出处：科技日报刘艳

　　原标题：无声语音识别暂难成消费级产品

　　世界知识产权组织（WIPO）日前公布了一项微软申请的“无声语音输入”（Silent Voice Input）专利，丰富了“机器听懂人话”的场景。

　　虽然还很难判断使用者能否接受该专利的另类语音输入方法及该专利的市场前景，但很多看似天马行空的研发往往孕育着巨大的商机，如果它们能找到正确的市场和恰当的推动方法。

　　验证了语音交互技术的又一种可能

　　语音识别技术离完美还很远，噪杂的环境、吐字不清的词汇、俚语及方言都会让机器陷入混乱，开发更精准更私密的语言识别技术，仍是包括微软在内的产业和学界的主要科研方向。

　　通常情况下，语音输入首先要发出声音，其次需要一个相对安静的环境。根据微软这项专利的说明，只要让麦克风等设备靠近嘴巴，该语音输入解决方案就能捕捉到极低的，如同耳语般的声音信号，并过滤掉周围的杂音。除自己之外，别人听不见或听不懂。

　　当然，说话方式可能需要练习。一般情况下，我们讲话时吐气，微软的解决方案要求使用者在吸气时执行语音输入。

　　此外，尽管语音输入的性能持续被改善，但除了“调戏”siri，很少有人会在公共场所一本正经的用语音输入，怕打扰别人，也有语音内容私密性的顾虑。在这种情况下，微软的专利不失为一种妥善的解决方案。

　　而麻省理工学院的研究人员开发的新型人机接口“AlterEgo”则更为魔幻，骨传导耳机环绕用户的耳朵和下巴，计算机系统处理并翻译耳机接收的数据并输出反应，如同人们在阅读时的“默念”。

　　这个系统有点像“肌电假体”，当你准备作出某种行为时，大脑会告诉肌肉怎么做，同理，当你想着某个词时，大脑会向面部及喉部肌肉发送信号。

　　主要研究人员Arnav Kapur表示，他们的初衷是将人类和机器以某种方式进行混合，仿佛人类自身认知的内部延伸。

　　如果这台设备真的能商用，确实意义非凡。但是，当前的无声语音识别都处在技术验证阶段，这究竟是一种无用的“情怀技术”，还是可演变为用于特殊场景的产品，尚待业界探索。

　　工程师们还在努力弥补语音技术缺陷

　　语音技术不仅具有典型的“赋能”特征，更是当前人们与人工智能互动的最重要界面，已同焦土战般激烈的“百箱大战”给语音技术市场带来很多幻象。

　　事实上，现在大多数基于语音技术的硬件产品与智能服务交互体验仍然存在很多缺陷，研究机构与产业公司还在技术研发层面不断努力完善。

　　微软全球资深技术院士、微软云与人工智能事业部负责人黄学东博士，是微软语音技术的创始人，微软的语音识别、语音合成技术研发团队都由他一手组建。

　　在黄学东的带领下，2016年10月18日，微软语音团队识别研究团队在 Switchboard语音识别基准测试中刷新自己的纪录，词错率低至5.9%，达到了人类的水平。

　　306天后，这一纪录再次被微软刷新，词错率降低到 5.1%，超过专业速记员的误差水平，被学术界看作是“人工智能在感知上的一重大里程碑”。

　　微软全球执行副总裁沈向洋说：“尽管这项语音识别系统还存在一些应用场景的限制，但我相信未来几年内，机器将会完全超越人类的识别水平。”

　　尽管各类科研机构为了实现语音识别准确率的“人类对等”，奋斗了二十几年，但目前在嘈杂环境下较远的麦克风的语音识别、方言识别、训练数据有限的特定说话风格或较少人使用的语言的语音识别等，都未达到人类水平。

　　与此同时，Switchboard虽然是全球语音研究人员用了20多年的通用测试数据集，很多技术公司与组织在上面做语音方面的相关研究，它有着全球开发人员多年来的技术积累，但并不意味着测试结果可以“平移”到现实环境中。

　　如黄学东所说，公开性的测试、发表的学术文章，与现实产品虽然不能完全割裂，但消费级产品与商业场景，需要不一样的评判标准。

热点推荐

云南西畴多措并举
国家重点研发计划上海启动致力攻克自发性... 华夏幸福：新旧业务拉扯,船大难掉头... 知名主播大乱斗！《炉石传说》“双人现开... 全国夏粮又获丰收总产量较上年增长2.1%... 学慧网荣获2018京东教育合作伙伴大会万众... 清明时节雨纷纷你见过《逍遥情缘》中的瓢...: 天弘基金谷琦彬：

要闻回顾更多>>

今日围观更多>>

家居房产更多>>

艾普奖|庄子峰荣获2　　ITALIAN MODERN　　设计，重塑生活的一种方式。　　以独特、…

生活时尚更多>>

上上卤剁椒拌饭瞄准现代生活中年轻人追寻的都是快节奏的生活，这就是这个时代特征，…

图文快讯

频道推荐

电脑音箱推荐——Denon推出支持3D音效的高级回音壁音箱

电脑音箱推荐——De

国际高端家电gorenje邂逅2021AWE，品鉴艺术套系家电之美

国际高端家电gorenj

国际高端家电gorenje牵手顶级足球俱乐部巴黎圣日耳曼

国际高端家电gorenj

国际大师设计、高端欧式体验，gorenje古洛尼闪耀“Design Shanghai”

国际大师设计、高端

2020双11新机遇：躺平设计家携3D黑科技引领家居品牌 “数字变革”

2020双11新机遇：躺

一个假洋鬼子的前世今生：也潜伏到智能马桶座圈

一个假洋鬼子的前世

严性能值的“双高”海尔除醛净化“星”持续走红

严性能值的“双高”

这便于清洁机器人？要选择如何清洁机器人

这便于清洁机器人？

体育/教育

汽车视界

潜心打磨缔造唯一劳斯莱　　Bespoke高级定制的幻影长轴距车型——幻影“…

金融财经

数码酷玩

三星Neo QLED 8K电视，和这 　　在2021年国际消费类电子产品展览会(CES)上，三星在“First Look”…

三星电视：做时代的引领者 　　家电圈近期最值得期待的看点非三星电视莫属，除了一系列科技大片即视感的VLO…

影创科技集团董事长孙立荣 2019年度商界青年领军者获奖人——爱库存联合创始人冷静女士为孙立颁奖....…

共绘XR文旅蓝图，影创科技 此次战略合作签约仪式意味着双方建立起长期战略合作伙伴关系，影创科技与江西旅游…

南昌市工商联党组书记熊冬 调研组一行在体验 5G+MR 全息智慧教室后对其丰富、直观、立体的教学形式表示赞许…

游戏世界

《少年三国志2》共筑军团 今天要给少年们介绍的就是中的军团玩法，快点跟紧队伍，不要走神…

版权声明 | 网站简介 | 网站律师 | 网站导航 | 广告刊例 | 联系方式 | Site Map
MSN中国(MSN.SH.CN)版权所有，未经授权禁止复制或建立镜像