MSN中国首页|Outlook邮箱|OfficePLUS微软官方模板
MSN中文网 > 首页 > 科技 >正文
正文
分享至新浪微 转播到腾讯微博转播到腾讯微博

论百度地图如何用AI让你和“汤唯”一路相伴

2019-01-23 22:00:03  责任编辑:  出处:[db:出处]

  自百度地图上线汤唯导航语音之后,已经有越来越多的人爱上了出行时和汤唯“对话”,但是你知道这么迷人的导航语音是怎样“炼成”的吗?在百度地图最近推出的“解密之作”——《“女神音”的诞生》中,来自百度地图的“技术大神”就亲自为我们解答了这个疑惑。

  “女神是在哪里录制的?”“语音包是一个字一个词录的吗?”“地图中的所有地名都要念一遍吗?”关于导航语音的录制,公众有着各种各样的好奇和困惑。正如视频中所说,日常陪伴我们的导航语音背后,真的是“大有学问”呢。

  一、汤唯的录制过程是怎样的?

  那些有趣的“语音彩蛋”来自哪里?

  公众对导航语音的录制过程可是充满了“奇思妙想”,甚至有人开玩笑地表示“汤唯是不是自己拿着手机录的呢。”其实不然,百度地图有专业的录音棚,且相比大部分音乐录音棚规格更高。专业的录音人员,可以对录音质量做全面把控,为用户打造更加真实的声音。而在一些语句的设计和朗读上,汤唯也会有自己的理解,声调的抑扬顿挫和语速的节奏掌握,都能收放自如。

  对于语音中的“小彩蛋”,这是独立于基础语音,专门为一些特定场景录制的。其中包括很多录音时女神的自由发挥,所以每一句彩蛋都称得上是“汤唯出品”。彩蛋的存在,让每位明星的语音都拥有了不同的“个性”。

  图示:工程师谈汤唯录制情况

  二、明星需要将地图中的所有地名和提示语都念一遍吗?

  不需要的,明星录制语音的目的是获取其声音特点,不需要把所有地名和提示语都念一遍。录制语句一般分为两种:一种是汤唯直接说给大家听的,比如“大家好,我是汤唯”;另一种是用来训练语音合成模型的句子。大家在使用过程中听到的大部分语音,是通过机器学习合成出来的,不是都来自明星本人录制的呦。所以,明星本人的录制量并不是很大。

  图示:工程师解读语音录制中的语句类型

  三、百度地图有什么“黑科技”,可以用汤唯的声音播报出来的地图上各种地点名称等信息?

  对于地图上各种无法预知的提示语句,比如没见过的地名,可通过终端实时计算实现用汤唯的声音播报。由于声音和文字,对于机器而言都是数字化的。语音合成模型可建立声音和播报内容两组数字之间的关系,通过一系列的计算,将播报内容的输入转化为声音的输出。在学习过程中,会建立一个神经网络模型,学习汤唯的声音特征和播报内容之间的对应关系。在合成时,它就可以读取导航语句,用汤唯的声音朗读出来了。

  而对于一些固定的导航提示语,可以通过计算密集的合成方法,将没有录制到的内容合成出来。这一技术合成的语音质量非常高,通常可以“以假乱真”。区别于地名和街道名,导航提示语比较固定且使用频率较高。因此对于这部分常用内容,百度地图可以通过AI技术预估合成进语音里,大大减轻了终端的计算压力。此次上线的汤唯导航语音自然又真实地还原了女神的“好声音”,难怪解密视频中不少公众都误以为是汤唯“一句一句录的”,甚至是“一个字一个字录的”。

  图示:工程师解读语音合成技术

  AI赋能下的百度地图正在从用户角度出发,想要做的多一点、再多一点。此次上线的“汤唯导航语音”,不仅以百度地图前沿的AI技术为支撑,还融合了汤唯本人的专业精神和情感元素。当“专业遇上专业”,便为我们带来了这一路相伴的迷人声音。

  2019年已经到来,就让女神汤唯为你导航,一路相伴吧!

频道推荐
体育/教育
汽车视界 金融财经
数码酷玩
三星Neo QLED 8K电视,和这   在2021年国际消费类电子产品展览会(CES)上,三星在“First Look”…
三星电视:做时代的引领者   家电圈近期最值得期待的看点非三星电视莫属,除了一系列科技大片即视感的VLO…
影创科技集团董事长孙立荣 2019年度商界青年领军者获奖人——爱库存联合创始人冷静女士为孙立颁奖....…
共绘XR文旅蓝图,影创科技 此次战略合作签约仪式意味着双方建立起长期战略合作伙伴关系,影创科技与江西旅游…
南昌市工商联党组书记熊冬 调研组一行在体验 5G+MR 全息智慧教室后对其丰富、直观、立体的教学形式表示赞许…
游戏世界
版权声明 | 网站简介 | 网站律师 | 网站导航 | 广告刊例 | 联系方式 | Site Map
MSN中国(MSN.SH.CN)版权所有,未经授权禁止复制或建立镜像