这是一场竞争激烈的国际大赛,同时也是是科大讯飞技术实力的展示。近日,在刚刚结束的Blizzard Challenge 2019 国际语音合成大赛中,科大讯飞再次夺冠,拿下了这一权威赛事的第14个冠军!
在语音合成界,Blizzard Challenge可以说是最具影响力和权威性的国际赛事,其冠军含金量非常高。自2006年参赛夺冠以来,科大讯飞就成为了这一赛事主要“垄断”方。尤其令人激动的是,在这一届大赛中,科大讯飞与中科大语音及语言信息处理国家工程实验室联合提交的系统,不仅夺冠,还在关键指标上创新高。
与往届不同,Blizzard Challenge 2019首次以中文作为比赛主任务。不仅如此,此次比赛还以罗振宇脱口秀风格声音作为合成样本,以故事、百科、诗词等文本为合成形式,再加上英文混读、儿化音等偏门难点任务。就难度系数来说,此次评测可以说是国际语音合成大赛“史上最难”。
然而,大赛内容设置的高难度对科大讯飞来说是相对的。从表中可见,科大讯飞在各方面的成绩表现都明显优于其他24家参赛系统。尤其是在自然度方面,科大讯飞从去年的4.0MOS,提高到4.5MOS,再创新高。而自然度则是合成系统最关键指标。
这意味着,科大讯飞的合成语音已经超过普通大学生的4.0MOS水平,愈发接近新闻联播主持人的5.0MOS。即便相比罗振宇真人的4.7MOS,科大讯飞的合成语音已经可以做到“真假难辨”。
科大讯飞有此成绩,并不出人意料。这份自信,不仅来自于过往连冠成绩,更在自身过硬的实力。自1999年创立开始,科大讯飞就专注研究,用技术改变世界。而在AI人工智能时代,科大讯飞更是不断投入资源,建设万物互联、人机交互最关键的、最便捷的入口通道——智能语音。
此前,美国投资机构Mangrove Capital Partners发布的2019年“语音技术报告”就曾预测,键盘将在未来5到10年内基本上消亡,“声音”识别将彻底改变产品搜索,甚至虚拟伴侣将变成现实。
在这些方面,科大讯飞早已有所建树。从纪录片《创新中国》还原已故配音大师李易的声音,到《A.I.记者“通通”游世界》流畅自如的新闻播报,科大讯飞的相关技术早已走进我们的生活,改变我们的生活。
值得一提的是,这是科大讯飞最后一次参加国际大赛Blizzard Challenge,未来科大讯飞将聚焦于探索语音合成应用的更高阶段。同时,科大讯飞还将坚持从B端为主到C端发力的BC双轮驱动模式,给世界带来全新的产品和升级的体验。