在LiveVideoStack2019上海音视频技术大会前夕,LiveVideoStack采访了容联云通讯产品技术总监雷辉,畅谈了视频通讯过去十年的里程碑事件,以及企业通信在AI和5G下的机遇。
文 / 雷辉
整理 / LiveVideoStack
LiveVideoStack:雷辉你好,简单介绍下自己的工作经历,以及在容联云通讯负责的工作内容和专注的领域。
雷辉:大家好,我叫雷辉,是容联云通讯产品技术总监。2003年进入视频通讯领域,一直从事产品和技术相关工作,对视频通讯平台的发展历程和技术架构有深入的认识。目前专注于视频通讯云平台和新技术的应用和市场推广。
LiveVideoStack:在视频通讯领域十多年,回忆起来有哪些关键的里程碑事件?
雷辉:我是2003年加入到视频通讯行业的,正好遇到非典那段特殊时期,视频通讯行业得以真正在国内引起政府的高度重视和大规模建设,也是非常幸运的赶上了行业快速发展时期。在过去十多年的中,我主要在一家技术型公司RADVISION工作,早一点做视频通讯行业的同行可能都知道,正是这家公司发起和制定了视频通讯在IP网络上的框架协议标准(H.323),后来这家公司在2012年被Avaya收购。回到现在,我在容联主要负责新的产品线“有会”相关工作。
回想在视频通讯领域的这些年来,印象比较深刻的几个变迁分别是:
VoIP取代基于ISDN网络的系统和方案
这个事件是我在2003年加入这个行业的时候就已经发生了,只是非典的特殊情况极大的加速了这个过程,因为IP网络相对于ISDN网络更容易快速的部署视频会议系统,在使用方面也更加的高效和灵活。
视频系统由标清时代进入到高清时代
随着IP网络基础设施的快速建设和视频通讯设备的处理性能的提升,以及基于IP网络的编解码技术演进,在2006年左右高清视频通讯方案开始逐渐出现市场上,由于视频质量的大幅度提升,也助推了一波视频会议设备在客户端的更新换代潮流。另外就是在进入高清时代和大规模应用的过程中,市场对后端的处理技术也提出了更高的要求,也催生了行业在架构端的技术调整,逐渐各大品牌都采用了全编全解的后端二次处理技术,来应对各种不断变化的使用场景,设备类型和网络状况。
视频会议系统向移动端和云端迁移
我理解这是我们正在经历的一个过程,通过服务购买方式来代替传统的项目自建正在稳步进行,系统接入的设备类型也随着越来越丰富,在这个进程中,我相信也会发生系统架构和提供商的更新迭代。
LiveVideoStack:从IM能力开始,容联云通讯将通信能力延伸到音频、视频、AI等,能否介绍下容联·云通讯的核心技术能力?
雷辉:容联最早是从最基础的通讯能力平台开始,再扩展做IM,CC、UC等服务,就这样,在不同行业获取了第一批种子客户后,容联便有了机会继续了解客户的不同需求,并延伸到同行业的其他客户上,从点到线,不断迭代升级产品研发,同时扩大客户数量。
整合运营商的网络资源、通信资源,将专业的通讯能力打包成API接口与SDK,构建了一个云网融合的通讯能力平台,围绕这个能力平台不断进行新技术应用交付和创新,比如说针对语音服务的AI智能化,高质量音视频等等,颠覆了技术和资金的门槛,通过云计算改变了通讯的连接方式和交付模式,实现通信网与互联网、通讯服务与企业协同的最佳融合,大大降低了企业的运营成本,提高了企业的沟通效率。
LiveVideoStack:企业通讯市场还有哪些远为满足的需求?同时,您认为哪些技术有可能满足这一市场?为此,容联云通讯正在做哪些技术储备?
雷辉:智能化才刚刚起步,已经看到雏形,但还处于弱人工智能阶段,未来企业服务场景(语音交互、质检服务、远程沟通协同、机器视觉、智能安保、员工能力模型、智能任务)的智能化是非常值得期待的。
目前容联已经在计算机视觉(人脸识别、图像识别、OCR)、语音(语音识别、TTS、音视频处理)、自然语言处理(语义分析、意图识别、知识图谱、多轮对话)等三个领域展开研究,智能客服、智能外呼、智能质检、高清音视频服务是我们主要在优化的产品或者说能力,未来,也会将之开放在容联开放平台,我们也在与华中科技大学成立人工智能联合实验室,共同推动AI产学研的一体化发展。
LiveVideoStack:IoT和5G被认为带来海量的联网设备和更大的带宽使用,这对于企业通信服务商是不是蕴藏着巨大的机会?
雷辉:从会议产品的角度来看,5G的普及肯定会带来更好的音视频体验,也会进一步促进需要视频通讯能力的垂直市场或行业的发展,例如教育,医疗,应急等等。同样在技术层面也会带来更多的创新空间,例如和物联网设备的关联与互动。
LiveVideoStack:AI技术无孔不入,在通信场景下已经有不少实践落地,比如智能客服、智能呼叫中心等。您认为AI技术还会在哪些场景下发挥价值?
雷辉:AI技术是众多领域的提供商都在拥抱的技术,容联很早就开始在这些方面布局,并实现了很多AI相关的应用,如前面提到的智能客户,智能外呼,以及智能会议室等等应用场景。在视频场景中,我们同样也在做积极的探索,除了可能业内讨论比较热烈的专注力识别,签到之类的应用场景之外,我们也希望能够将AI技术应用到通讯技术本身,提供更加智能化的体验场景。