由中国计算机学会(CCF)和中国中文信息学会(CIPS)联合主办,百度公司、中国计算机学会中文信息技术专委会和中国中文信息学会评测工作委员会联合承办的“2019语言与智能技术竞赛”于2月25日启动报名之后,得到了海内外AI研发者的积极响应。截至3月21日,已有全球1669支队伍和个人注册报名,目前竞赛仍在火热报名中。报名通道将于3月31日关闭,同时将对报名者开放全部训练数据,欢迎登录竞赛官网(http://lic2019.ccf.org.cn/)进行报名和下载。本次竞赛获胜团队将分享总额达27万人民币的奖金,并将在第四届“语言与智能高峰论坛”进行颁奖。诚邀全球AI人才报名参加本次竞赛。
报名的1669 队伍中,有767支来自192所高校和科研院所的年轻队伍,占比超过52%。据统计信息,全国211高校中70%的高校有研究团队报名参赛,成为参赛队伍的主力。值得一提的是,参赛的国际队伍覆盖了20多所海外知名院校,分别来自美国、加拿大、英国、澳大利亚、荷兰、日本等8个国家。除此以外,有357支参赛队伍来自微软、腾讯、华为、阿里巴巴、中国移动、中国工商银行等226家知名企业,涉及科研领域及互联网、数码3C、金融、通讯、家电等多个垂直行业。
本届竞赛设立了三个任务,包括机器阅读理解、知识驱动对话和信息抽取, 为全球开发者提供了具有挑战性的竞技舞台。。其中,机器阅读理解任务是“2018机器阅读理解技术竞赛”的延伸,今年任务设置上更有挑战性。
百度公司作为本次竞赛承办方,为选手提供了全面的技术及资源支持,三大任务上,百度分别开发了先进的、基于深度学习框架的开源基线模型,帮助选手快速进入开发工作,大幅提升参赛效率。
其中,机器阅读理解任务提供了基于BiDAF的模型作为基线系统。BiDAF是基于LSTM以及注意力机制的经典阅读理解模型,在多项阅读理解任务上均表现良好。在2018机器阅读理解技术竞赛中,超过80%的参赛选手都基于BiDAF基线进行开发,取得了优异的竞赛成绩。值得一提的是,本届竞赛专门针对基于PaddlePaddle版本的BiDAF基线进行了升级,加入段落抽取模块扩大召回,并利用先验概率分布进行段落排序,显著提升了模型效果。升级后的PaddlePaddle版本BiDAF基线效果可以进入去年竞赛前十名。此外,参赛选手还将获得已训练好的模型参数,从而更有效地进行开发。
知识驱动对话任务则提供了检索和生成的两种基线模型,这是目前对话技术中最主流的两个技术线条。检索模型使用了目前学术界前沿的的BERT技术,针对对话上下文和候选回复进行表示,在生成模型中使用Memory Network进行知识表示,并创新性的提出了使用后验信息(标准回复中使用的知识信息)指导模型知识选择策略的学习,效果上显著超越基准模型。
信息抽取任务提供的是业界主流的pipeline解决方案,其创新性地提出先进行关系分类,再进行实体标注的pipeline结构,即先基于深层堆叠双向LSTM网络结构进行多标签关系分类,再依据关系类型采用深层堆叠双向LSTM-CRF序列标注模型进行subject、object的实体论元标注,高效解决了重叠实体的关系抽取问题,显著提升模型准召效果,可以更好地为选手开发服务。
基线版本上,本次比赛同时提供了阅读理解、信息抽取任务的PaddlePaddle版基线模型,以及基于检索实现的知识驱动对话任务PaddlePaddle基线模型,基于生成实现的PaddlePaddle版基线模型将于近期发布。PaddlePaddle是百度研发的开源开放的深度学习平台,是国内最早开源、也是当前唯一一个功能完备的深度学习平台,具有简洁、稳定、训练和预测速度快等特点。依托百度业务场景的长期锤炼,PaddlePaddle有最全面的官方支持的工业级应用模型,涵盖自然语言处理、计算机视觉、推荐引擎等多个领域,并开放多个领先的预训练中文模型,以及多个在国际范围内取得竞赛冠军的算法模型。
资源上,百度将在AI Studio平台上为参赛选手免费提供GPU集群计算资源,并预置PaddlePaddle版本基线。AI Studio是百度深度学习一站式开发平台,集成了PaddlePaddle开发环境、数据集和免费算力资源。参赛者借助AI Studio的平台资源和预置PaddlePaddle基线,可快速进入模型训练阶段,达到事半功倍的效果。
作为本届竞赛的承办方,百度不仅为参赛选手提供了三大任务开源基线系统,也开放了大规模标注的中文数据集。百度对于人工智能研发一直秉承“开放赋能、生态共赢”的态度。截至目前,百度大脑开放平台已对外开放158项AI技术和能力,更多先进能力也会逐步地开放出来,供开发者调用。开放生态之下,百度大脑平台已汇集超100万开发者,日调用量超过4000亿,覆盖20多个行业。在开放生态雨林中,百度与360行合作伙伴共同绘制智能生活蓝图,进一步提升我国人工智能实力,让复杂的世界变得更简单。
2019语言与智能技术竞赛报名日期截止于3月31日,将于4月1日至5月20日进行比赛,5月底公布竞赛结果。百度诚邀全球AI人才报名参加本次竞赛,与海内外众多优秀开发者一较高下。具体报名方式及更多赛事信息登录2019语言与智能技术竞赛官网(http://lic2019.ccf.org.cn)了解。