近日,由IEEE ISI 2019和深圳人工智能与数据科学研究院联合主办的“IEEE ISI 2019国际大数据分析竞赛(IEEE ISI World Cup 2019)”已圆满结束,来自中国、美国、巴基斯坦、英国、德国等7个国家的企业、高校共363支队伍、1001名选手参赛。经过公正并激烈的角逐,泛鹏天地团队在本次竞赛中脱颖而出,取得了骄人成绩,并应邀参加“第17届IEEE ISI会议”,在会上与来自全球的参赛队伍、专家、学者分享了此次竞赛的成果及创新思路,得到了组委会的一致认可,获得了“最佳报告”荣誉。
IEEE ISI 是安全信息学领域的旗舰会议,于2003年首次在美国亚利桑那州图森市召开。在过去的16年中,IEEE ISI会议已经从传统的智能和安全领域发展到多领域联合研究与创新。为了促进人工智能分析行业的发展,IEEE ISI会议发起了此次国际大数据分析竞赛(IEEE ISI 2019年世界杯,IWC 2019)。
今年IEEE ISI-World Cup 2019共有来自中国、巴基斯坦、伊拉克、美国、英国、德国、挪威等7个国家的三百余支队伍报名参赛,总人数千逾人次。其中242支团队来自中国科学院大学、清华大学、北京大学、The University of Arizona、University of Connecticut、National University of Sciences and Technology、Handelsh&yskolen BI 、Saarland Univeristy、北京交通大学、西北工业大学、国防科技大学、华南理工大学、南方科技大学、北京邮电大学、中央财经大学、上海财经大学、北京化工大学、浙江大学等国内外各类别高等院校;65支团队来自华为、金山、阿里巴巴、Accenture、World Blitz LLC、MindRank.ai、中国人民银行、中国工商银行、阳光保险、滴滴、京东等国企互联网巨头企业。
今年的IEEE ISI大赛分为投资价值评估和法律诉讼类型预测两个赛题,提供了基于3500家上市公司全量信息,参赛队伍需要合理运用现有数据集材料,筛选出对竞赛有价值的信息进行特征构建和模型训练。在这次比赛中,数据维度广、信息复杂、数据特征类型丰富成为了本次竞赛的难点,同时,金融行业机器学习模型的解释性弱、企业评估数据标准接口不统一等问题也成为了需要攻克的难关。泛鹏天地团队在本次大赛中对于相似的数据创建了一键清洗的系统,封装了自动特征工程和自动特征选择的模块,从金融专业的角度衍生了针对性的业务场景特征,构建了多种不同类型模型的集成,使得集成之后的效果更加稳定。同时在业务落地上,创建了专业领域标签库、建立关系图谱,将数据标签化、网格化并统一口径,从而提升了模型的通用性及解释性。
作为金融管理领域的领导者,泛鹏天地十余载专注于银行领域,自2012年起,泛鹏天地就构建了基于大数据的服务和产品一体化体系,先后为800余家金融机构提供了管理咨询、数据运营、系统实施等服务。随着大数据的发展,数据挖掘、机器学习和人工智能等相关技术,都将成为业务发展的重要推手。多年来泛鹏天地始终以客户业务逻辑作为数据挖掘分析的出发点,确保挖掘分析结果能切实解决客户业务痛点,从而实现应用的真正落地。