近日,淘金者科技集团、牛股王APP首席科学家许意华受雷锋网【AI投研邦】邀请,做了关于“AI在金融服务业的应用”的主题分享。
本次分享围绕“AI+金融为什么这么热?”、“AI核心算法简介”以及“淘金者科技的AI实践”展开。以下来自【AI投研邦】对淘金者科技集团首席科学家许意华分享的实录摘取,【AI投研邦】在不改变原意的基础上做了整理和精编。
AI+金融为什么这么热?
今天我们讲的主题是什么?是AI+金融,从我这个理工男的角度来说,到底什么是金融?可以说金融是在时间和风险双维度下,对现有的资源进行当前未来消费的均衡决策,以实践整体上效应的最大化。
AI能够解决金融领域的什么问题?能解决什么痛点?其实在大数据时代,传统金融面临着升级转型,目前来看金融行业面临一些比较明显的痛点,一个是各种数据是越来越多,包括结构性结构化的数据,非结构化数据越来越多。另外,在交易层面,行情也是越来越快,依靠人脑很难长时间、高效率的分析解读这些数据,或者是来做决策。最后,随着市场的越发完善,过往的信息不对称正在消失。我们举个交易的例子来说,简单的交易策略可能是很难生效了,很难挖掘潜在的交易机会。可能AI是一个深度挖掘数据的一个好方法,可以解决这方面的一个需求。还有一方面可能人会比较疲倦,会受各种情绪的影响。然后可能在比如说交易方面,可能他的交易出来的一个纪律性就不好,大家可能如果交易期货的话,往往会受到情绪的影响。
但是AI算法如果用来做交易,可能就不存在这些弱点,之后也不会受到人的情绪影响,可能会更加稳,特别是相关的一些智能风控系统,可以帮助到咱们的投资者。
另外一个还有一个就是从劳动力成本上考虑。比如说现在很多金融企业可能有大量的销售,有大量的客服,现在的成本其实挺高的。如果说金融科技可以在这方面帮助的话,我想可能主要是一个是客服方面,可以通过机器人的客服来解决很大一部分的问题。还有一些智能化的一些市场运营,或者说市场推广,可能人工智能在这方面能够帮到咱们金融科技企业,上面是我们刚刚所说的金融领域里面面临的一些痛点这些痛点正好是AI的优势所在。
人工智能它是可以以大数据为基础,非常适合什么,特别是在金融市场,这样的数据量庞大,特征维度又高又快,然后相互关联又非常复杂的环境里,能够起到很好的一个作用。人工智能在处理大数据深度挖掘数据能力,可复制高稳定方面有优势,所以我们认为潜在来说可以在金融领域大展拳脚。如果以量化交易为例,我们发现就是说最近特别是近年来很多量化基金的出现,很多智能投顾的出现,也证明了AI的一个热度。
我特别地是把人工智能在证券基金以及消费金融领域,行业的应用场景给列出来,框出来。大家可以看到有智能投顾,有量化交易,有智能风控,有营销客户的。我把它框出来,原因是因为在淘金者科技集团,我们正是在这几个领域利用了AI刚才我提到了说AI很热,然后我们也知道AI正是金融科技的一个重要技术支撑。
AI核心算法简介
我会接下来列举一下目前市场上,或者说在这个圈子金融应用里面比较流行的或者主流的一些算法,然后尝试介绍其中几个具有代表意义的。这里列出的是一些比较常见的AI算法,我们可以看到有决策树、随基森林,然后看到有SVM,逻辑回归,有朴素的贝叶斯网络,还有K最近邻也叫K临近算法,然后还有卡尔曼滤波、Adaboost,还有神经网络、马尔可夫。这些算法其实都是比较常见的,大家可能随便找一本关于机器学习或者是人工智能算法的书里面都会介绍。
然后比如说决策树算法,它就是机器学习的一种,它主要是用来解决一些分类问题,我们或者说叫做回归问题。我以前在网上看到一个简单例子,就是比较好的描述。这个例子是这样说的,说是小红的妈妈安排她相亲,然后见了介绍了小红就问帅吗?有房吗?收入怎么样呢?问的各种问题,其实就涉及到了一个样本的属性。然后小红就不断地利用样本的属性值来不断的调整自己的判断,最后一步步达到最后一个最终的一个展示,我要去了,我要想去见这个男士。这个就是非常形象的描述了一个角色树的一个算法逻辑。
然后我们再看一下,KNN则是一个什么?这是一个计算距离的一种分类算法。他这里考虑的问题是怎样对样本数据进行快速的搜索,或者我们叫K临近搜索。这里的K只是特征向量的维度,我们可能听起来比较难以明白,我们可以简单的举个交易的例子。
比如说我手上有K线的数据,然后我还把这K线分为各种形态,比如说什么设计之星,类似于这样的一些,或者是锤子之类的,或者是各种各样的形态。有些柱体比较短,有的两头比较长,或者是相反。如果拿新的一个K线,任务是判断它到底属于哪一类,那可以帮助解决这个问题,它基本上是一个分类器。然后我们还看到底下介绍了一个叫Adaboost,它是一种迭代算法,其实就是针对一个训练集,这些分类器可能各自可能出来的效果并不是特别好。然后我们学我们一般把它称为弱分类器,但是他的思想是如果把这些弱的分类器组合起来,通过一些算子结合在一起,可能加减乘除可能之类的,最后够可以构成一个更强的强分类器。这个可能用句形象的术语比较说话,我们就老话说了,叫三个臭皮匠顶上个诸葛亮,大概用比较好地描述了这样一个逻辑思想。
应用案例1:牛小量——牛股王APP智能诊股
淘金者科技集团,英文名Trademaster Tech,它是一家以金融科技为核心驱动的互联网金融服务商。 到目前为止,业务范围覆盖了A股的投顾,还有港美股,财富管理,特别是ESOP等等机构业务。
接下来我介绍三个淘金者科技集团在AI上的应用案例,一个是牛小量,即牛股王APP的智能诊股。另外一个是牛股王smartBeta,一个情绪指数,还有一个是期货淘金者的APP机器学习策略,它其实是一组策略。
牛股王,刚才我们介绍了他是淘金者科技集团下一个服务于A股或者说是证券投顾业务的一个APP。牛小量是它基于AI的智能诊股服务产品,我们有时候会把它叫成是一个子产品或模块。
这款产品主要是基于我们nlp,也叫语义识别。然后语音识别他是AI的一个重要分支。举个例子我们的客户通过输文字,或者是语音方式输入中国银行这支股票明天是什么样的一个情况,是升还是跌,或者说它的一些基本资料,我们能够通过NLP算法,最后输从数据库里拿出来的一些,或者是我们经过组合整理的一些资料提供给我们的客户,其中也包括一些加工过的数据,然后这个产品其实还挺受用户欢迎的。
然后这里说的是牛小量整股票逻辑,首先是语义分析处理用户输入的信息,然后找到对应的标的。从数据库中,或者是从知识图谱中,因为这里用到其实用到了知识图谱的一个一个技术,从这个数据库中就筛选出该标的所有的数据信息,这些数据信息都是打了标签的,也就是知识图谱。然后我们将基本面的行情数据,然后还有一些非结构化的数据,输入进神经网络,然后通过神经网络的分析,得到该股票的诊断信息,然后自动的形成一个报告,显示到用户的终端。 当然我们现在这款产品还处在一个比较初级的阶段,还在不停的迭代之中,还会不断的迭代算法,同时也提供更好的数据输入。
应用案例2:牛股王SmartBeta情绪指数
为什么会有什么SmartBeta情绪指数出来呢?其实是这样的,就是通过大量的实证研究,股市的涨跌可能跟投资者的情绪会有着很大程度的一个相关性,甚至是正相关性。所以如果能够准确的跟踪刻画,并且数据化的方式来显示整个市场投资者的情绪,会对投资行为的决策有非常强的指导作用。
牛股王正好是一个散户的一个社区,然后有大量的交易型的用户,他们的情绪可能对我们的这个交易可能会有一些指导作用。所以牛股王SmartBeta情绪指数也是一款基于AI算法的产品,我们甄选了非常多的影响因子。包括用户以前有没有登陆牛股APP、是否有发言、还有一些可能我们认为是VIP或KOL的一些用户,他有没有发言?他有没有操作其模拟账户、停留时间、他选择哪些股票做交易、它的交易情况怎么样等等这一系列的信息,都可能是成为我们的有一定影响力的一些因子。
然后我们其实上面也介绍过贝叶斯网络,我们其实用贝叶斯网络来做分类,将每一个投资者情绪进行分类,然后进行标签化,把它标注为积极、观望、消极三个标签,然后通过算法,我们可以确定未来情绪指数的分数是多少,是一种这样的一种逻辑。然后再走到情绪标签之后,我们通过SVM算法将整个市场的情绪进行综合性分类,然后打分得到最后的情绪指标数据。
问答实录
Q1:量化投资软件会未来会开源吗?有行业人士说商业软件和机构自研有安全、兼容、迭代等问题。
目前这个阶段还没有开源,正在发展阶段,未来我们确实有计划把我们盈宽量化这部分东西,我们也希望开源或者是一种接口的方式,跟外部的合作方进行深度合作。
Q2:投资者需不需要这么多信息?是不是会消息过载?
其实这个问题问得非常好,因为我们现在是在这个大数据的时代,投资者所获得的信息是海量,所以确实是有的信息是毫无价值,有的信息是非常有价值,有的信息是隐藏在非常海量的数据之中。人工智能算法就是在帮助投资者在分析这些数据,因为靠人力的方式其实是没有办法快速解决的,人工智能潜在来说有这个优势,他能够有很好的一个计算能力,所以能够高速的去处理数据,能够算法能够比如说可以用一些分类算法,分析出哪些哪些是有影响力的因子,特征,数据,通过这样的方式能够帮助我们人来做决策。
广告