风险雷达

走出AI技术的“黑暗森林”,人工智能如何创造企业风控咨询服务?

2020-08-21 17:12

如果在刘慈欣那片“黑暗森林”,猎人在不暴露自身,也缺乏数据支持的情况下,该如何预知全宇宙的其他文明,是否存在极端危险性?如果你是风控领域的一员,不管是传统企业,还是身处AI企业,上面这个问题,都是AI风控经理很值得思考的一个假设。因为,我们风控人员就像这片森林中带枪的猎人,随时用枪指向未知的风险。在过去,我们像盲人一样,没办法计算出风险发生的具体概率数值,只能靠经验去盲猜。

在AI领域,有一个非常棒的方式能够完美解决预测风险这一问题,即:随机森林(random decision forests)。与传统看报表的方式不一样,AI技术能通过识别、分析数据,形成一套可视化的方案,再通过深度学习、贝叶斯概率公式、决策树、随机森林等等AI算法。实现对风险的分析、判断、预测,甚至发展到5年后,AI结合物联网智能设备提供的深度数据、二次相关数据,实现更加精准的风险预测。

那么,AI究竟是如何通过一套特有的风控建模,计算出比人脑还快的风险预测方案,甚至能够对全中国的在注册企业,进行高效率的授信,这一行为也被称为“企业评级”,例如给关注企业评级AAA、B、C等。

深度学习与毕加索的牛

风控是一件特别反人性的工作,当别人在讲中国梦时,你在为企业纠错。当业务部门的同事决定给浙江XX企业放款时,你拿着数据告诉他不可以。

在我们学习新知识时,通常有这么几种人:一种人不断的复制知识,一种人解释知识的前因后果,一种人会挖掘知识的底部规律,还有一种少见的人,会将不同知识的基础规律互相联系,产生新的规律。

第一种人只能叫做复制,谈不上学习,其他几种人是比较初级的学习,而最后一种人,则是透过现象看本质,而这种能力,是人脑独一无二的,至少在没有另一种智慧生命体出现之前。

接下来,我们谈谈计算机。当我们用鼠标去copy一个又一个文件时,它能做到的事情,其实和我们之前说的第一类人是一回事。当数据量越来越大,几千万兆的信息累计到一起,该怎么去计算这种信息呢?这个时候,有科学家想到,为什么我们不能教会计算机,像人类一样学习,从基础规律的层面给这些信息分类、分析、总结、判断。这样听起来好像不可能实现,但我们来细究一下,另一个案例,即:毕加索的牛,可能会更加明白如何高效率的认识事物的本质,当然,你也可以把这一行为称之为:机器学习如何自动识别未知事物。

毕加索擅长画抽象画,但为什么,我们能够准确识别出毕加索的画,具体画的是什么?明明自然界中不存在那些抽象画面,就比如下面这些牛,其实原因很简单。

我们人脑在处理信息时,首先会抓取一个画面,然后再透过现象看本质,忘掉所有的细枝末节,只把这头牛最关键的因素,凸显出来,比如说,牛躯体的关键线条。我们再往前延伸性思考,那么在这个“关键线体”之上,无论你怎么描绘,那它的样子,在你心里面都会是一头牛。没错,就是不断地抛弃不重要的细节,只关注重要特点,让不同特点产生联系,作用于未知问题,这就是学习的本质,同样,这也是机器深度学习(deep learning)的基本原理之一。接下来,我们继续延伸,让机器具备这种“遗忘细节,抓住关键梗概”的能力,那么机器就可以对数以千万兆的数据进行整理和分析。

只要你设定足够关键的多个维度,例如,在风控领域,你可以将这种维度设置为:企业债务风险压力值、企业诉讼案例危险值、企业负面舆情数值、企业是否破产、企业失信记录等等一系列限定。在这个基础上,AI技术就能够对数百万家企业的数据进行整理、识别、分析。在过去,识别风险这种事通常是风控初级人员在做,现在有了AI技术,那么就可以让这些风控人员去做更加富有创造力的事情。AI风控系统中的深度学习的本质就是:针对风控数据进行自动特征提取。

AI 如何计算风控概率?

如果只有“深度学习”技术,那么AI技术最终只能作为信息分类工具,在这种尴尬的情况下,出现另一种能够计算概率的公式,填补了这朵隐藏在AI风控大厦之上的乌云。它被称为:贝叶斯(Bayes' theorem)该公式通过已知客观数据,推算“相关联”、“逻辑导向性强”的其他事件所发生的概率。

打个比方,信息包含:中国人、35岁、苏州、设计师、微软,那么你可以推算出,他的个人收入大概是年入¥20万~¥30万之间,其他客观数据越多,他的收入值准确率越高。或者我们再换一个例子,鲸鱼8月份出现在冰岛周边海域的概率是75%,那么有25%的概率鲸鱼不会出现。在这些数据的基础之上,你再加上多个维度,多个事件,例如这片海域出现海豹的历史同期概率?出现游船的历史数据?出现晴天的天数?当事件数据量足够庞大且复杂之后,我们试着用“贝叶斯公式”去计算,用最终数值,来表示一个事物发生之后,与之相关的另一事物发生的概率是多少?该公式具体是:P(A|B)=P(B|A)*P(A)/P(B)。其中A和B是随机事件,P(B)不能为0,P(A|B)指的是事件B发生时,事件A发生的概率究竟是多少。

在风控领域,存在大量互相关联的事件,有的是因果关系,有的是相关性,比如江苏XX企业发生债务危机,失信严重,结果该危机传导至其中一个控股方江西XX企业,最终导致江西XX企业倒闭。

正是因为以上因素,才导致AI风控数据呈现出两个特点,一个是可视化展现形式,另一个是拥有相对准确的概率数值。

AI 风控的黑暗森林

在统计学中,有一种东西可以用来对“数据挖掘”和“机器学习”进行有效地深度分析,这种数据工具被称为“决策树”。通过创建一个模型来预测样本的目标值,输出结果。当这种计算方式被推广开之后,有人想出了一个更好玩的工具,来处理数据。一个决策树得出的信息,对于真相,是有可能出现误差的,那么几百万个“决策树”同时进行运算同一个问题呢?如果有人将这些数据再整合到一起呢?那么事情就被推引到更加有趣的局面了,这有点像在机器学习中植入了人民大会堂的民主集中制。

现在,我们继续讨论刘慈欣的黑暗森林,在《三体》中,这个假设被运用于宇宙社会学,说的是当一个猎人身处于一个黑暗森林时,当有人暴露了自己的位置,整座森林的猎人都将猎枪指向他,瞬间将威胁消失。在这个假设中,存在一个大前提,那就是生存是文明的一要素。那么一切对文明生存产生威胁的事物,会在第一时间被消除掉,这很像我们在风险控制中决定是否要解决掉存在的潜在风险的行为。

在刘慈欣的假设中,我们可以理解为这座黑暗森林是一个“黑匣子”,猎人不清楚其他猎人所处的位置,也不知道其他人猎人的任何信息,这是一个封闭且不互相交流的孤立系统。我们继续假设。如果这座黑暗森林,就是一座独立且完整的AI系统呢?如果每一棵树都具备独立计算风险数据的能力呢?

当猎人举起枪,要射击暴露出来的其他人之前,数千万颗树进行同时计算,通过对风险的不同维度进行分析,最终得出不同的结论。例如32%的树判定A文明是一般危险的,17%的树认为A文明是善意的,4%的树认为A文明是孤立的,47%的树判定A文明是极端危险的。当这些数据整合在一起,展现给猎人时,47%的极端危险数据结论,促使猎人毫不犹豫的举起枪,让未知的A文明止步于黑暗森林之下。这一概念,实际上就是机器学习中的“随机森林(random decision forests)”,在“决策树”的基础之上,对计算结果进行排列,重新组合,再分析,最终做出明确的数值判断。

在风控领域,我们可以根据各种各样的事件作为“锚点”,例如瑞幸咖啡的负面舆情频繁发生,一下子就拉响了整座“黑暗森林”的警报,直接在“RiskRaider风险雷达”的系统中再现出“特别预警”信号,提醒风控人员对其加以强烈关注,再细看则会发现这家公司被“浑水”机构曝光财务造假。(风控专业扫二维码领取账号)

随机决策森林用数学语言来表达,则是:

看不懂的不要慌张,因为数学语言是一种全宇宙公用的语言。即使在某些宇宙物理性质和化学性质发生变化,但数学公式,也绝不会产生异动。当我们试着把“深度学习、贝叶斯公式、决策树、随机森林”等等Ai技术里面目前最核心的几种技术整合在一起,那么我们就产生了“风控建模”的概念。通过以风控领域关键因素作为锚点和限定,在其基础上搜集和分析数据,并产生风险判断,以至于最终达到协助风控专业人员进行标准化的、个性化的风险预测。AI风控领域的“RiskRaider风险雷达”实际上就是在做这样一件事,对企业风险进行搜集、分析、决策,计算风险概率,在大数据的基础之上,为企业创造个性化的风控咨询服务。最重要的是,它在预测未来。

注:以上案例仅仅是为了方便大家理解技术和公式,如果从数学语言的角度去理解,那么将更加复杂,但是会更接近真相。

AI 风控的未来

如果说RiskRaider风险雷达撕开了AI风控领域一个小口子,那么挡在AI风控大厦之上的那朵乌云的背后,则是整片耀眼的星空。没错,AI技术目前的发展也仅仅是整个AI领域不到1%的部分,到现在可能还有很多人误解AI,觉得AI毫无用处,但是到2030年8月20号那天下午,你所看到的世界,则是各行各业都充斥着AI技术。屏幕与屏幕链接在一起,全世界的信息被整合在各种各样的“黑匣子”中,在5G,甚至于6G的基础之上,AI技术变得比大多数普通copy工人更加智能。

火车刚发明时速度远没有马车快,但新生事物的运行规则所处的维度是远远高于传统事物的,现在AI技术还没有成为强人工智能,很大一个原因是因为数据不够。但如果5G、AIot、物联网设备被普及之后,互联网时代就会彻底消失,万物互联的时代立刻崛起,成为新一代的全球智能网络系统,取代旧有的一切。数以亿亿兆的信息在不同的黑匣子中不断穿梭,人们对隐私的概念也会产生变化,如果所有人的隐私都在这些黑匣子中传来传去,那么还有谁真的会在意自己的隐私被其他软件应用呢?现在这样说,可能很难理解。

但是请试着想象一下2025年的世界,当你早晨起床,智能手表记录下你的心率,以及睡眠质量,你打开冰箱,喝完最后一杯牛奶,洗漱时,镜子记录下你表情所展现的心情,你坐上无人驾驶的汽车。眼神盯着关于委内瑞拉的新闻超过3秒钟,汽车开门的瞬间,你开始抱怨这一天的生活。坐在公司会议室,通过VR眼镜,和远在巴黎的同事进行沟通。中饭时,你第1001一次选择了某个菜系的不同餐厅,到了下午,纳米机器人检测到你脊椎过于疲劳。

在你要结束完一天的工作时,你的数字货币已经自动支付了某家电商公司的橙汁饮料,用来填满你的冰箱。你的家庭医生已经把最新的一份健康资料摆在你家里,提醒你健康饮食,及合理运动,而你远在巴黎的同事,也收到附近餐厅你喜欢吃的风格饮食的邀约,而你竞争对手的企业,已经对你及你的企业做了一个详细的风险调查报告。所有这些数据,都来源于你每天的行为,这些数据被各种各样的智能设备抓取并重新整合,向该传递的系统传递,而AI技术则在这其中发挥了最为关键的一环。

如果考虑风险领域,那么竞争企业会通过这些数据做出更完美的风控方案,不仅仅是数据,不仅仅是咨询,是直接将未来的风险概率测算的清清楚楚。一方面竞争企业会通过智能设备提供的一手数据进行计算,同时还会根据企业主的子女、爱人、朋友、关联企业的数据进行二次相关性计算,推算出更加准确的结果。当AI技术具备以上能力之后,AI毫无疑问会进行下一步的推演,即:将未来的风险,展现出来,作用于现实,甚至影响现实,以至于改变现实。

如果你知道2030年一家深圳智能机器人公司有47.8498765458799%的可能性毁于当年的一场经济危机,那么该预测事件本身,就会影响事件的未来走向,导致更多的股东提前逃离这家公司,或者加快吸引融资、并购等等方案,避免即将到来的极端恶性事件。当这些预测能力发生之后,更加好玩的一件事毫无疑问会发生,大家想想,我们生活在一个超级不确定性的事件中,虽然某公司会在2030年7月15号下午3点过5分倒闭的概率为99%。

可如果另外1%的几率发生,该怎么办?毕竟1%可能发生的事件,一旦发生,那就变成了100%的事实。在历史上这样的事件并非没有发生,11世纪的英国落后、愚昧、贫穷,从概率上来讲,英国大概率会在未来500年之内会被西班牙帝国率领的无敌舰队击败,接着是西班牙国王统治英伦三岛,工业革命在随后的100~300年后的马德里、巴格达、杭州爆发。

可事实上呢?低概率事件发生了,英国从11世纪起就像开了挂一样,先是1215年的《大宪章》,限制住英国王室的绝对权力,接着是红白玫瑰战争意外削弱贵族势力。接着是1588年,极其短暂稳定期的英国海军、海盗共同击败恰好换上没有出海经验的海军将领所掌管的西班牙无敌舰队,为英国争取了更多发展时间。到1688年,已经被打的千疮百孔的英国,决定实现不流血的光荣革命,资产阶级开始有足够的空间去发展。接着到18世纪早期,英国王位被一个终日痴迷爱情,对政治完全没有兴趣的安妮女王继承,为了保证国家继续发展,意外促成了让权利平衡的君主立宪制。

之后的事情,就更加巧合了,英国意外吸纳了来自全世界的所有技术,从中国到阿拉伯,从印度到南美,信息的整合达到一定程度,量的积累,到了质的飞跃,最终促成了第一次工业革命的发生。以上所有事件,只要有一个事件没发生,英国的历史都会走向完全不同的方向,甚至我们的世界会变得完全不同。

那么,我们该如何看待概率问题呢?这将推导出更多悬而未决,但特别有意义的其他问题。最后,在AI风险发展的过程中,建议大家保持一个足够开放的心态,去接纳未知的事物。AI风控系列产品RiskRaider风险雷达,也许在今天看来, 互联网数据提供商非常相似,但从基本性质上来看,这是完全不同的两类物种。

一种代表过去,我们从何处走来,另一种代表未来,我们如何创造世界。AI风控作为一种新生事物注定不会被扑灭,而是像草原上的星星之火,在某一个关键节点,必定迎来爆发式增长。请大家对未来保持想象力,给理想一点时间。

服务热线

021-68580928

风险雷达微信二维码

风险雷达公众号

姓名*
手机*
公司*
职务
邮箱