清华大学徐心老师与FMBA同学面对面|企业发展与AI治理之道

发布时间:2020-11-02 聚合阅读:
原标题:清华大学徐心老师与FMBA同学面对面|企业发展与AI治理之道【中国MBA教育网讯】近日,清华大学经济管理学院副院长徐心与FMBA项目2019级同学展开面...

原标题:清华大学徐心老师与FMBA同学面对面|企业发展与AI治理之道

【中国MBA教育网讯】近日,清华大学经济管理学院副院长徐心与FMBA项目2019级同学展开面对面交流,和同学们就企业发展与AI治理之道进行深入探讨,通过前沿的观察与生动的案例,启发各位同学在企业业务中思考AI的价值。

图 / 徐心(清华大学经济管理学院副院长)

AI经历了怎样的发展之路?

算法能为企业创造哪些价值?

企业与AI的深度交融何以成为可能?

企业中的人工智能

企业中AI的应用是有影响的。企业里有什么样的AI项目,AI相关的资源应该如何协调,如何建设?我和大家分享的内容,将更多从组织和企业的层面看人工智能项目立项和建设的过程。

如果你想得到不一样的结果,就要做不同的事情,不能做同样的事情。爱因斯坦是物理学家,我们知道物理学有三个定律,爱因斯坦还讲有三个力量统治世界,分别是愚蠢(stupid)、恐惧(fear)和贪婪(greedy)。人工智能让我们变得更聪明,我们是在破解第一个力量。

什么是人工智能?百度的吴恩达,人工智能首席科学家,曾经说现在我们人在一秒钟内能做的事情,80% AI都能做。70年代有一位名叫理查·贝尔曼(Richard Bellman)的科学家,是研究决策科学优化的科学家,1978年将人工智能定义为,人工智能是那些与人的思维、决策、问题求解和学习等有关活动的自动化。从这一层面上看,自动化相对的就是手动,一些和信息处理相关决策讨论分析的事情,过去需要手工去做,现在可以把它自动化,这个就叫做人工智能。

在Bellman给出人工智能定义的70年代,知识工程达到顶峰。我在大四的时候选修一门课叫专家系统,所谓专家系统就是专家总结一系列的规则,把这些规则输入到信息系统里面,然后再用一些逻辑运算进行判断。在现实的应用中,比如银行对小企业的授信,规模多大是一个规则,过去是否申请过贷款是一个规则,企业和哪些企业做过项目等等,满足哪些规则就加几分,最后加在一起。我们在现实生活中依据规则做出决策,往往有风险。各位在企业管理中面对的很多问题,都是复杂的决策。知识工程,也就是说靠总结规则进行决策,就是我们今天熟悉的机器学习。

近年来,人工智能依靠机器学习,在图像识别、图像处理一系列的应用中都有了很大突破。2015年在 Science上有一个里程碑式的总结,基于深度学习从图像中进行物体识别。机器学习是怎么做的呢?我们要感谢像杰弗里·辛顿这样的计算机科学家。机器学习在50年代-70年代的冰河期的时候,他们一直坚守,研究神经网络机器学习的算法;90年代,大数据的出现给了机器学习算法进行有效的训练和收敛的数据基础;硬件的发展又提供了海量的算力,三个条件并列存在,出现了一些很成功的应用,例如图像识别,这些都是未来我们所期待的AI应用的基础。

深度学习是有神经科学的基础的。Hubel和Wiesel两位科学家曾经在1981年获得诺奖,他们主要研究人的神经系统的基础工作机制,通过实验验证了人大脑中不同位置的神经系统负责处理认知中不同层面的信息。深度学习其实就是在模仿学习的过程,我们把一张照片的像素输入进去,第一层学习的就是这些照片的像素组成基本的、最简单的小零件,这些小零件再组成人脸,人脸再和我们赋予的一些意义联系在一起,这是机器学习最基本的逻辑。

机器学习很有可能对我们未来的组织产生重要的影响。我们经常说学习型组织要不断从外界进行学习,纠正自己的错误,组织相关的研究通常都是聚焦在组织形态、组织规模、组织激励、组织文化,但是往往忽略了技术的层面,那么机器学习它为什么区别于规则呢?我们把图片输入到最底下一层,它会经过算法,最终它的输出是告诉你这里面有人还是没有人,一开始的输出有可能是错误的,这就形成一个错误,形成一个误差,误差又会拿回来去更新复杂的系统中的每一条边,这个边其实就是一个权重,这就是学习的过程。我们讲企业授信的过程,例如有一个小企业到银行贷款,根据过去企业的一些特征,比如规模、行业、电费、员工等特征,经过最初的神经系统和神经元系统,神经网络得出判断是可以贷款,结果一年后企业无法还贷,说明最初的判断是错误的,这就是一个误差,要把误差再拿回来去更新最初的神经元网络。过去让一个组织更新自己的规则往往很缓慢,现在基于数据,基于现实中的业务,我们可以每天都要网络进行计算,最终企业里用于授信的神经网络算法会越来越逼近有效的算法。

从BI到AI

在AI之前,BI(Business Intelligence)这个词已经流行了20年。AI本质上是人类思维活动的自动化,第一阶段是从BI过渡到AI,第二阶段是在自动化基础上做好数据工程,第三阶段是在某一个流程上应用人工智能降本增效,或者进行流程创新,很多流程都进行创新,智能联动就形成了价值链层面的变化,最高层面的应该是人工智能的治理创新,如何在企业内部进行有效的人工智能项目治理。

第一阶段从BI到AI的转化离不开BI。 BI和AI到底有什么区别?涉及BI最核心的概念是drive down(钻取),就是我们现在各行各业里经常讲的数据切片。最大的黄色正方体代表顾客空间,按照三个维度切割,蓝颜色的群体是企业关心的群体,企业了解这个群体对营销的响应率,看到了一个平均响应率之后还不满意,就把蓝色群体拿出来再按照一些维度切割,聚焦在了一个企业觉得可以发力的小群体上。

IBM曾经做过这样的事情,顾客打电话抱怨企业卖的产品有问题,接线员接到顾客的电话之后,立刻能调阅和顾客相关的所有信息,针对顾客反映的情况,系统自动提出建议。营销经理根据客服汇总的信息,例如他所关注的某一条产品线上的顾客,进行客户价值、保全比例、盈利能力等不同维度的分析。

营销经理发现,客户保全比例只达到了目标的52%,这就是在进行一次切片,按照一个指标进行一次切片,营销经理就看到了客户保全维度出现问题,进一步切片,发现是白金卡顾客出了问题,然后发现顾客通常在商场里消费最多,于是营销经理调出商场的数据来看,这就是我们所说的BI,不断的切片。

现实中BI系统的应用如何?曾经很多公司都在用,但是效果没有达到预计的。系统提供给营销经理维度进行切片,现实中营销经理往往采用最熟悉的几个维度,性别、工作、银行账户、信用卡消费、额度等。背后的原因是,尽管技术提供给经理人进行规则总结的工具,但是人脑面对大量数据总结规则,依然很困难。

如果是AI进行营销分析该怎么做?AI不会再做这种切片的工作,会把和顾客相关的所有特征全部输入到神经网络里面,输出是这个人在营销之后的购买率。神经网络进行中间的计算,得到模型,面对新顾客时,把特征输入到神经网络,AI会估算概率,这个人是否会进行消费。

Simon曾说,“A wealth of Information creates a poverty of attention.”信息社会大量的信息导致认知能力的贫乏。当数据量很小的时候,我们偏向于HI(Human Intelligence),依靠人脑进行规则总结;数据量小规模增加,按照少量维度进行总结,BI辅助很好用;一旦数据变成海量,就需要依靠人工智能特别是机器学习,因为人工智能不依赖于人脑进行规则总结,是依靠复杂的线性函数叠加,在输入和输出形成复杂的网络,自动计算,自动生成网络,数据量越大,人工智能学习效果会越好。

组织的人工智能治理建设的第一个阶段应该自动化过程。企业创新问题可以上溯到熊彼特,大的组织能够承受创新失败带来的风险,但是当组织变得特别大的时候,没有动力进行创新,个体小组织必须靠创新存活下来。

我曾经带博士生做过一个项目,就是在一个网络平台上出现网络博主家族时,平台的创新速度和成效如何。研究这个问题有一个前提,就是识别博主的价值,我们主要将点赞和评论作为创新的效果。

平台本身也很关注这样的博主家族,我们和平台首要解决的一个关键技术问题,就是哪些人属于一个家族。平台采用人工的方式,根据经验识别家族成员,例如根据文本介绍中是否提及家族关系、网络互动和博主发言,判断是否属于同一个家族,但是会出现作弊的现象,召回率只有20%。我和博士生通过分析平台数据,发现家族之间的互动是有特征的,基于观察,我们建立了一个自动化系统,通过博主之间形成的关系网,找到中心的小群体,这个小群体内部特别聚拢,群体之间比较分散。以这样的种子节点深挖附近的群体,把这些群体聚合在一起,通过规则进行评分,召回的精确率达到78%。在这个项目里,我们实现了第一步,人工智能能力建设的自动化。

这是一种思维模式的改变。我们过去的管理工作依赖规章制度,未来学习型的组织会依靠数据和算法。这种组织的优点在于动态,可以根据组织绩效不断改变自己的内在。

数据工程

接下来,神经网络如何建设得更有效,如何把神经网络算法训练得更精准?今天在业界里面应用的人工智能算法,都是一些成熟算法,而且是云上开源的算法,企业的工作是应用这些算法把数据整理好。很多组织都会说有海量的数据,但大量的组织数据是不可用的,,因为企业忽略了数据工程。企业要做人工智能项目,第一步就是要花大力气在企业内部做数据工程。我曾经带着博士生和一家银行合作,希望通过顾客数据帮助银行提高营销成功率。我们拿到了脱敏之后的用户数据,进行了很长时间的数据整理和研究,现在有一些积极的结果。但是在和银行沟通时,我们感到,项目的业务部门归属还应该更清晰,数据工程是长期要做的事情,在做检测的时候需要有AB测验(实验组与控制组)的平台。

AI对单一流程的影响

我曾经和一家保险行业的公司合作,探究声学特征能不能反映顾客情绪,如果顾客负面情绪比较多,是不是应该优先执行?

在具体研究时,要对客服电话先预处理降噪,然后把录音切片,再用CNN (Convolutional Neural Networks,卷积神经网络)进行识别。卷积神经网络最著名的应用是识别图片里有没有猫,应用到语谱图中,横轴是时间,纵轴是频率,把声音转化成图像,识别图片里面有没有一个特殊的形状表示生气。这里面有一个难点,是需要人工标注同时互相校验,识别图片里是否有顾客的负面情绪。

我们把数据给到算法,经过训练之后效果还不错。同时我们也做了一件事情,把这通电话转成文本,我们觉得文字和情绪应该结合在一起,但特别令人惊讶的是,这个场景下,文字里反映的负面情绪并不多。有可能是因为在打电话的过程中,双方都被告知这个电话需要录音,在受控的情况下能够注意自己的文字。我们开发了一些现实中应用的场景,在现实的检验中,公司随机调增4%,据他们的经验和历史数据,有2.5%的通话有较严重的服务质量问题,采用我们这套系统,将一天内所有的电话检索一遍,按照负面情绪排序,能找到的负能情绪通话召回率达到了30%,有几乎10倍的提升。CNN是一个图像识别的技术,但是同样我们可以拿到识别声音信号上。这是我想跟大家分享的第一个感触,很多人工智能的算法是通用算法,要理解了这个算法做什么,在这个场景下能干什么。

人工智能有一个问题是黑盒子,复杂的神经网络输入1000个特征,输出电话里有没有和服务质量相关的问题,中间的计算无法解释,所以在现实应用中决策人没有信心。我们做人工智能项目,尽量在得出了较好的工程结果之后,要注意可解释性。我们在项目中做了一些分析,纵轴是电话和服务流程可能有问题的概率,概率越高,说明可能有服务质量问题,横轴是某一个特征。算法本身对特征进行排序,比较靠前的特征是情绪波动,在一通电话里,顾客情绪波动不大不代表他永远都高兴,情绪波动越高,出现的负面情绪越多,说明顾客不断的不满意,负面情绪一直在增长,很可能是有服务质量问题。

在这个例子中和大家沟通了深度学习的算法,以及可解释性的问题,它也引发关注管理问题。人工智能项目在企业内部往往涉及不同部门的业务和数据,项目应该如何设立,为什么不同部门想把数据贡献出来,有什么样的机制能够促进不同部门分享数据,如何让数据在企业内部形成一个公共品,是我一直思考的问题。

当我们聚焦单一流程的时候,人工智能算法可以帮我们做一些创新,就是技术赋能的创新。我现在正在进行一个教育类的项目。我们经常说一心不能二用,但心理学和教育学提出了一个新的理论叫交错学习,同时间要学习两到三件事。现在很多学习平台是这么设计的,根据用户测评,找准一个人薄弱的知识点,推荐有针对性的学习材料。有教育学的理论告诉我们说,同一个学习段里学习不同的事情有两个好处,大脑能更清晰地识别不同的东西,能把不同的问题组织在一起形成更高阶的问题解答模式。但让一个人一次学太多东西是不是太累了,脑力是有限的,所以一心多用有好处,也有坏处。在我们的项目中,对方为同学们出了阅读理解题目,标注每一个题目是考哪些知识点,通过学生做某一道题的结果,用统计的方法去推断他对知识点的掌握程度,背后是贝叶斯的统计过程。不同的学生随机分为三组,一组推送掌握程度较弱的知识点进行练习,一组推荐知识图谱距离较远的题目,还有一组推荐知识图谱距离较近的题目,再加上前测和后测,最终发现做题时间和正确率关系不大,中间组的同学每次练习三个联系较少的知识点,学习效果相对不好;每次练习三个距离较近知识点的同学,学习效果相对较好。这是AI赋能的一个教育研究。

毕加索有一句名言,“Computers are useless. They can only give you answers.”直到今天很多人还在讨论这句话到底是什么意思。在这个案例中,一个新的教育理念引导我们做一件新的事情,业务思想驱动业务创新。在今天大多数的情况下,AI自身不能驱动创新, AI是一个重要的工具,可以赋能,可以把想象中的事情落地。所以在这个时代,大家应该多掌握AI相关的一些工具,它会赋能你在未来做一些创新的事情。不同的流程创新之后,行业的价值链可能会发生变化,可能改变一些行业的规则。

AI治理的创新

我觉得能力建设最高的层面,是AI治理的创新。在项目中能够观察到共性的管理问题,项目立项怎么定,AI项目到底有没有经济效率,算法、数据来自不同的部门,大家如何分享这个蛋糕?这些都是企业里现在悬而未决的问题,值得我们探讨。

我觉得AI有三个职能,分别是数据、计算和评估。数据在企业应该是一个公共资源,它应该来自于所有的业务和所有的职能部门,财务、人力资源、金融的数据应该共享,所有的生产部门、供应链、销售服务都要贡献自己的业务数据。因为人工智能的算法要靠数据,把这些数据凑在一起,人工智能的算法才会有意想不到的效果。

还有一个问题,是“互联网+”还是“+互联网”,在我自己的理解中,这一点切中了互联网的本质,经济学里面成为“网络效应”。互联网上参与者越多,沟通产生的价值越大,应该做到“互联网+”,将互联网作为一个平台,其他的业务加到平台中,互联网的价值才能增长。

今天我们的人工智能都是弱人工智能,聚焦在一个很窄的领域,只做一件事情。弱人工智能是被人监管的,不能自己训练自己,不能自己开发出其他智能能力,意味着不同的算法之间不能打通的,没有交互,AI反而增加了很大的管理成本,这是我个人的看法,可能不对。我觉得 AI公司是一个很具体的小公司,做一件事,但是这个公司的价值要加在一个平台公司上,因为要使用算法,所以我们看到很多成熟而有价值的AI是大公司的产品。今年我曾经提出过垄断式创新金融科技,观察金融科技里的很多创新都是垄断式企业在做,背后的道理是因为公司垄断了数据,能够把算法训练好。但是就 AI本身来讲,AI不是平台。

目前有一些公司产生了一个数据分析库或者AI部门,这个部门应该是公司内部的一个支持部门,还是一个事业部门,或是一个独立公司,如何才能是一个好的管理机制,这其实是不同的。如果是内部的一个部门,要进行的业务会和现在部门业务冲突,如何协调是一个问题。如果是独立上市的公司,所有的业务部门去参股,用的数据去参股,业务部门愿意吗,还是有风险的。未来我想走访一些企业,和同行讨论,探讨AI在企业内部的治理创新,希望在课堂上能够和大家进行更好的分享。

徐心

清华大学经济管理学院教授、副院长

清华大学经济管理学院人工智能与管理研究中心主任。国家杰出青年科学基金获得者,教育部长江学者特聘教授。从事信息系统学科研究,主要研究领域包括IT商业价值与IT治理、数字化转型、商务计算与分析、人工智能、金融科技等。