题记:2023年2月28日,北京信息科技发展中心主办、阿里巴巴人工智能治理与可持续发展研究中心(AAIG)协办的《这个AI不太冷》第一期ChatGPT专题研讨会在北京举办。本文根据北大国发院助理教授、数字金融研究中心研究员胡佳胤的发言整理。
我今天要讲这个题目以ChatGPT为切入点,实际上更多地还是看普遍意义上的算法和人工智能给整体经济带来的影响,挂一漏万,请大家指正。我的视角是经济学和金融学,主要分析以ChatGPT为代表的人工智能对数字经济的影响,重点有如下三个方面:
• 替代还是互补?ChatGPT对未来工作性质和劳动力市场的改变
• 纠偏还是带偏?在算法与人的交互中,人发挥的作用
• 壁垒还是机遇?对数据价值和数字经济竞争格局的影响
第一点是如何看待ChatGPT及其代表的人工智能、算法、机器学习等各种数字技术对工作的影响,尤其是说这对于人力是替代还是互补。因为ChatGPT刚问世时,很多讨论都认为大量的人可能从此失业,或者未来的工作性质和内容有变,这都是对劳动力市场的改变。
第二点如何看待人工智能和算法对决策的作用,是有助于纠正人在决策中的认知偏误,还是放大偏差。这不只是关系到数字技术在经济生产上的运用,还对社交网络的发展、价值观的形成和整个经济社会的组织形式都有较大影响。
第三点如何看待人工智能的时代到底是制造了数字经济市场竞争中的壁垒,还是创造了新的机遇。一方面是人工智能和算法本身的重要性,另一方面,用于算法训练的数据集也具有相当的价值。数据和算法既有可能成为市场竞争的进入壁垒,也有可能给弯道超车和跨界竞争提供机遇。
替代还是互补?ChatGPT对劳动力市场的改变
先展开讲第一点,ChatGPT对未来工作内容性质和劳动力市场的影响。
ChatGPT出来之后,非常多的新闻报道和自媒体都讲到它对写作和内容创意行业的颠覆。ChatGPT对写作、修改润色、信息归纳、创意和编程能力的替代作用惊人。现在很短的时间内,用户就可以让ChatGPT根据指令生成一些讲话稿、新闻稿和对资料的整理等等。这也意味着这些行业里,从业者所积累的相应技能的贬值速度大大提高。
我们一度也在想,研究者写论文的工作是不是也要被替代掉?因为我们发现ChatGPT可以迅速生成文献综述和研究计划,而且写得非常流畅。
当然,ChatGPT会存在信息准确度不高甚至编造事实、创造虚假信息的问题,包括对学术文献的捏造。可能是因为ChatGPT本身没有联网,接入的信息比较滞后,而且还没有学术期刊数据的获取权限,所以它整理输出的很多论文都是自己编出来的,就带来了信息真真假假的情况。
但我们想象一下,假设这些数据库都对ChatGPT开放,而且不允许它编造内容,那么未来研究者做的大量工作是不是都可以交给ChatGPT?再想一想我们每个人工作的性质和内容,是不是大部分都可能会被替代掉?
在经济学的研究里,人工智能对劳动力市场的影响被总结为三个效应。
第一个是替代效应。比如说以往人们工作里大量的重复性、机械性的体力劳动被机器人所替代,现在则体现为一些重复性、模板化的脑力活动(例如文字资料的整理写作和一些编程工作)被人工智能所替代掉。
第二个是互补效应。人工智能与人互补的作用往往体现在需要人为介入或干预的工作上。比如说ChatGPT生成的一些内容可能需要审核,或者需要人进一步编辑、承诺、担责等,这时候人工智能就变成一个所谓的助理职能,跟人承担的其他工作角色形成互补。人在其中发挥着不可替代的功能。
第三个是创造效应。人工智能在摧毁一部分的工作的同时又提供一些新工作。这与数字经济的蓬勃发展和新职业新岗位的诞生密切相关。
值得强调的一点是,ChatGPT等数字技术带来的是异质化影响,对不同的劳动力群体影响不一样,会有结构上的改变和不同人感受的分化。以前的机器可能是替代一些重复性的体力劳动或者相对低端的工作,但ChatGPT等人工智能的发展实际上是对白领工作的很大冲击。它其实不一定影响低教育背景的人群工作;像服务业(包括快递外卖和理发等等)还是需要大量的人去线下工作。
基于美国数据的研究表明,过去几十年,大量的中端工作被技术进步替代掉了(当然还有全球化和国际分工的影响)。但相对高端的工作和相对低端的工作一直存在,反倒是中间的与脑力劳动相关的一些白领工作会被替代掉(或外包)。
MIT的Daron Acemoglu教授和合作者有一系列研究都是关于人工智能对劳动力市场的影响。他们把每一项工作的具体工作内容拆分开,看一看有哪些是比较简单重复的工作,哪一些是需要人与人之间面对面交流或者说更注重情感体验的工作。他们把这些工作内容分为很多个维度,然后把每一项工作可能被人工智能替代掉的概率做了排名。
左边的图是按职业类型排名,右边是按行业大类排名。我们其实看到的是很多管理类的职位被AI替代的概率最大,其后还有一些专业技能类的岗位,还有办公行政类的岗位。
具体到行业领域来说,像金融业,现在大量运用金融科技进行数字化转型,很多可能都不用雇佣柜员、放贷员和客户经理,而是更多地雇佣编程人员,或者运用算法来进行人力上的精简。相对最不容易被人工智能替代的反倒是类似零售行业和仓储物流行业等传统线下工作的岗位和行业。
以前我们可能担心机器人的大规模应用让一些低教育背景或者低技能的人失业,现在人工智能的发展则可能是让白领工作更难找,所以这就会带来一个对宏观经济的结构化影响。也许大学生以后能找工作的范围变得可能更加局限。当然,也有可能数字经济中又有更多新的职业被创造出来,比如说自媒体职业和创业。但确实未来的就业市场的发展变得更加复杂,我们传统教育方式的回报率可能下降,学校能给年轻人带来的知识和技能附加值很可能变得更低。
我们自己也用中国数据做了一些分析,通过智联招聘上职位空缺的发布情况来看理论上的人工智能替代率和企业实际招工情况之间的关联。这些结果总结在北大国发院和智联招聘联合发布的《2022雇佣关系趋势报告:数字时代的多元雇佣关系》中。具体而言,北大国发院的李力行教授及合作者把上面讲的各个工作的内容和性质特征对应到中国的职位中来,计算了一个人工智能的替代率(被自动化、智能化替代的概率可以参见论文:
https://www.nsd.pku.edu.cn/cbw/jjxywkw/cejxwg/501438.htm)。然后我们计算出2018年至2022年间各职位大类职位招聘发布数量的变动率,将这一职位数量变动率为纵轴,被人工智能替代概率为横轴作散点图,每个点表示一个职位大类。我们预期被人工智能替代概率高的职业在2018-2022年间发布的职位数量会逐渐减少,所以预计散点拟合出的趋势线应该是向下倾斜的。
但是实证结果表明,该趋势线较为平缓,甚至是略微向上倾斜的。这表明2018-2022年职位数量变动情况与被人工智能替代概率关联不大。近年职位数量变动可能更多地反映了短期经济形势的影响,在短期,人工智能替代就业的趋势还没有体现出来。
我们的发现其实跟美国的情况也类似。Acemoglu教授和合作者在分析2010-2018年间美国的在线招聘广告数据时,在微观公司层面确实发现了AI技术的引进和AI的冲击对这些公司招聘的影响。例如,受AI影响更大的公司降低了非AI相关的招聘,同时也会雇佣更多的具有算法或者相关背景的人员,而且招聘广告中要求的技能更新迭代速度更快。然而,在加总的职位或行业整体层面,他们也并未看到AI算法对劳动力市场的显著影响。微观层面的变化从宏观上来看并不显著。
中美两边的职位招聘数据都没有在宏观层面看到AI代替人工的明显趋势,这个挺有意思。因为我们通常都认为数字技术和人工智能的发展是代表未来的发展方向,然而短期内我们很难从整体层面看到影响。一方面这个技术它本身也是在发展的初期阶段,另一方面高科技公司可能也只是整个经济体的一部分。(“However, while AI technologies appear to be changing task and skill composition at exposed establishments, any aggregate effects of AI, if present, are not yet detectable—plausibly because AI technologies are still in their infancy and have spread to only a limited part of the US economy.”)
再者,每个企业自己要真的去采用新技术(technology adoption)也是需要时间的。市场的优胜劣汰也需要一个过程。包括像我们之前研究的远程办公(以前公众号发布的报告:胡佳胤做的报告链接)也是如此。通讯、互联网和数字技术的进步其实已经让远程办公成为一个可行的选择。也有研究指出了远程办公可以通过降低通勤成本来提高工作效率,并为员工提供更多平衡家庭和事业的空间,增强大家工作的幸福感。但事实上,在疫情爆发之前,我们很少会看到有企业提供远程办公的选项。疫情催化了部分企业远程办公的持续转型。
值得指出的是,这些研究使用的都是ChatGPT出现前的招聘数据,无法捕捉最新的动态发展。ChatGPT是否催化了人工智能对劳动力的替代?这一点值得我们持续关注。
纠偏还是带偏?算法与人的交互中人发挥的作用
第二点要展开讲的是以ChatGPT为代表的人工智能在与人交互时扮演的角色。人做决策时,可能或多或少都会带有一点认知的偏差,甚至是自觉或不自觉的歧视。
我以自己从事的金融科技研究来分析人工智能的运用效果。人工智能在金融领域的运用之一就是智能投顾(robo-advising),通过算法来帮助投资者做决策。人们自己做投资决策时,往往会有一些情感和认知上的因素在起作用。有一些就是行为金融学领域已经被反复研究和验证过的偏误,比如说过度自信。研究里往往发现中年男性的过度自信特征尤其明显,所以他们经常会采取一些激进的股市投资策略,比如重仓个股,这往往代表了投资者对自己选股能力的过度自信。但金融学理论认为你应该采取一个多样化的资产配置。再比如频繁地买进卖出,这往往代表了投资者对自己“择时”能力的过度自信,因为投资者总觉得自己可以在低位买进,然后高位卖出,但事实往往反过来。金融学文献已经对各种非理性投资行为有丰富的记载。
如果可以通过智能投顾的方式,让投资者把钱放在算法控制的智能投顾平台里面,那就相当于是让人工智能算法来做决策,实际上是可以拉平不同投资者之间的投资表现。这已经有相当多的文献验证了这一点。当然,股市投资整体能不能赚到钱,金融市场是不是有效,这就不仅仅是算法问题。
人工智能和算法在金融领域的第二个运用就是借贷中的金融科技。国发院黄益平老师有一系列关于大科技信贷的研究分析,包括蚂蚁集团提供的310贷款等等。我们有一项新的研究是看一家传统小贷公司的金融科技转型。我们发现这家公司在采用金融科技算法模型之前,对本地和外地借款人有一个差异化的对待。当然我们也不能直接说这是非理性的人为歧视,因为可能放贷员觉得他们不太了解外地人,信息不对称更严重,所以给定同样的抵押品,他们给外地人放贷的总金额偏小,未必非理性。
但我们发现这家公司引入算法决策之后,外地人能获得的贷款金额上升,放贷时的本地人外地人差异减小,而且最终外地人的实际违约率也没有上升,说明之前的人工决策确实是有一定的认知偏差。这个不仅对公司的利润有影响,而且也关系到普惠金融的发展。
更有意思的是,这家公司在引入算法之前其实已经引入了一个金融科技的大数据信用评分,理论上应该是可以缓解信息不对称问题。但是我们并没有发现这个大数据评分对本地借款人和外地借款人获得的贷款金额差异有影响。一个可能的解释是说这个大数据信用评分只是对人的决策起到一个辅助作用,并没有像算法模型那样替代人的决策。也就是说放贷员对外地人的认知偏差或者所谓歧视(taste discrimination)依然存在,只有当算法替代了人工决策时,影响才会出现。
智能投顾和金融科技借贷的例子表明人工智能和算法可能带来一个优势,即缓解人在决策中的认知偏差和歧视。