杨强：“联邦学习”助力解决金融难题（附讲座预告）

新闻动态 · 2021-03-15

作者：佚名

　　2020年1月，微众银行首席人工智能官、香港科技大学讲座教授杨强当选为国际人工智能协会2021大会主席，成为AAAI历史上首位华人主席。杨强教授也是“中国智能科学技术最高奖”吴文俊人工智能科学技术奖得主，他三十年如一日，专注人工智能理论研究与应用落地，在国际人工智能界享有盛誉。

　　杨强教授的研究横跨学界和业界。他在人工智能顶级期刊发表了数百篇论文，开创了“迁移学习”理论，这被认为是人工智能最有前景的技术方向之一。但他说理论不落地，泡沫就会破灭。他加入微众银行，带领团队探索解决人工智能落地金融的“卡脖子”难题：数据隐私保护与数据孤岛问题，致力于打造智能无人化普惠金融服务，并同时推动“联邦学习”的生态建设。他认为，要在大量产业实践基础上，进一步深化研究成果，反哺学术界。

　　日前，这位当初就读北京大学天体物理专业、差点成为物理学家的国际知名人工智能专家接受了《北大金融评论》专访，谈及人工智能领域的最新研究方向、在金融领域的应用，以及研究方法等热点话题。

破解数据孤岛与隐私保护难题

　　《北大金融评论》：作为人工智能前沿领域的专家之一，您曾说AI如果不落地，如果大家都埋头写论文，这个泡沫最后就破了。您认为AI最有应用潜力的场景是什么？

　　杨强：人工智能是IT产业发展的新阶段，是一个把我们的工作变成“自动化”的过程的延续。在“自动化”这个方向，AI不是一个独立的全新市场。所以，“人工智能+行业”才是未来发展的重要方向。AI当前在金融、医疗、教育、安防、娱乐等各行各业都可能有广泛应用。但真正发挥它的作用，还需要把技术和商业对接起来。

　　如果AI在某个领域一直被认为有潜力，但一直没有找到成功商业化的方法，这个领域的AI就会出现泡沫。写科研论文是告诉同行AI这个领域在某个方面有潜力，有落地的可能性。但如果大家都只是在写论文，没有探索商业化的路径，那AI在这个方向也同样会出现泡沫。

　　以金融行业为例，金融领域的重要特点就是它的数据量大且多维度，这也就正好为AI提供了一个先决条件，因为现今的AI是基于大数据的。金融业AI化的过程也是自动化过程，帮助行业降低成本，提高效率，让过去因为成本高效率低而只有少数人能够享受的“VIP服务”可以平民化，普惠大众。

　　以微众银行为例，作为国内首家互联网银行，在亿级客户量、亿级日交易量背后，是人脸识别、OCR文字识别提升用户身份认证效率，智能客服降低人工客服成本，提升客服效率，用联邦学习联合多家金融机构共建反洗钱模型和金融风控模型，降低不良率，发现需求，提供智能资管提升和资产管理整体水平等。

　　但是，金融业的AI并不好做，原因是金融业在具备大数据的同时，也对数据的安全、隐私保护有着比别的行业更严格的要求。这就为AI在金融业的商业化提出了巨大的挑战：如何做到既能让不同数据拥有方聚沙成塔、珠联璧合，又能保护各自的数据安全和用户隐私。

　　所以，当前AI在金融业应用发展中也要解决的一些问题，包括需要打破“数据孤岛”和“数据隐私保护”的难题，合规的数据联合建模是未来的大方向。这也是为什么我们认为“联邦学习”和“迁移学习”将成为解决数据安全和数据隐私保护，以及小数据、细碎数据问题的重要驱动力。

　　《北大金融评论》：请您具体谈谈“联邦学习”和“迁移学习”，以及两者的关系。

　　杨强：联邦学习是把“碎数据”和“数据孤岛”连接起来，解决隐私保护下的多方协作问题。

　　迁移学习是从“大数据”到“小数据”的迁移，重点解决了“小数据”的问题，让知识可以从一个源领域迁移到另一个目标领域，是一种“举一反三”的学习能力。

　　两者的关系是，进行联邦学习时常常需要做知识迁移，因为数据孤岛分布不均匀，有的大有的小。于是我们提出的“联邦迁移学习”正是把联邦学习和迁移学习结合起来，发挥两种机器学习的优势。让不同机构在保护数据隐私的前提下合作，没有算法、领域、数据类型的限制，而且模型效果无损失。

　　联邦迁移学习目前还处于研究阶段，是纵向联邦学习和横向联邦学习的增强、提升和统一，实际工业应用还有待开发。

　　《北大金融评论》：您曾表示，金融领域提高效率的痛点很强烈，联邦学习可以解决这些痛点吗？

　　杨强：联邦学习是破解“数据孤岛”与“数据隐私保护”难题的关键技术。这两个问题在对数据安全要求高、监管严格的金融行业尤为明显。

　　信贷风险管理、核保风险评估等都是联邦学习比较适合的金融应用。相对于其他领域，金融应用更着力于对风险的量化，毕竟风险价格往往是金融产品价格的重要组成部分。

　　基于联邦学习的风险量化模型，能通过扩展数据维度，显著改善风险量化能力，从而降低整体金融产品价格，进一步提升金融服务对社会大众的可得性。

　　《北大金融评论》：除了联邦学习，您认为金融智能化趋势中有哪些已经落地的、较为成熟的人工智能技术？

　　杨强：AI在金融领域前、中、后台服务中都有很多应用，比如在微众银行的实践中，前台服务通过人脸识别、线上客服等应用提升了服务效率，通过用户画像和AI推荐、AI广告实现精准营销和定制化服务；中后台通过AI实现业务流程优化、智能风控等工作。

　　此外，人工智能技术与另类数据结合（另类数据是投资过程中使用的非传统数据，包括卫星图像数据、舆情数据和IoT数据等），可以做行业分析，进行智能化的资产管理和投资理财。已经有数据显示，AI驱动的资产管理和理财相对传统方式有许多优点，通过深度学习和强化学习，AI在很多方面可以和人类互补，在个别方面甚至可以超过人类的表现。

　　人工智能的“对抗性机器学习”技术在安全反欺诈的应用上有很大发展空间。基于语音、图像和对话系统，可以打造“无接触、个性化”银行服务。在自然语言处理领域，预训练深度学习模型可以用来做人类助手，处理大量的文本数据，进行行业经济分析。机器学习的预测能力的进一步提高，将大幅推动个性化金融权益，如保险权益等服务发展。而推荐系统的进步，也将带动金融业主动发现用户需求，开拓新市场，提升存量用户的活跃度。

　　不足在于，当前只能做到“点”上全自动金融服务，在“面”上还很难做到，需要专家、监管机构的共同参与，需要机器和人的协作。

开放领域的AI需要大的突破

　　《北大金融评论》：人工智能技术目前最前沿的研究是什么？痛点在哪里？

　　杨强：人工智能发展至今，大家更多关注探索落地到实际的场景，比如医疗场景、教育场景、金融场景。会发现医疗场景很难，教育场景也很难，还有很多更难的。这些“难”，往往都是在开放领域。

　　所谓开放领域，就是说在设计AI模型的时候，没有预估到的因素不断出现。反之，如果所有的影响都能看到，就是封闭的场景。比如，AlphaGo就是一个封闭的场景，德州扑克也是，就这些牌，只不过出的时间和顺序不一样。

　　但你走在路上，突然出来一个人，路封了，天黑，下雨，刮风，这些不可控的因素影响都是开放领域。开放领域的人工智能现在没有特别大的进展。

　　此外，人工智能是数据推动的，要发展人工智能，先要找到数据，而合规的数据联合建模是未来的大方向。这也是为什么我们认为联邦学习将成为数据安全和数据隐私保护时代下推动人工智能大规模产业化的重要驱动力。还有一个痛点，是AI系统的可解释性。金融行业对数据安全要求高，监管严格，尤其是现在很多AI技术还相当于“黑箱”，即很难对用户解释它的结论是如何得到的，出了问题也很难解释问题出在哪里。监管机构往往想知道模型的原理，所以“可解释性”的挑战也对AI的技术和应用提出了更高要求。

　　《北大金融评论》：您说迁移学习就是举一反三，是一种智能。您认为在可见的未来，人工智能可以和人一样产生这种举一反三的能力吗？

　　杨强：的确，迁移学习是从“大数据”到“小数据”的迁移，从一个领域到另一个领域的迁移，重点在解决“小数据”的问题，让知识可以从一个源领域迁移到另一个目标领域，是一种“举一反三”的学习能力。

　　我认为，“举一反三”是智能的系统所必备的一个条件，而迁移学习是“举一反三”这种思维方式的一个实现方法。现在的人工智能算法只具备初步的知识迁移能力。过去，迁移学习需要人类来给出两个领域，以便让它们进行知识迁移。我们正在研究的课题，是不告诉机器知识从哪里来，而让机器学会如何找到相关的领域来进行迁移。同样，过去，知识只在两个领域间迁移。我们现在研究的一个问题是，如何在多个领域间进行知识迁移，就像一个人过一条河，用很多个石头垒成一串踏脚石，一个一个地迁移过去。另外，一个有趣的研究是让系统学会如何做迁移学习，即学习如何学习，就像一个学生学会了学习方法一样。

　　《北大金融评论》：近年来出现了人工智能学习热潮，作为过来人和业界专家，您认为有意学习AI的年轻人需要做哪些准备？

　　杨强：我觉得，会问问题和爱问问题比会解问题更重要，实际上，“Learning how to learn（学习如何学习）”正是机器学习所需要的能力。我研究了迁移学习以后，发现教育学里有一门学问，叫“学习迁移”（Transfer of Learning），即是研究如何教会人类学生如何学会学习方法，举一反三。这和人工智能的迁移学习有着异曲同工的目的。

　　此外，AI人才首先是计算机人才，所以年轻人对于计算机思维和逻辑思维的培养至关重要。要转变观念，相信机器的能力大于人的能力。在AlphaGo之前，“机器人下围棋能比人厉害”并不是共识，AI人才首先要有信念，自己虽然可能不是某一领域的高手，但是自己做的机器和算法可以成为各领域的高手。

　　《北大金融评论》：普通人如何应对人工智能、机器学习时代的挑战？

　　杨强：任何技术手段最终都是为人服务，人工智能在很大程度上是帮助人完成重复性、枯燥的工作，让人可以把更多精力放在创造性的工作中，人机协同将在很长一段时间内成为主流趋势。大家一方面可以更多借助人工智能去更好地完成自己的工作，另一方面可以更加专注于提升创造力。从某种意义上说，人类更善于定义问题，而人工智能更善于解决人类定义好的问题。至少在现阶段是这样，因为定义新的问题需要系统除了归纳能力以外，还要具有创造力。总之，在创造力和可适配性（Adaptable）这一点上，人类智能现在还远胜于机器智能。

本文完整刊登于《北大金融评论》第三期