【36氪收录】观「招商银行」隐私计算布局的思考
编者按:本文来自微信公众号“101链视界”(ID:asympTech)观「招商银行」隐私计算布局的思考,作者:曾钊创,原文题目《观「招商银行」隐私计算布局的思考》,36氪经授权发布。
相关阅读:《专访「招商银行」总行人工智能实验室负责人李金龙:隐私计算价值被认可,但行业还处于"春秋战国"阶段》,作者:36氪龙真梓
前言
李金龙老师表示,隐私计算价值已经被市场认可,但行业还处于"春秋战国"阶段。
我对此深表赞同,隐私计算应该说是应监管而生,国外在早些年便开始关注数据安全,随着国内对数字经济的重视,政府对网络安全、数据安全和个人信息安全的重视程度也逐渐走向深水区。
从国内的立法布局来看,《网络安全法》、《数据安全法》和《个人信息保护法》三部基础性法律的正式施行,也意味着「数据安全」已经成为这个时代最值得关注的重要议题之一。
在法律法规的指导之下,为了确保数据以安全、合规的方式流通,隐私计算将成为解决以上问题核心的技术解决方案,同时,更多企业和个人也将目光投向了隐私计算,期待了解、使用这一新技术的落地情况。
01 应用隐私计算的目的
据招商银行总行人工智能实验室负责人李金龙介绍,招行初次接触隐私计算是从2019年开始,当时是因为和微众银行同处于深圳,针对联邦学习这项技术有所交流,之后便开始尝试应用。
从2019年后半年至今,招行都有具体的应用场景落地。在具体场景上,招行做这件事的首要目的还是为了防范风险,包括信用风险,交易风险的反欺诈等等。
招行应用隐私计算技术是看效果的。隐私计算一方面是保护隐私,另一方面是保护企业的数据资产。在这两个命题下进行数据价值的流转需要新的技术方式,所以招行采用联邦学习、隐私计算这类技术,让它的作用反映在业务上。
我个人认为,技术永远是中性的,隐私计算也不例外,技术一定是为了解决业务层面的具体问题才能有所落地,否则永远只是实验室的产物,这一点我一直看得比较清。
不管是联邦学习也好,隐私计算也好,都必须为业务贡献其技术价值,否则再新的技术永远是“镜中月、水中花”。
隐私计算能够实现数据“可用不可见”的目标,助力数据安全、合规流通,防范风险,这就是它所能给业务带来的价值,也就是所谓的技术赋能业务。
甚至再往长远思考,技术应该能够引领业务的发展。科技的加速演进推动监管以及新兴范式的加速就是“科技引领业务”的一个重要前兆。
02 隐私计算大规模应用要解决的问题
根据招商银行总行人工智能实验室负责人李金龙在回答36氪的采访中,我针对最近在思考的关于隐私计算大规模应用需要关注和解决的的关键问题,提炼了以下五点建议。
1. 易用化、平台化、批量化
我认为技术一定是要让更多人参与进来才能焕发出更大的活力,全球最大的开源社区Github也印证了这一点。
李金龙老师介绍的一个观点我也十分认同,“如果门槛太高,仅仅只有特别专业的技术人员才能通过命令行或者复杂加解密方式才能使用的话,那么这件事的范围做不大。” 我认为这是隐私计算技术的易用化问题,底层技术研发人员应致力于解决这一问题。
我们一定要降低门槛,让数据跨主体的使用和企业内部的数据使用方式一样。这一个理念和我的想法不谋而合,根据我之前从事的大数据应用开发(数据加工)的经验来看,要想提高生产效率,则必须降低应用层开发者的开发门槛,让只懂SQL的开发人员可以直接在隐私计算平台上进行跨域的数据清洗、加工、建模。
我认为这是隐私计算技术的平台化问题,只有让普通开发者能够实现应用自身的应用层隐私计算开发,这项技术才有真正大规模应用的可能。
而关于隐私计算技术的批量化,我认识和平台化有紧密的联系,当平台化做到一定程度时,可以考虑传统批量的实现模式,让隐私计算平台也具备批量计算和加工的能力。可以说,批量是自动化的一种体现,我们应致力于减少人工的介入,实现最大的价值。
2. 差异化的数据源互补
针对金融企业来说,我觉得较为有价值的差异化数据源是运营商和互联网企业。
因为对金融企业来说,其自身已经具备了较为较为丰富的金融类数据,像客户信息、结算数据、消费明细等,而缺少像客户的网络流量使用时间分布、地理位置信息、消费偏好、娱乐偏好等数据,而这些数据是掌握在运营商和互联网企业手中。
差异化数据的补充对企业自身的业务效益提升十分有帮助,因为一旦解决了短缺的数据维度问题,这些差异化的数据能够和金融行业自身的数据做一个补充,进行纵向联邦学习。
而对于同行业的企业,如同为金融行业的企业,如果未来能从数据样本量方面实现差异化的数据源互补,则可以进行横向联邦学习,双方都能彼此获益。
3.运行速度与可靠性
据李金龙老师介绍,隐私计算技术的大规模落地还需要关注运行速度与可靠性,因为联邦学习经过加密、解密,建模速度很慢,比一般的明文本地建模要慢5~10倍,运行速度与可靠性对企业级应用来说是十分关键的指标。
现在行业里也有一些公司在做这件事,有软件加速和硬件加速各种研究。软件加速的比较多,硬件加速像星云Clustar会提供。
而不管是软件加速还是硬件加速,我认为还有比较长的路要走,甚至是从隐私计算底层密码协议的优化和提升来说也是对运行速度与可靠性提升的有力支撑。
同时李金龙老师还提到权威机构的认证,我个人了解到这一块由中国信通院领衔的相关评测还是相对权威,如果企业的隐私计算产品得到了信通院的评测认证,将极大提高自身的背书。
4. 互联互通与生态建设
李金龙老师表示,隐私计算目前的互联互通还在路上,这也是这个行业还不太成熟的特征之一。
同为身处这一行业的研究人员,我十分赞同这一观点,虽然各个行业都在积极制定规范,但由于行业还处于较早期,即处于野蛮生长阶段,所以还是以企业内部试点为主,还没有真正进入跨企业大规模隐私计算阶段。
据了解,2021年7月份,中国支付清算协会正式发布《T/PCAC 0009-2021多方安全计算金融应用评估规范》,这是国内首个金融行业的多方安全计算规范,将会对行业的发展起到指导性作用。
技术的发展总会有一个过程,虽然目前还远远没有达到互联互通阶段,但那一天一定会到来。
5. 强有力的数据联盟
李金龙老师表示,在数据的生态上,如果能有平台性质的组织出来,让大家更有序和有效率地进行数据共享。
不管是从工具层还是执行、应用层面,行业里还没达到比较广泛统一的状态。如果是一个成熟的体系,应该需要一个白皮书或者具体的行动指南,这些都需要大家一起逐步摸索。
这个组织可能需要是一个全国性的组织,来把整个技术、规范都统一起来,这样大家才能更好地对话、探讨和推进各类问题。组织至少可以把主要的参与者都拉到一个平台上对话,让大家互相协作一起往前走,可能就能更好地提升数据的风险防范能力,也能提升业务上的运行效率。
正如我上面提到的中国信通院,我个人觉得信通院是一个比较好的角色。首先,信通院是有较强的影响力,能够组织各行业进行对话和讨论;其次,信通院是国家ICT领域重大战略和重大政策的核心制定者,能够以国家级的标准引导行业发展;最后,信通院是国家机构,能够指导行业在合规的路上发展得更良好。
03 结语
深度阅读了李老师的发言,始终觉得自己需要学习的东西还有很多,关于技术的、关于金融业务的、关于商业模式的,这也是我个人发力的方向。
我选择区块链与隐私计算领域的方向很简单,总有一部分人要先看到未来,而我想成为这一小群人的一份子。
我认为,未来的商业模式终将会因为技术的进步而改变。
技术人,不白嫖,如果您觉得文章对您有帮助,帮忙点个推荐吧~
36氪收录原文:https://36kr.com/p/1477145469956869