2019/06/14 17:20 互联网
作为一门新兴技术,“联邦学习”能在保证数据隐私安全基础上,实现共同建模,提升AI模型的效果。
这样的前景,让“联邦学习”自提出以来就受到各方关注,在国内,微众银行首席人工智能官,国际人工智能学会理事长杨强教授与微众银行AI团队为了“联邦学习”的普及与落地,率先发布了商用级开源项目 FATE(Federated AI Technology Enabler)。
FATE作为“联邦学习”的第一个开源社区,吸引了大量技术爱好者与高校研究团队的目光,来自香港科技大学的研究生——敬清贺,就是其中一员。作为首位贡献者,他提出了对FATE通信框架的优化建议,显著提升了通信效率。
对此我们采访了敬清贺,分享他与团队对FATE的研究,以及更多关于FATE的期望与设想。
1.国内第一个对“联邦学习”的良好实现
敬清贺所在的港科大研究小组,主要工作中有一大项即为对机器学习框架进行优化,也因此接触到了“联邦学习”这一新兴的概念。
“联邦学习”在本质上,是一种基于多方安全计算的分布式机器学习技术,参与各方可以在不披露底层数据和底层数据的加密(混淆)形态的前提下共建模型。作为一种共赢的机器学习方式,它能有效连接“数据孤岛”,形成一片共赢的AI大陆。行业应用中能帮助不同机构打破隔阂,联合建立AI模型,同时各方的数据都不出本地,能让用户隐私得到最好保护。
而FATE作为“联邦学习”的落地实现项目,受到了研究小组的重点关注。在对FATE进行深入了解并讨论后,这一群年轻的技术爱好者,跃跃欲试地开始尝试用FATE解决研究中遇到的问题,并由此对FATE开源项目提出优化建议。
据敬清贺讲:“接触FATE一段时日后,我们感到这是国内第一个对‘联邦学习’的良好实现”。在敬清贺及研究小组看来,FATE对 “联邦学习”概念进行了丰富和拓展,不仅包括了横向联邦学习,还包括纵向联邦学习, 更将“联邦学习”和“联邦学习”相结合,从而让不同组织不同模式的数据都能实现合作。他们认为,这样的实现形式,使得FATE能为有特殊需求的机构,比如对用户隐私保护有诉求的两个公司,提供了合作的可能。
图:敬清贺接受采访
2.基于“联邦迁移学习”的FATE适用场景很广泛
据敬清贺设想,FATE的适用场景相当广泛,尤其是在金融、医疗等,对数据更敏感,监管也更强的场景下,FATE能够协助实现在保障数据隐私基础上的协同合作。
敬清贺及研究团队明白,真正的使用场景中,不可能要求两个单位训练模型时,具有相同结构的信息,这几乎是无法实现的,即使能限制整个用户都要有相同模型,那应用场景也会相当有限。因而,像FATE这样结合了纵向联邦学习,联邦迁移学习的形式,能进一步拓展适用场景。即使两个机构的模型是不一样的,它还是可以共享数据一起训练。这也是FATE最让这群年轻的研究爱好者所欣赏的点。
以微众银行为例,在不共享用户数据的前提下,微众银行联合多家银行建立的反洗钱模型,经过模拟测试,参与银行越多,模型的性能越高。而在医疗场景下,比如多家医院医疗影像、病例分散的情况,也可以通过联邦学习提升疾病预测准确度,提升整体诊疗水平。
当然,除了学习和建模能力,面对即将到来的5G时代,网络安全特别是数据安全问题也是一大要点,人人都在提给数据装上“安全阀”,从欧盟的“数据隐私保护法”GDPR(The General Data Protection Regulation),到我国国家互联网信息办公室起草的《数据安全管理办法(征求意见稿)》,数据在安全合规的前提下自由流动,成了大势所趋。
而在同样关注数据安全的敬清贺看来,FATE对加密算法的优化,使用同态加密而非DP等形式,也更有力地保障了数据安全,对AI的落地起到了极大的推动作用。
3.年轻研究团队与技术爱好者心中的FATE
作为FATE开源项目的首位贡献者,也是最早使用和接触FATE的一群年轻技术爱好者,敬清贺和研究团队的伙伴也对FATE具有许多构想,他们相信FATE框架语言还可以实现更多模型,从而应用在不同的场景中。而在性能上,他们也会继续深入研究,探索是否有优化的可能。
在采访的最后,敬清贺表示,FATE是一个非常好,非常新的东西,给AI的落地提供了更大的帮助,也让AI能应用到更多的适用场景里,对不同的领域让机器学习学出的模型更可靠,让机器学习更好地进入我们的生活。在以后,他也会持续关注着FATE,期待着自己和更多的技术爱好者,能跟随着整个框架的更新去做一些有意义东西。
4. 开源生态离不开有志向的年轻技术爱好者
据了解,敬清贺来自于香港科技大学网络系统实验室(HKUST SingLab),香港科技大学副教授、SINGLAB主任陈凯带领学生们共同研究网络系统的设计、分析和落地。实验室这一研究可以打破人工智能设施Scale Out的通信瓶颈,提升人工智能基础设施的算力,让联邦学习技术更好、更快的落地。
像敬清贺这样的贡献者初现峥嵘,可以预见,在以后会有越来越多高校和年轻技术爱好者投入FATE开源项目建设中。杨强教授欣慰地表示:一个有活力的开源生态离不开有志向的青年人的贡献。
杨强教授指出,安全和保护隐私的智能计算是软件业当前最重要的发展方向之一。FATE已经成为维系大数据、人工智能和多方计算架构的主力军。我们欢迎更多像清贺这样的技术新秀参与其中,让这个“机器学习大数据的操作系统”生态变得越来越有活力。
同时,面对许多技术爱好者及开发者所关心的联邦学习走向,以及这门技术的未来发展等问题,杨强教授讲到,“联邦学习是一种保护用户数据隐私的有效技术,它的研发和工业应用密不可分。所以,在接下来的发展中,也期待越来越多的企业和机构会采用联邦学习技术,发展2C和2B的人工智能垂直应用。”
社会对隐私和数据安全愈加严格的要求,将会推动新的加密技术和多方建模的技术更加蓬勃的发展。让我们一起期待。
FATE开源社区,汇聚了大量人工智能专业人士,为联邦学习的“帝国”添砖加瓦。
来github一起参与项目,贡献者将加入FATE开源项目名单,更可获取300-10000元等同价值激励:https://github.com/webankfintech/fate
了解更多,可访问FedAI联邦学习官网:https://www.fedai.org/#/
咨询及沟通,可添加【FATE开源社区助手】微信号:FATEZS001。
榜单收录、高管收录、融资收录、活动收录可发送邮件至news#citmt.cn(把#换成@)。