当前位置:

首页> 资讯 >正文

NVIDIA新一代联邦学习系统 充分保护隐私数据

更多文章
信息来源:中国数字医学     作者:王崇民    发布日期:2019-10-21
NVIDIA新一代联邦学习系统,充分保护隐私数据
——访NVIDIA医疗副总裁Kimberly Powell女士

近年来,医疗人工智能领域发展迅速,初创企业、新的模型都在不断涌现。对于医疗AI数据模型来说,临床数据是研究的基础,只有运用大量的临床数据进行训练,AI数据模型才会更加强健。不过,由于医疗数据不同于一般行业的数据,具有其特殊的敏感性和重要性,因此对于这些AI初创企业来说,获取用于训练模型的数据仍然是面临的主要挑战之一。
 
不过这种情况有望得到缓解。近日,NVIDIA与伦敦国王学院发布了首个面向医学影像的隐私保护型联邦学习系统(Federated Learning System)。在深圳举行MICCAI2019大会期间,NVIDIA医疗副总裁Kimberly Powell就隐私保护型联邦学习系统与相关媒体进行了详细的交流。

 
NVIDIA医疗副总裁Kimberly Powell女士
 
Kimberly Powell介绍说,隐私保护型联邦学习系统是NVIDIA与伦敦国王学院为促进医学研究、保护数据隐私以及改善患者脑肿瘤识别结果而开发的一套用于医学影像分析且具有隐私保护能力的联帮学习系统,她能够让开发者与各企业机构利用分散在多个位置的训练数据对中心深度神经网络(DNN)进行训练,可以支持多家企业机构针对共享模型开展协作,而无需共享任何临床数据。

 
隐私保护联合学习系统架构图
 
Kimberly Powell基于隐私保护型联邦学习系统的架构图(如图所示)继续解释到:“从这张图可以看到,左侧有一个全局的AI模型,通过这个系统,可以将这个模型分散到各个不同的医院,并在每个医院各建一个本地模型,再利用医院的临床数据在本地进行“数据训练”。之后,各医院会将最终的训练结果和信息再传回到左侧的“全局AI模型”中去。从这个架构可以看出,联邦学习系统在无需共享患者数据的情况下,即可实现协作与分散化的神经网络训练。医院的临床数据无需在医院外使用,让病人的隐私数据能够得到很好的保护。”
 
针对隐私保护型联邦学习系统的安全性,Kimberly Powell指出,虽然联邦学习可以保证极高的隐私安全性,但通过模型反演,仍可以设法使数据重现。为了帮助提高联盟学习的安全性,研究人员研究试验了使用ε-差分隐私框架的可行性。该框架是一种正式定义隐私损失的方法,可以借助其强大的隐私保障性来保护患者与机构数据。
 
据Kimberly Powell介绍,上述试验是基于BraTS2018数据集的脑肿瘤分割数据实施的。BraTS2018数据集包含285位脑肿瘤患者的MRI扫描结果。该数据集旨在评估面向多模态与多级分割任务的联邦学习算法。在客户另一侧,研究团队改写了一个原本用于数据集中式训练的一流训练管道,并将其用作为NVIDIA Clara Train SDK的一部分。此外,研究团队还将NVIDIA V100 Tensor Core GPU用于训练与推理。
 
在系统安全性方面,仍有记者认为如果知道系统底层的运行逻辑,根据模型训练出来的数据,有可能推导出原有的数据。对此,Kimberly Powell做了进一步的解释。她说:“我们的研究人员,也考虑到了这个问题,所以又往前走了一步,给隐私数据加了一个保护层,即我们在数据训练完成之后,在数据中加入了一些“噪点”,使得一些数据变得模糊,同时也改变了原有数据的颗粒度,这样会使反推更加困难了。”
 
最后,Kimberly Powell总结说,相比于数据集中式系统,联邦学习所提供的方法可以在不共享机构数据的情况下实现相当大的分割性能。此外,实验结果显示,隐私保护与受训模型质量之间产生了自然折中。而且通过使用稀疏向量技术,联邦学习系统可以实现严格的隐私保护,且对模型性能仅产生合理的轻微影响。她说:“在联邦学习系统中大量运用了深度学习方法,它是一种从医学数据中自动提取知识的强大技术。联邦学习有望有效聚合各机构从私有数据中本地习得的知识,从而进一步提高深度模型的准确性、稳健性与通用化能力。此项研究为部署安全联邦学习方面,做出了巨大的推动,并将广泛推动数据驱动型精准医学的进步。”
 
在本次交流会上,Kimberly Powell还提到了NVIDIA去年发布的NVIDIA Clara平台和Clara软件开发套件(SDK)。据悉,NVIDIA Clara平台是于去年早些时候推出的一个开放平台,可供开发者和合作伙伴利用NVIDIA在人工智能、高级可视化和高性能计算方面的技术和专业知识,以开发新一代医学影像设备和工作流程。而Clara SDK是在去年底推出的旨在为医学应用程序开发者提供的一套用于计算、高级可视化和AI的GPU加速库。随着Clara SDK的发展变化,NVIDIA还将提供可用于构建硬件抽象应用程序的容器,帮助提高医学影像技术,包括重建、图像处理、分割、分类和3D渲染。