CrypTen是一个基于PyTorch的隐私保护机器学习框架。它旨在使机器学习从业者能够访问安全计算技术。 它目前实现了安全多方计算作为其安全计算后端,并为ML研究人员提供了三大主要优势:
-
它是面向机器学习的。该框架通过
CrypTensor
对象呈现协议,该对象的外观和感觉与PyTorch的Tensor
完全一致。这使用户能够使用与PyTorch中相似的自动微分和神经网络模块。 -
CrypTen是基于库的。它实现了一个张量库,就像PyTorch一样。这使从业者更容易调试、实验和探索ML模型。
-
该框架是针对现实世界的挑战而设计的。CrypTen不会缩减或过度简化安全协议的实现。
下面是一些使用CrypTen加密和解密张量并将其相加的示例代码:
import torch
import crypten
crypten.init()
x = torch.tensor([1.0, 2.0, 3.0])
x_enc = crypten.cryptensor(x) # 加密
x_dec = x_enc.get_plain_text() # 解密
y_enc = crypten.cryptensor([2.0, 3.0, 4.0])
sum_xy = x_enc + y_enc # 相加加密张量
sum_xy_dec = sum_xy.get_plain_text() # 解密和
它目前还不能用于生产,主要用作研究框架。
安装CrypTen
CrypTen目前支持在Linux和Mac上运行,使用Python 3.7。 我们也支持在GPU上进行计算。 不支持Windows。
对于Linux或Mac
pip install crypten
如果您想运行examples
目录中的示例,您还应该执行以下操作:
pip install -r requirements.examples.txt
示例
要运行examples
目录中的示例,您还需要克隆该repo并执行以下操作:
pip install -r requirements.examples.txt
我们在examples
目录中提供了涵盖各种模型的示例:
- 线性SVM示例
mpc_linear_svm
生成随机数据,并在加密数据上训练SVM分类器。 - LeNet示例
mpc_cifar
在明文上训练LeNet的改编版本,并加密模型和数据以进行推理。 - TFE基准示例
tfe_benchmarks
在明文上训练三种不同的网络架构,并加密训练好的模型和数据以进行推理。 - 老虎机示例
bandits
在加密的MNIST数据上训练上下文老虎机模型。 - ImageNet示例
mpc_imagenet
对torchvision中的预训练模型进行推理。
对于在明文中训练的示例,我们还在每个示例子目录的model
子目录中提供了预训练的明文模型。
您可以通过执行以下操作来检查所有示例特定的命令行选项,以下示例针对tfe_benchmarks
:
python examples/tfe_benchmarks/launcher.py --help
CrypTen的工作原理
我们在tutorials
目录中有一系列教程,展示了CrypTen的工作原理。这些以Jupyter笔记本的形式呈现,因此请在您的conda环境中安装以下内容:
conda install ipython jupyter
pip install -r requirements.examples.txt
Introduction.ipynb
- 介绍安全多方计算;CrypTen的底层安全计算协议;我们试图解决的用例以及我们假定的威胁模型。Tutorial_1_Basics_of_CrypTen_Tensors.ipynb
- 介绍CrypTensor
,CrypTen的加密张量对象,并展示如何使用它来执行各种操作。Tutorial_2_Inside_CrypTensors.ipynb
- 深入探讨CrypTensor
,以展示内部工作原理;特别是CrypTensor
如何使用MPCTensor
作为其后端,以及如何使用两种不同类型的共享(算术共享和二进制共享)来执行不同类型的函数。它还展示了CrypTen的MPI启发的编程模型。Tutorial_3_Introduction_to_Access_Control.ipynb
- 展示如何使用CrypTen训练线性模型,并展示在数据标记、特征聚合、数据集增强和模型隐藏等各种场景中的应用。Tutorial_4_Classification_with_Encrypted_Neural_Networks.ipynb
- 展示CrypTen如何加载预训练的PyTorch模型,对其进行加密,然后在加密数据上进行推理。Tutorial_5_Under_the_hood_of_Encrypted_Networks.ipynb
- 检查CrypTen如何加载PyTorch模型,如何对其进行加密,以及数据如何通过多层网络。Tutorial_6_CrypTen_on_AWS_instances.ipynb
- 展示如何使用scripts/aws_launcher.py
在AWS上启动我们的示例。它也可以与您用CrypTen编写的代码一起使用。Tutorial_7_Training_an_Encrypted_Neural_Network.ipynb
- 介绍CrypTensor
的自动微分功能。这些功能使在CrypTen中训练神经网络变得容易。
文档和引用
CrypTen的文档在这里。
CrypTen实现的协议和设计在这篇论文中有描述。如果您想在您的论文中引用CrypTen(非常感谢!),您可以按如下方式引用:
@inproceedings{crypten2020,
author={B. Knott and S. Venkataraman and A.Y. Hannun and S. Sengupta and M. Ibrahim and L.J.P. van der Maaten},
title={CrypTen: Secure Multi-Party Computation Meets Machine Learning},
booktitle={arXiv 2109.00984},
year={2021},
}
加入CrypTen社区
请查看CONTRIBUTING文件了解如何提供帮助。
许可证
CrypTen采用MIT许可证,详见LICENSE文件。