尊严医生
免责声明 - 请勿认真对待尊严医生的任何建议。这是一个正在进行中的项目,认真对待任何建议可能导致严重伤害甚至死亡。
概述
尊严医生是一个能够通过美国医疗执照考试的大型语言模型。这是一个开源项目,旨在为每个人提供私人医生。尊严医生是Meta公司Llama270亿参数大型语言模型的一个版本,该模型在医疗对话数据集上进行了微调,然后通过强化学习和宪法人工智能进行了进一步改进。由于模型仅3GB大小,可以适用于任何本地设备,因此无需支付API费用即可使用。它是免费的,专为离线使用而设计,可以保护患者隐私,并且可在iOS、Android和Web上使用。欢迎提交功能添加和改进的请求。
依赖项
- Numpy(使用矩阵数学运算)
- PyTorch(构建深度学习模型)
- Datasets(访问huggingface hub的数据集)
- Huggingface_hub(访问huggingface数据和模型)
- Transformers(访问HuggingFace hub的模型)
- Trl(Transformer强化学习和微调)
- Bitsandbytes(缩小模型大小,即"量化")
- Sentencepiece(字节对编码方案,即"分词")
- OpenAI(创建合成微调和奖励模型数据)
- TVM(张量虚拟机,将onnx模型转换为高效的跨平台使用)
- Peft(参数高效微调,使用低秩适应(LoRa)进行微调)
- Onnx(将训练模型转换为通用格式)
安装
使用pip一行命令安装所有依赖项
pip install numpy torch datasets huggingface_hub transformers trl bitsandbytes sentencepiece openai tvm peft onnx
iOS快速入门v2
- 克隆此仓库
git clone https://github.com/llSourcell/Doctor-Dignity
- 下载权重
mkdir -p dist/prebuilt
git clone https://github.com/mlc-ai/binary-mlc-llm-libs.git dist/prebuilt/lib
cd dist/prebuilt
git lfs install
wget --no-check-certificate 'https://drive.google.com/file/d/1MLy8BDhuTTcXqagzLFMA07JDzqjQYUTB/view?pli=1'
cd ../..
- 构建张量虚拟机运行时
git submodule update --init --recursive
pip install apache-tvm
cd ./ios
pip install --pre --force-reinstall mlc-ai-nightly mlc-chat-nightly -f https://mlc.ai/wheels
./prepare_libs.sh
**在此处找到适合您系统的MLC LLM正确版本 4. 将权重添加到Xcode
cd ./ios
open ./prepare_params.sh # 确保builtin_list仅包含"RedPajama-INCITE-Chat-3B-v1-q4f16_1"
./prepare_params.sh
- 打开Xcode项目并运行!
DIY训练
要训练模型,您可以在本地或通过Google Colab Pro等云服务远程运行training.ipynb笔记本。训练过程需要GPU,如果您没有GPU,我发现最容易访问的选择是使用Google Colab Pro,每月费用为10美元。尊严医生的总训练时间,包括在自定义医疗数据上对初始LLama模型进行监督微调,以及通过宪法人工智能反馈的强化学习进一步改进,在Google Colab的付费实例上花费了24小时。如果您有兴趣了解更多关于此过程如何工作的信息,详细内容请参阅training.ipynb笔记本。
云训练
点击此处: https://colab.research.google.com/github/llSourcell/Doctor-Dignity/blob/main/llama2.ipynb
本地训练
git clone https://github.com/llSourcell/Doctor-Dignity.git
jupyter training.ipynb
在此处获取jupyter
使用方法 https://huggingface.co/llSourcell/medllama2_7b
有两个huggingface仓库,一个是为移动设备量化的,另一个不是。
旧版iOS应用
- 步骤1:下载 iOS机器学习编译聊天仓库
- 步骤2:按照安装步骤进行操作
- 步骤3:应用程序在iOS设备或模拟器上运行后,点击"添加模型变体"
- 步骤4:输入最新尊严医生模型的URL以下载:https://huggingface.co/llSourcell/doctorGPT_mini
- 步骤5:点击"添加模型"并开始本地聊天,推理在设备上运行。无需互联网连接!
Android应用(待完成)
- 步骤1:下载 Android机器学习编译聊天仓库
- 步骤2:按照安装步骤进行操作
- 步骤3:点击"添加模型变体"
- 步骤4:输入最新尊严医生模型的URL以下载:https://huggingface.co/llSourcell/doctorGPT_mini
- 步骤5:点击"添加模型"并开始本地聊天!无需互联网。
Web(待完成)
作为使用实际人类反馈进行在线学习的实验,我想将模型部署为带有React前端的Flask API。在这种情况下,任何人都可以在此URL与模型聊天。每次查询后,人类可以对模型的回应进行评分。然后通过强化学习使用这个评分来进一步改进模型的性能。要运行应用程序,下载flask,然后您可以运行:
flask run
然后访问localhost:3000与之交互!您还可以部署到vercel
致谢
Meta, MedAlpaca, Apache, MLC Chat 和 OctoML