InstructUIE
- 本仓库发布了我们的InstructUIE模型实现。
- 它基于预训练的Flan T5模型构建,并在我们的数据集上进行了微调。
环境要求
我们的主要实验和分析是在以下环境中进行的:
- CUDA (11.3)
- cuDNN (8.2.0.53)
- Pytorch (1.10.0)
- Transformers (4.26.1)
- DeepSpeed (0.7.7)
你可以通过运行以下命令安装所需的库:
bash setup.sh
数据
我们的模型在IE INSTRUCTIONS上进行训练和评估。 你可以从百度网盘或Google Drive下载数据。
训练
我们论文中训练InstructUIE模型的示例脚本可以在scripts/train_flan-t5.sh
中找到。你可以按以下方式运行:
bash ./scripts/train_flan-t5.sh
发布的检查点
我们已发布了11B UIE模型,点击这里下载。
评估
我们论文中评估InstructUIE模型的示例脚本可以在scripts/eval_flan-t5.sh
中找到。你可以按以下方式运行:
bash ./scripts/eval_flan-t5.sh
解码结果将保存在你的输出目录中的predict_eval_predictions.jsonl文件中。 要使用predict_eval_predictions.jsonl计算F1值,请运行:
python calculate_f1.py
引用
@article{wang2023instructuie,
title={InstructUIE: Multi-task Instruction Tuning for Unified Information Extraction},
author={Wang, Xiao and Zhou, Weikang and Zu, Can and Xia, Han and Chen, Tianze and Zhang, Yuansen and Zheng, Rui and Ye, Junjie and Zhang, Qi and Gui, Tao and others},
journal={arXiv preprint arXiv:2304.08085},
year={2023}
}