NeMo-Aligner
NeMo-Aligner是NVIDIA开发的语言模型对齐工具包,支持SteerLM、DPO和RLHF等算法,用于调整模型以提高安全性和实用性。基于NeMo Toolkit构建,支持大规模GPU并行处理,提供监督微调和奖励模型训练等功能。与NeMo生态系统兼容,便于模型部署和进一步定制。