#多任务
pretraining-with-human-feedback
该项目为根据人类偏好预训练语言模型提供了一套基于Hugging Face Transformers和wandb的工具。项目实现了五种预训练目标,通过对训练数据注释并使用这些目标函数提升模型性能,包括毒性检测和隐私信息识别等任务。项目还提供详细的配置文件和评估方式指导。
FunASR
FunASR是一个全面的开源语音处理工具集,融合了学术研究和工业应用。它不仅支持语音识别模型的训练和微调,还提供了语音活动检测、标点恢复等多种功能。该项目提供大量预训练模型,便于快速构建高效准确的语音识别服务。FunASR以其广泛的功能、高性能和易部署特性,为语音识别技术的研究和应用提供了强大支持。
Cyjon
Cyjon是一个开源的多任务操作系统项目,专为AMD64处理器设计。系统内核采用纯汇编语言编写,强调代码可读性。项目与Fern-Night完全兼容,并提供编译和运行说明,方便开发者学习和探索操作系统底层开发。
moment
MOMENT是一个开源的时间序列分析基础模型家族,为多任务、多数据集和多领域应用而设计。该模型在大规模时间序列数据上预训练,可处理预测、分类、异常检测和插补等任务。MOMENT能捕捉时间序列的内在特征,学习有意义的数据表示,在少量标记数据的情况下也表现出色。项目提供预训练模型、教程和研究代码,为时间序列分析提供了实用工具。
30dayMakeOS
该项目基于《30天自制操作系统》,展示了从汇编到C语言,从引导程序到图形界面的操作系统开发全过程。涵盖内存管理、多任务处理、文件系统等关键领域,读者可通过四周学习掌握核心概念和实现技术,最终开发出基础功能完整的操作系统。项目适合操作系统爱好者和计算机科学学生实践学习。
multitask-text-and-chemistry-t5-base-augm
Multitask Text and Chemistry T5是一个基于Transformer的多任务语言模型,应用于化学和自然语言领域的多种任务。它以t5-small为预训练基础,并通过增强数据集进行训练。2023年发布,该模型由IBM Research与丹麦技术大学合作开发并集成于GT4SD。应用领域包括正向反应预测、逆合成、分子注释、文本条件的生成和段落到动作的转换。