#Apache-2.0
tvm - 适用于 CPU、GPU 和专用加速器的开放式深度学习编译器堆栈
Github开源项目深度学习Apache TVM编译器Apache-2.0硬件后端
Apache TVM为深度学习提供高效编译支持,优化执行效率,适合用于学术与工业研究领域,填补了框架与后端之间的技术差距。
Llama-3-Instruct-8B-SPPO-Iter3 - 改进文本生成的创新模型及其在多任务中的性能评估
Github开源项目文本生成模型HuggingfaceApache-2.0Llama-3-Instruct-8B-SPPO-Iter3开源LLM排行榜自我游戏偏好优化
Llama-3-Instruct-8B-SPPO-Iter3模型采用自我对弈偏好优化技术进行第三次迭代微调,具备强大的文本生成能力。模型通过IFEval、BBH、MATH、GPQA、MuSR等多个数据集进行多任务性能评估,其中IFEval (0-Shot)的严格准确率为68.28。该模型基于meta-llama/Meta-Llama-3-8B-Instruct,使用openbmb/UltraFeedback数据集训练,拥有8B参数,专注于英文文本生成,为语言模型的优化提供了全新视角和实用的性能测试结果。
text2vec-base-chinese - 基于LERT的中文句子相似度模型
Github开源项目语言模型模型transformersHuggingfaceApache-2.0text2vec句子相似度
text2vec-base-chinese 是一个中文自然语言处理模型,通过将MacBERT替换为LERT实现改进,用于提升句子相似度计算的精确性。该项目在保持其他训练条件不变的情况下,确保了模型性能的稳定性,对需要进行高效特征提取和相似度计算的用户尤其有帮助。2024年6月25日,该项目的onnxruntime版本已发布,以支持更广泛的应用,让开发者能够更高效地构建智能应用。