#训练代码
Score-Entropy-Discrete-Diffusion - 基于数据分布比率估计的离散扩散模型
离散扩散模型PyTorch实现预训练模型采样策略训练代码Github开源项目
Score-Entropy-Discrete-Diffusion 是一个基于 PyTorch 实现的离散扩散模型项目。它通过估计数据分布比率来生成文本,包含噪声调度、前向扩散过程、采样策略和模型架构等模块。该项目支持使用预训练模型,提供条件和非条件文本生成功能,并为离散数据生成研究提供了新思路。项目结构模块化,便于进一步研究和应用开发。
Sakura-SOLAR-DPO - 开源大语言模型性能新突破
Sakura-SOLARLLMDPO模型性能训练代码Github开源项目
Sakura-SOLAR-DPO项目通过模型融合和DPO训练技术,使SOLAR模型在开源大语言模型排行榜上跃居首位。该项目在ARC、HellaSwag等多项基准测试中表现卓越,展现了强大的通用能力和数学推理水平。项目公开了详细的训练代码、超参数配置和提示词模板,为开源AI社区提供了宝贵的技术参考。