Project Icon

prometheus-7b-v2.0

用于语言模型评估的开源工具与反馈优化

Prometheus 2 是一款基于 Mistral-Instruct 的开源语言模型,通过细粒度评估替代 GPT-4 的某些功能。它通过反馈数据微调,支持直接和相对评价。权重合并提升性能,且通过人类反馈优化强化学习模型,适用于多领域评估任务。

mpt-7b - 高性能开源大语言模型
GithubHuggingfaceMPT-7B大语言模型开源开源项目模型深度学习自然语言处理
MPT-7B是一个开源大语言模型,在1万亿英文文本和代码上预训练。其改进的Transformer架构支持高效训练和推理,可处理超长输入。模型采用ALiBi技术处理长序列,无需位置嵌入。MPT-7B支持商业使用,为开发者提供了适用于多种下游任务微调的强大基础模型。
lm-evaluation-harness - 统一测试生成式语言模型的多任务评估框架
GPT-NeoXGithubHugging FaceLanguage Model Evaluation HarnessOpen LLM LeaderboardvLLM开源项目
该项目提供统一框架,用于评估生成式语言模型,通过60多个标准学术基准和数百个子任务实现多样化测试。更新包括新的Open LLM Leaderboard任务、内部重构、基于配置的任务创建、Jinja2提示设计支持等高级配置选项,旨在简化和优化模型评估。支持快速高效推理、商业API、本地模型和基准测试。被广泛应用于机构如NVIDIA、Cohere、BigScience等,也支撑了🤗 Hugging Face的Open LLM Leaderboard。
Qwen2-7B - 开源大语言模型在多项基准测试中展现优异性能
GithubHuggingfaceQwen2人工智能大语言模型开源项目机器学习模型自然语言处理
Qwen2-7B是新一代Qwen大语言模型系列的7B参数基础版本。该模型在语言理解、生成、多语言处理、编程、数学和推理等多个领域的基准测试中展现出优异表现,不仅超越了大多数开源模型,还与专有模型实力相当。Qwen2-7B基于改进的Transformer架构,引入了SwiGLU激活函数、注意力QKV偏置和组查询注意力等创新技术,并优化了分词器以更好地支持多种自然语言和编程语言。
pythia-2.8b-v0 - 支持可解释性研究的多尺寸语言模型,适合科学研究应用
EleutherAIGithubHuggingfacePythia可解释性大型语言模型开源项目机器学习模型
Pythia模型套件旨在支持大型语言模型的可解释性研究,提供多种尺寸的模型以及去重和未去重的数据版本。尽管不以提升下游性能为主要目标,但测试显示在某些任务中表现卓越。基于Transformer架构的Pythia-2.8B可进行微调研究,适用于探索语言模型的训练过程和变化情况。项目采用Apache 2.0许可,模型及检查点可通过Hugging Face获取,促进语言模型的训练与科研开发。
Starling-LM-7B-alpha - 开源模型在 MT Bench 测试中接近 GPT-4 水平
GithubHuggingfaceStarling-LM-7B-alpha人工智能开源项目机器学习模型自然语言处理语言模型
Starling-LM-7B-alpha 是一个基于人工智能反馈强化学习(RLAIF)训练的开源大语言模型。该模型利用 GPT-4 标注的 Nectar 数据集和创新的奖励训练策略,在 MT Bench 测试中获得 8.09 分,性能仅次于 GPT-4 和 GPT-4 Turbo。研究团队已开源相关数据集、模型和在线演示。Starling-LM-7B-alpha 在多项基准测试中展现出优异性能,显示了其作为开源模型的巨大潜力。
internlm2-7b - 增强自然语言处理与长文本分析能力
GithubHuggingfaceInternLM开源开源项目性能评测模型长上下文
InternLM2-7B是一款开源自然语言处理模型,以其卓越的语言能力及对20万字符长文本的支持在评测中表现优异。适用于领域适配与复杂任务,提供代码开放与商用使用许可,便于研究与开发者的灵活使用与集成。
Nous-Hermes-llama-2-7b - 高效精调语言模型Nous-Hermes的特性与使用
GithubHuggingfaceNous-Hermes-Llama2-7bRedmond AI合成数据开源项目数据集模型模板格式
Nous-Hermes-Llama2-7b是由Nous Research精调的语言模型,基于GPT-4合成输出训练,具有处理长响应和减少幻觉的能力。该模型不受OpenAI审查机制影响,具备高精度的任务完成能力。数据集由Teknium及其他合作者提供,包括GPTeacher和CodeAlpaca。训练在高性能DGX机器上进行,确保模型的一致性和先进性,适用于文本生成及复杂指令理解等多种任务。
Qwen2-72B - 新一代开源大语言模型在多个领域表现出色的中立评估
GithubHuggingfaceQwen2-72B多语言能力开源项目文本生成模型评估数据集语言模型
Qwen2系列大语言模型采用改进的Transformer架构,包含多种参数尺寸,加强了在多语言、编程、数学和推理领域的表现。Qwen2-72B模型对比现有开源和专有模型,展示了其在自然语言处理、代码生成和多语言翻译方面的竞争力,支持各类复杂任务的高效执行。了解更多关于模型的功能和实用建议,为语言技术应用提供支持。
Nous-Hermes-Llama2-13b - 开源语言模型专注长回复与准确性
GithubHuggingfaceLlama-2人工智能开源项目机器学习模型自然语言处理语言模型
Nous-Hermes-Llama2-13b是基于Llama 2微调的开源语言模型,采用30万条指令进行训练。该模型以生成长篇回复和较低的幻觉率为特点,在AGI-Eval等多项基准测试中表现优异。它可用于创意写作、指令理解等多种语言任务,为开发者和研究人员提供了一个强大的开源语言工具。
gpt-neo-2.7B - EleutherAI开发的27亿参数GPT-Neo语言模型展现多任务处理能力
EleutherAIGPT-NeoGithubHuggingface开源项目模型深度学习自然语言处理语言模型
GPT-Neo 2.7B是EleutherAI基于GPT-3架构开发的大规模语言模型,在The Pile数据集上训练了4200亿个token。模型在语言理解、科学推理等多个评估任务中表现优异,超越同等规模的GPT-2和GPT-3 Ada。尽管存在潜在偏见,GPT-Neo 2.7B仍为自然语言处理领域提供了新的研究方向和应用可能。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号