Project Icon

InstructionWild

大规模用户生成指令数据集助力AI对话能力提升

InstructionWild项目汇集11万余条高质量用户生成指令,类型丰富,标签完善。该数据集致力于增强AI模型在生成、开放问答和头脑风暴等领域的对话表现。项目展示了完整的数据收集流程、评估分析和后续规划,为AI研究与应用领域贡献重要资源。

multiwoz - 大规模多领域任务型对话数据集
GithubMultiWOZ任务型对话对话状态追踪对话生成开源项目数据集
MultiWOZ是一个包含10,000多个人类对话的全标注多领域任务型对话数据集。它涵盖多个领域和主题,规模超过以往任务型语料库。该数据集为对话状态追踪、响应生成等任务提供基准测试,并通过版本更新持续提高数据质量。MultiWOZ为对话系统研究提供了重要资源,促进了该领域的发展。
BotChat - 创新评估大语言模型多轮对话能力的基准
BotChat BenchmarkGPT-4GithubLLM对话生成开源项目评估
BotChat基准测试通过分析大语言模型生成的对话评估多轮聊天能力。基于MuTual-Test数据集,该项目生成了大规模模型对话数据,并采用单轮评估、BotChat Arena和人类对话对比等方法全面评估主流LLM对话质量。研究发现GPT-4表现最佳,部分小型开源模型在短对话中也有不错表现。这一创新基准为改进LLM对话能力提供了新思路。
granite-3.0-8b-instruct - 多领域AI助手构建的多语言文本生成模型
AI助手GithubGranite-3.0-8B-InstructHuggingface多语言开源项目文本生成模型语言模型
Granite-3.0-8B-Instruct是由Granite团队与IBM开发的8B参数文本生成模型,支持多种语言,适合构建应用于多领域的AI助手。其功能涵盖文本生成、分类、抽取、问答、检索增强生成(RAG)和代码任务。模型基于Decoder-Only Transformer架构,可通过开放源和内部合成数据集进行微调,支持多语言对话场景。
Llama-3.1-405B-Instruct - Meta开发的多语言大规模语言模型 支持商业和研究应用
GithubHuggingfaceLLaMA 3.1Meta人工智能多语言大语言模型开源项目模型自然语言生成
Llama-3.1-405B-Instruct是Meta开发的多语言大规模语言模型系列之一。该模型支持英语、德语、法语等8种语言,具有128K上下文长度。通过监督微调和人类反馈强化学习,该模型旨在提供安全可靠的多语言对话能力。Llama-3.1-405B-Instruct适用于助手式聊天等自然语言生成任务,支持商业和研究应用。
Awesome-instruction-tuning - 介绍开源指令调优数据集和模型的精选资源库
GithubHelsinki-NLPLLMsalpacainstruction tuning datasetsmultilingual tools开源项目
此页面汇总了开源的指令调优数据集、模型、相关论文和资源库的精选列表。涵盖传统NLP任务修改的数据集、大型语言模型生成的数据,还包括跨语言翻译工具和研究论文链接。对于研究和应用指令调优技术的研究人员、开发者和数据科学家,这是一个重要的参考资源。
DialogStudio - 提供丰富多样的对话数据集和任务意识模型
DialogStudioGithubHuggingface对话开源项目数据集模型
DialogStudio 是一个全面的对话数据集项目,包含大量统一的对话数据集和任务意识模型,支持对单个数据集和大型语言模型的训练。用户可以通过 HuggingFace 轻松下载和使用这些数据集,涵盖从知识驱动到任务导向多个领域。同时,项目进行了高质量的数据集评估,提供了详细的评价标准和评分。DialogStudio 既促进会话 AI 研究,也为模型开发者和数据科学家提供了重要资源,推动该领域的创新与进步。
Mixtral-8x22B-Instruct-v0.1 - 多语言指令微调大型语言模型
GithubHuggingfaceMixtral-8x22B-Instruct-v0.1函数调用大语言模型开源项目推理标记器模型
Mixtral-8x22B-Instruct-v0.1是基于Mixtral-8x22B-v0.1的指令微调版大型语言模型。该模型支持多语言处理,具备出色的自然语言理解和生成能力。它适用于对话、问答和函数调用等多种任务。模型采用先进的分词器和推理技术,开发者可通过mistral_common和transformers库方便使用。Mixtral-8x22B-Instruct-v0.1为AI应用开发提供了可靠的基础。
Mistral-7B-Instruct-v0.3 - Mistral-7B-Instruct-v0.3模型的指令微调与功能调用概述
GithubHuggingfaceMistral-7B-Instruct-v0.3Open LLM Leaderboard功能调用开源项目文本生成模型模型微调
Mistral-7B-Instruct-v0.3模型经过指令微调,支持32768词汇和v3 Tokenizer,并具备功能调用能力。在多个评测如AI2 Reasoning Challenge和HellaSwag中展示良好表现。该模型支持多种使用方式,包括简单安装、下载指南及在Hugging Face上的文本生成,利用CLI命令与模型对话,或调用自定义功能。尽管缺乏内容审查机制,Mistral团队正与社区合作,以确保输出适合多种环境。
Mistral-7B-Instruct-v0.2-GPTQ - 高效量化的开源指令型大语言模型
AI推理GPTQGithubHuggingfaceMistral 7B开源项目模型模型下载量化模型
Mistral-7B-Instruct-v0.2模型的GPTQ量化版本,提供4位和8位精度等多种参数选项。支持Linux和Windows的GPU推理,兼容多个开源框架。采用Mistral提示模板,适用于指令任务。由TheBloke量化发布,旨在提供高效易用的开源大语言模型。
Llama-3-Open-Ko-8B-Instruct-preview - Llama-3基础上的韩语模型适用于对话和指导任务
GithubHuggingfaceLlama-3-Open-Ko-8B-Instruct-preview开源项目指令生成机器学习模型语言模型预训练
Llama-3-Open-Ko-8B-Instruct-preview利用公开资源预训练,处理17.7B+文本标记,为韩语对话和指导提供新起点。TPUv5e-256支持下的训练采用Chat Vector方法,增强自然语言生成。尽管尚未微调韩语指令,该模型已展示可靠性和高效性
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号