Project Icon

deita

自动数据选择工具助力大语言模型指令调优

Deita是一个开源项目,为大型语言模型的指令调优提供自动数据选择工具。项目包含开源工具包、高质量轻量级数据集和高效训练模型。Deita模型使用仅十分之一的指令调优数据,就能达到其他先进聊天模型的性能水平。项目提供全面评估结果,展示了在多项基准测试中的表现。

Delexa-7b - 多基准测试中展现出色表现的开源语言模型探索
AI推理Delexa-7bGithubHuggingface开源项目文本生成模型评估结果语言模型
Delexa-7b是开源的大型语言模型,在通用语言任务中表现优越。其在多项基准测试中,包括HellaSwag Challenge,获得了86.49%的准确率。该模型支持生成特定内容,并具备不生成非法内容的能力。在llm-judge平台上的初步评估中,Delexa-7b取得了8.143750的平均得分。其应用领域涵盖STEM推理和AI开发实验,需注意在使用时避免可能的有害生成内容。
deberta-base-mnli - DeBERTa模型在MNLI任务上的微调版本
DeBERTaGithubHuggingface开源项目微软机器学习模型神经网络自然语言处理
deberta-base-mnli是一个在MNLI任务上微调的DeBERTa基础模型。DeBERTa通过解耦注意力和增强掩码解码器改进了BERT和RoBERTa。该模型在SQuAD和MNLI等基准测试中表现优异,在大多数自然语言理解任务中超越了BERT和RoBERTa的性能。它为自然语言处理研究和应用提供了有力支持。
deit-base-patch16-224 - DeiT高效视觉Transformer 创新图像分类模型
DeiTGithubHuggingfaceImageNetVision Transformer图像分类开源项目模型深度学习
DeiT是一种高效训练的视觉Transformer模型,在ImageNet-1k数据集上预训练和微调。采用创新的数据高效方法,以较少计算资源实现出色图像分类性能。支持224x224分辨率输入,Top-1准确率达81.8%。可直接用于图像分类或作为下游视觉任务的特征提取器。该模型在保持ViT架构优势的同时,显著提高了训练效率和分类精度。
Adala - 提供灵活可扩展运行时环境的自主数据标注框架
AdalaGithub人工智能开源项目数据标注机器学习自适应学习
Adala 是一个用于数据处理的自主数据标注框架,具备灵活的运行时环境和Python集成。通过迭代学习,系统内的智能体可以独立获取技能,适应不同的环境。Adala 提供可靠的数据处理结果和多种定制化选项,适合AI工程师、机器学习研究人员、数据科学家和教育工作者使用,并兼容OpenAI和VertexAI等大型语言模型。
deberta-v2-xlarge-mnli - DeBERTa架构的大规模预训练语言模型用于自然语言推理
DeBERTaGithubHuggingface人工智能开源项目微软机器学习模型自然语言处理
deberta-v2-xlarge-mnli是基于DeBERTa V2架构的大型预训练语言模型,经过MNLI任务微调。模型包含24层,1536隐藏单元,共9亿参数。它采用解耦注意力和增强掩码解码器,在GLUE等自然语言理解基准测试中表现优异,为相关研究与应用提供了新的可能。
aideml - 通过自然语言描述生成机器学习任务解决方案的LLM代理
AIDEGithubPython开源项目数据科学机器学习解决方案生成
AIDE是一款通过自然语言描述生成机器学习任务解决方案的LLM代理。该项目在超过60个Kaggle数据科学竞赛中表现出色,平均超越50%的参赛者。AIDE能生成Python脚本并进行迭代优化,提供透明的可视化解决方案树,帮助深入理解实验过程。支持通过命令行或Python脚本使用,并提供多种高级配置,为数据科学家提供高效自动化的解决方案生成与优化工具。
DeBERTa-v3-FaithAug - 基于DeBERTa的知识对话系统可靠性评估模型
DeBERTa-v3GithubHuggingface开源项目数据集模型模型训练知识对话自然语言推理
DeBERTa-v3-FaithAug是一个基于DeBERTa-v3架构的自然语言推理模型,通过ANLI数据增强方式进行微调,用于知识对话系统的可靠性评估。模型在原有DeBERTa-v3-large-mnli-fever-anli-ling-wanli基础上优化,提供开源代码和评分接口。该版本相比论文中的原始模型具有更优的平均性能表现。
evadb - 提升AI应用开发效率的数据库系统
AI应用EvaDBGithubSQL查询人工智能开源项目数据库系统
EvaDB,开创性的AI数据库系统,通过高效集成结构化及非结构化数据和先进的SQL API,支持Hugging Face和OpenAI等多种AI模型。其独特的AI查询优化技术,包括缓存、批处理和并行处理,大幅提升应用性能和开发效率。
Awesome-instruction-tuning - 介绍开源指令调优数据集和模型的精选资源库
GithubHelsinki-NLPLLMsalpacainstruction tuning datasetsmultilingual tools开源项目
此页面汇总了开源的指令调优数据集、模型、相关论文和资源库的精选列表。涵盖传统NLP任务修改的数据集、大型语言模型生成的数据,还包括跨语言翻译工具和研究论文链接。对于研究和应用指令调优技术的研究人员、开发者和数据科学家,这是一个重要的参考资源。
Datatera.ai - 将各类文件和网页智能转换为结构化数据的AI平台
AI处理AI工具数据提取无代码结构化数据网页抓取
Datatera.ai是一个AI驱动的数据处理平台,可将文件、网页和邮件内容快速转换为结构化数据。支持Web、文本、PDF、图片等多种格式,无需编码即可使用。平台自动解析复杂数据类型,通过浏览器扩展简化数据采集过程。提供多种集成选项,支持数据导出至常用应用和数据库。适用于个人和企业用户,提供灵活的定价方案。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号