Project Icon

InstructUIE

基于Flan T5的统一信息抽取指令微调框架

InstructUIE是一个基于Flan T5预训练模型的指令微调框架,致力于统一信息抽取。该项目通过自定义数据集微调,实现多种信息抽取任务的统一处理。InstructUIE提供完整的训练和评估脚本,并开放预训练模型下载,为自然语言处理研究和应用提供有力支持。

IEPile - 双语大规模信息抽取数据集构建及模型优化
GithubIEPile信息抽取双语大规模数据集开源项目指令微调
IEPile是一个包含0.32B tokens的双语信息抽取指令数据集,整合了26个英文和7个中文信息抽取数据集。采用基于模式的分批指令生成策略,IEPile支持多种信息抽取任务。研究者利用IEPile对Baichuan2-13B-Chat和LLaMA2-13B-Chat模型进行微调,在全监督和零样本信息抽取任务中均实现了显著性能提升。项目提供了详细的数据格式说明和模型训练指南。
InstructCV - 自然语言指令引导的多任务计算机视觉模型
GithubInstructCV开源项目文本到图像生成深度学习生成扩散模型计算机视觉
InstructCV 项目通过指令调优的文本到图像扩散模型,简化了计算机视觉任务的执行方式。该项目将多个计算机视觉任务转化为文本描述的图像生成问题,并使用涵盖分割、物体检测、深度估计和分类等任务的数据集进行训练。利用大型语言模型生成任务提示,该模型从生成模型转变为指令引导的多任务视觉学习者。项目实现了多种环境配置,包括在Huggingface Spaces的Gradio演示和Google Colab的运行示例,并支持PyTorch 1.5+。
SmolLM-135M-Instruct - 轻量级指令语言模型的高效实现
GithubHuggingfaceSmolLM人工智能开源项目机器学习模型模型训练语言模型
SmolLM-135M-Instruct是一个1.35亿参数的轻量级指令语言模型。经过高质量教育数据训练和公开数据集微调后,模型具备基础知识问答、创意写作和Python编程能力。支持MLC、GGUF等多种本地部署方案,可通过Transformers框架调用。v0.2版本进一步优化了对话质量和任务完成能力。
UER-py - 自然语言处理的开源预训练工具包
BERTGithubNLP任务UER-py开源项目模型微调预训练模型
UER-py是一个为自然语言处理任务设计的预训练和微调工具包,支持多种预训练模型以优化下游任务表现。项目强调模块化设计,并提供可扩展接口,支持单GPU及多GPU配置。
Instruct2Act - 利用大语言模型实现多模态指令向机器人操作的映射
GithubInstruct2Act多模态指令大型语言模型开源项目机器人操控零样本方法
Instruct2Act是一种创新框架,通过大语言模型将多模态指令转化为机器人操作。该框架生成Python程序,有效结合感知、规划和动作环节,将复杂指令转化为精准策略代码。在不同场景尤其是桌面操作领域,框架的零样本方法表现优异,超越了许多现有的学习策略。
NuExtract-v1.5 - 基于AI的多语言结构化信息提取工具
GithubHuggingfaceNuExtract信息抽取多语言支持开源项目文本提取模型长文本处理
NuExtract-v1.5是一款基于Phi-3.5-mini-instruct模型优化的结构化信息提取工具。该工具支持处理长文档,兼容英、法、西、德、葡、意等多种语言。在多项基准测试中,NuExtract-v1.5的表现超越了同类13B和34B参数的模型。使用时,只需输入文本和JSON模板即可提取所需信息。此外,NuExtract-v1.5还提供了参数量仅为0.5B的轻量级版本,以满足不同应用场景的需求。
Qwen2-1.5B-Instruct - 性能卓越的开源指令调优语言模型
GithubHuggingfaceQwen2人工智能大语言模型开源项目机器学习模型自然语言处理
Qwen2-1.5B-Instruct是Qwen2系列中的指令调优语言模型,在语言理解、生成、多语言处理、编码和数学推理等方面表现优异。该模型基于改进的Transformer架构,通过大规模预训练和偏好优化,在多项基准测试中超越了大多数开源模型。Qwen2-1.5B-Instruct易于部署,适用于多种AI应用场景,能够高效处理复杂的语言任务。
InstructionWild - 大规模用户生成指令数据集助力AI对话能力提升
AI训练ChatGPTGithubInstructWild大语言模型开源项目指令数据集
InstructionWild项目汇集11万余条高质量用户生成指令,类型丰富,标签完善。该数据集致力于增强AI模型在生成、开放问答和头脑风暴等领域的对话表现。项目展示了完整的数据收集流程、评估分析和后续规划,为AI研究与应用领域贡献重要资源。
ChatIE - 零样本信息抽取的解决方案
ChatIEGithub命名实体识别大规模语言模型实体关系三元组抽取开源项目零样本信息抽取
ChatIE项目利用ChatGPT的强大功能,将零样本信息抽取任务转化为多轮问答形式,形成了一个两阶段的创新框架。通过在多个数据集上的广泛评估,该框架在实体关系抽取、命名实体识别和事件抽取任务中表现出色,甚至超越了一些全监督模型,展现了在有限资源下构建信息抽取系统的巨大潜力。
falcon-7b-instruct - 高性能指令微调语言模型
Apache 2.0Falcon-7B-InstructGithubHuggingfaceTII大语言模型开源项目模型自然语言处理
Falcon-7B-Instruct是TII基于Falcon-7B开发的指令微调语言模型,采用7B参数的因果解码器架构。该模型经过聊天和指令数据集的优化,集成了FlashAttention和多查询技术,在英语和法语任务中表现优异。它适用于直接进行对话和指令处理,但不建议进一步微调。运行该模型需要至少16GB内存,代码以Apache 2.0许可开源。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号