Project Icon

tinyroberta-squad2

经过蒸馏优化的快速问答模型,运行速度提升一倍

tinyroberta-squad2是一个基于SQuAD 2.0数据集训练的轻量级问答模型。通过知识蒸馏技术,模型在保持原有精确匹配率78.86%和F1分数82.04%的同时,将运行速度提升一倍。模型支持Haystack和Transformers框架,可用于构建文本问答系统。

rag-stack - 基于RAG技术的企业级智能问答平台
GithubRAGstack企业知识库向量数据库开源LLM开源项目检索增强生成
RAGstack是一个基于检索增强生成(RAG)技术的企业级智能问答平台。该项目支持Llama 2、Falcon和GPT4All等开源大语言模型,利用Qdrant向量数据库实现高效文档检索。RAGstack提供简洁的服务器和用户界面,支持PDF文档上传和智能问答。系统可在本地运行,也可轻松部署到各大主流云平台,为企业提供安全可控的私有化知识问答解决方案。
llm-toys - 微调小型语言模型实现多任务处理
Githubllm-toys任务微调低资源模型对话摘要开源项目语气变化
llm-toys 项目提供适用于释义、语气转换、对话总结和主题生成等任务的小型量化3B和7B语言模型。这些经过微调的模型能在普通消费级硬件上高效运行,并通过简单的安装步骤提升文本处理和生成能力。
xFasterTransformer - 高效的大规模语言模型推理优化方案
GithubPython APIXeonxFasterTransformer大语言模型开源项目高性能
xFasterTransformer是一个为X86平台优化的大规模语言模型(LLM)推理解决方案,支持多插槽和节点的分布式运行,适用于大型模型推理。它提供C++和Python API,支持例如ChatGLM、Llama、Baichuan等流行的LLM模型,并可通过PyPI、Docker或从源代码进行安装。项目附带详细文档、API使用示例、基准测试代码和Web演示,确保用户能充分利用其高性能和高扩展性。
tevatron - 神经检索模型训练与推理工具
GithubHuggingFaceLLM神经检索模型LoRA微调Mistral-7BTevatron开源项目
Tevatron提供高效工具包,支持在GPU和TPU上大规模训练和推理神经检索模型,集成DeepSpeed和LoRA等技术,可加载HuggingFace的预训练模型,适用于神经检索和开放域QA任务。
modded-nanogpt - 基于PyTorch的高效GPT-2训练器变体
GPT-2GithubNanoGPTPyTorch开源项目模型优化训练效率
Modded-NanoGPT是一个基于Andrej Karpathy的llm.c项目的GPT-2训练器变体。该项目通过引入旋转嵌入等现代技术,将训练效率提高一倍,仅需5B tokens即可达到与原版相同的验证损失。代码简化至446行,实现了124M参数的transformer模型。在Fineweb验证集上,模型达到3.2818的验证损失。通过架构调整和超参数优化,该项目在保持性能的同时显著提升了训练速度。
Superpowered AI - 检索增强生成平台 优化AI响应精准度
AI工具APILLMSuperStack检索增强生成知识库
Superpowered AI专注于提供检索增强生成(RAG)服务。平台采用SuperStack技术,包含AutoQuery、相关片段提取和AutoContext功能,解决了传统RAG系统的不足。支持多样化的数据接入和灵活部署,提供REST API、Python包和React组件。适用于客户服务、员工效率提升、法律分析和教育等领域。平台注重数据安全,使用256位AES加密。目前已获得6000多用户的信赖,正在推动检索增强生成技术的创新应用。
ColBERT - 基于BERT的快速大规模文本检索模型
BERTColBERTGithub信息检索向量相似度开源项目自然语言处理
ColBERT是一种基于BERT的检索模型,能在数十毫秒内实现大规模文本集合的高效搜索。该模型采用细粒度的上下文后期交互技术,将段落编码为令牌级嵌入矩阵,在保持检索质量的同时提高效率。ColBERT具备索引、检索和训练功能,适用于多种信息检索任务。模型提供预训练checkpoint和Python API,方便研究人员和开发者在实际项目中快速应用。
EfficientQAT - 高效量化训练技术助力大型语言模型压缩
EfficientQATGithubPyTorch大语言模型开源项目模型压缩量化训练
EfficientQAT是一种针对大型语言模型的量化训练技术。该技术采用两阶段训练方法,包括分块训练所有参数和端到端训练量化参数,在压缩模型大小的同时保持性能。EfficientQAT支持GPTQ和BitBLAS等多种量化格式,已成功应用于Llama和Mistral等模型系列,有效降低模型存储需求,为大型语言模型的部署提供了实用方案。
Firefly-LLaMA2-Chinese - 低资源高效的中英文LLaMA2模型预训练与指令微调
Firefly-LLaMA2-ChineseGithubHuggingface中英双语模型低资源增量预训练大模型技术开源项目
本项目专注于低资源增量预训练与多轮指令微调,提升LLaMA2模型在中文领域的表现。支持对多种中英文预训练模型进行扩充与优化,开源了7B和13B的Base与Chat模型。在Open LLM Leaderboard和CMMLU榜单上表现出色,以4*V100完成高效训练,远低于其他模型的GPU资源需求。提供全项目信流程训练代码及数据,对LLaMA2、Baichuan2等多个模型进行详细评测,确保用户获得全面权威的模型性能数据。
项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

白日梦AI

白日梦AI提供专注于AI视频生成的多样化功能,包括文生视频、动态画面和形象生成等,帮助用户快速上手,创造专业级内容。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

讯飞绘镜

讯飞绘镜是一个支持从创意到完整视频创作的智能平台,用户可以快速生成视频素材并创作独特的音乐视频和故事。平台提供多样化的主题和精选作品,帮助用户探索创意灵感。

Project Cover

讯飞文书

讯飞文书依托讯飞星火大模型,为文书写作者提供从素材筹备到稿件撰写及审稿的全程支持。通过录音智记和以稿写稿等功能,满足事务性工作的高频需求,帮助撰稿人节省精力,提高效率,优化工作与生活。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

AIWritePaper论文写作

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号