#大模型

怪兽智能知识库 - 电商与直播平台的智能客服集成
AI办公办公工具AI工具怪兽AI知识库大模型技术AI热门
怪兽AI知识库大模型支持电商与直播平台的智能问答客服集成,提升企业信息管理和顾客互动的智能化水平。
星火文档问答 - 科大讯飞星火智能文档问答平台
办公工具AI工具讯飞星火知识库大模型文档检索知识库问答AI分析AI办公热门
科大讯飞星火文档问答服务,采用先进AI技术,不仅能高效检索信息,还能准确回答专业问题。其主要功能包括多文档问答、信源原文定位、文档总结与自定义切分,专为各类文档内容的深度解析和敏感问题解答设计,实现深度文档分析和高灵敏度问题响应,为用户提供出色的智能问答体验。
元象大模型 - AI大模型交互平台
热门AI助手AI对话AI工具元象XVERSE大模型AI技术多语言支持自主研发
元象大模型XChat是一款国内自主研发的高性能AI大模型平台,支持包括文本生成、多语言翻译、语义理解和知识问答在内的多种复杂任务,有效降低研发门槛并节约推理成本。
文心大模型 - 百度的产业级知识增强AI技术平台
热门AI开发模型训练AI工具大模型产品中心星河社区合作咨询百度文心
百度文心大模型,一个集成了全面工具及平台的产业级知识增强AI技术,旨在通过高效应用开发、优异的学习效率及出色的可解释性,显著降低AI开发与应用的门槛。
magicoder - 开源代码生成与指令数据的高质量低偏见模型
MagicoderOSS-Instruct大模型开源代码人类评估Github开源项目
Magicoder项目采用OSS-Instruct方法,通过开源代码片段生成低偏见、高质量的指令数据。Magicoder-S-DS-6.7B模型在HumanEval测试中表现优于GPT-3.5-turbo-1106和Gemini Ultra,展示了卓越的代码生成能力。项目提供多个模型和数据集,并支持在线和本地Gradio演示,适用于多种代码生成场景。
app-builder - AI原生应用开发平台,集成自动化大模型和流程编排
AppBuilder-SDK百度智能云AI原生应用RAG应用大模型Github开源项目
百度智能云千帆AppBuilder-SDK为AI开发者提供一站式解决方案,包括调用大模型、工作流编排、监控与部署功能,支持多语言和平台,有助于构建高效的AI原生应用。提供完整的用户文档和社区支持,便于开发者从文档解析到答案生成,实现完整的RAG应用构建。
LLamaSharp - 跨平台本地运行LLaMA和LLaVA模型的高效库
LLamaSharpLLaMALLaVAsemantic-kernel大模型Github开源项目
LLamaSharp是一个基于llama.cpp的跨平台库,支持在本地设备上高效运行LLaMA和LLaVA等大语言模型。该库提供高级API和RAG支持,便于在应用中部署大型语言模型。LLamaSharp兼容多种后端,支持CPU和GPU推理,适用于Windows、Linux和Mac平台。通过集成semantic-kernel和kernel-memory等库,LLamaSharp简化了应用开发,并提供多个示例和教程帮助用户快速上手。
LongBench - 双语长文本理解多任务评估
LongBench长文本理解大模型评估多语言Github开源项目
LongBench首次为大语言模型的长文本理解能力提供双语、多任务的全面评估基准。它覆盖中文和英文,包含六大类共21种任务,适用于单文档QA、多文档QA、摘要提取、少样本学习、合成任务和代码补全等场景。该项目提供自动化评估方法以降低成本,并涵盖平均长度为5k至15k的测试数据。同时,LongBench-E测试集通过统一采样,分析模型在不同输入长度的性能表现。
one-api - 多大模型一站式接入与管理解决方案
One API大模型Docker部署OpenAIAPI管理Github开源项目
One API 提供了与 OpenAI、Anthropic Claude、Google PaLM2 等多大模型的兼容性,支持多机部署、令牌管理和用户分组功能。作为一个开源且可定制的项目,One API 简化了大模型的集成与管理流程,适合需要高可用性和可扩展性的开发场景。
LLM-Kit - 无需编程即可部署和定制多语言模型的工具整合包
suqinWebUI语言模型开发部署大模型Github开源项目
LLM-Kit项目通过WebUI整合了多种语言模型工具,实现了无需编程即可配置定制化模型和专业应用。项目支持Windows和Linux操作系统以及多个版本的Python,并提供多种训练和推理功能,包括角色扮演、AI智能体和数据库集成。项目还与众多知名模型和工具库兼容,开发者可以轻松上手并参与贡献,进一步优化和扩展项目功能。
LLMGA - 用于精确图像生成和编辑的多模态大语言模型
LLMGA大模型图像生成ECCV2024多模态Github开源项目
LLMGA基于多模态大语言模型,提供图像生成与编辑解决方案。结合Stable Diffusion和详细语言生成提示,项目提升了上下文理解并减少生成过程中的噪音,增强图像内容的精度。LLMGA支持文本到图像(T2I)、补画、扩画及指令编辑,适用于Logo设计、海报制作和故事绘本生成,支持中英文指令。广泛的模型和数据集选择满足不同需求,是理想的图像生成和编辑助手。
Chinese-LLaMA-Alpaca - 中文NLP开源模型,深化语义理解与执行技术
中文LLaMA中文Alpaca大模型指令精调开源Github开源项目
Chinese-LLaMA-Alpaca-3项目致力于提升中文NLP的处理效率和效果,通过扩展中文词表并使用中文数据进行二次预训练,大幅增强了中文文本的编解码能力。该项目提供了完善的模型下载、部署和训练指导,支持多种生态系统和快速本地部署,适合高质量文本生成和多轮对话任务。同时,通过开源和社区合作,推动开源大模型技术研究及应用。
Chinese-LLaMA-Alpaca-2 - 基于Meta发布的可商用大模型Llama-2开的中文LLaMA&Alpaca大模型的第二期项目
Chinese-LLaMA-Alpaca-2大模型中文词表FlashAttention-2长上下文Github开源项目
Chinese-LLaMA-Alpaca-2项目基于Meta的Llama-2模型开发,提供了全新的中文LLaMA-2基座模型和Alpaca-2指令精调大模型,专注于优化中文词表和扩展模型训练。模型支持大规模中文数据增量训练,显著提升中文语义和指令理解能力。支持4K至64K上下文长度,实现人类偏好对齐,提供多种工具支持部署和应用推广。适用于企业和研究机构进行语言模型深度研发和实用应用,如对话系统和文本分析等。
DecryptPrompt - LLM相关技术与应用
解密Prompt系列LLM指令微调大模型AI应用Github开源项目
《DecryptPrompt》提供全面的LLM应用、训练框架、优化策略和技术指南。覆盖大模型比较、微调技术、开源资源及实操案例,助力用户掌握最新AI动态和前沿技术,尤其深度涉及agent指令微调和LLM应用设计。
zero_nlp - 中文NLP训练与应用框架
zero_nlp模型训练中文NLP大模型pytorchGithub开源项目
zero_nlp是基于pytorch和transformers的中文NLP框架,支持从数据处理到模型部署的整个工作流程。它特别适用于处理大数据集、训练和部署多卡串联大模型,支持包括gpt2、clip在内的丰富模型类型,适用于文本分类、生成及多模态处理等多种任务。
PaddleNLP - 支持大语言模型开发与部署的开源套件
PaddleNLP大模型训练推理飞桨Github开源项目
PaddleNLP是基于飞桨框架开发的大语言模型套件,提供全面的训练、精调、压缩和部署功能。支持多硬件环境,包括4D并行配置和高效精调策略,适应多种硬件平台,有效降低开发门槛。兼容LLaMA、Bloom等多种主流模型,为大模型开发提供高效解决方案。
awesome-pretrained-chinese-nlp-models - 中文NLP预训练模型综合资源平台
预训练语言模型大模型中文NLP多模态模型开源模型库Github开源项目
awesome-pretrained-chinese-nlp-models提供多种中文自然语言处理预训练模型,涵盖基础大模型、对话型模型和多模态模型等。该平台不仅包括各模型的详细介绍、技术文档和下载链接,还定期更新,为研究人员和开发者提供全面的中文NLP资源。
TigerBot - 再处理中文内容方面具有卓越表现的大预言模型
TigerBot大模型中文能力技术报告模型更新Github开源项目
TigerBot运用世界级大模型技术,提供前沿语言解决方案,应对复杂多样的应用场景。新版增加了搜索和文档增强功能,满足从即时通讯到知识密集型任务的需求。全球范围内,TigerBot以其在处理中文内容的卓越表现,证明了在大模型技术方面的领先优势。此外,TigerBot通过游戏化测试和多维度评估,持续进行技术升级,支持教育和科研的发展。
step_into_llm - 大模型技术公开课免费课程
MindSpore大模型技术公开课人工智能深度学习Github开源项目
昇思MindSpore技术公开课提供多领域专家解读,并结合理论与实践,涵盖前沿大模型技术。课程免费,提供开源课件代码,从Transformer到ChatGPT,探讨最新大模型发展趋势。适合所有开发者,系列课程在B站直播,资源同步上传至GitHub。报名参与,与社区共建AI技术未来。
openai-style-api - 统一大模型API格式与管理,简化API-key分发与配置过程
openai-style-api大模型API统一格式配置管理负载均衡Github开源项目
openai-style-api项目通过统一大模型API格式,支持多种模型如openai、azure、智谱AI、讯飞星火、通义千问等,大幅简化配置和管理。项目支持负载均衡、stream方式调用以及多种代理服务,提高了多模型使用的便捷性和灵活性。
AutoAudit - AutoAudit-开源网络安全人工智能模型
AutoAudit网络安全大模型自然语言处理ClamAVGithub开源项目
AutoAudit项目开源专用于网络安全的大语言模型,致力于通过自然语言处理技术支持安全审计和防御。该模型能进行恶意代码分析、网络攻击检测和安全漏洞预测,并与ClamAV集成。当前版本基于Alpaca-Lora训练,未来将增强逻辑推理能力和数据集准确性,并加入更多安全扫描工具。
StarWhisper - 语言、时序与多模态框架
StarWhisper天文学大模型人工智能司天工程Github开源项目
StarWhisper项目由国家天文台人工智能工作组支持,涵盖语言模型、时序模型和多模态模型。通过改进训练方法,该项目提升了天文物理、代码与Agent能力,并发布了基于大模型的光变曲线数据处理方法。项目还实现了多模态多任务框架与望远镜控制系统的对接,探索了多模态在天文学领域的应用可能。
KVQuant - 提升长上下文推理效率的KV缓存量化方法
KVQuantLLaMA-7B长上下文长度推断低精度量化大模型Github开源项目
KVQuant通过精确的低精度量化技术显著提升长上下文长度推理的效率。其创新包括每通道的RoPE前关键量化和非均匀量化,以应对不同LLM中缓存的KV值模式。KVQuant支持在单个A100-80GB GPU上进行LLaMA-7B模型的1M上下文长度推理,甚至在8-GPU系统上支持长达10M上下文长度,从而减少推理过程中KV缓存的内存瓶颈,并通过并行topK支持和注意力感知量化等多项改进提升推理性能。
awesome-huge-models - 大型AI模型最新动态与开源资源汇总
deep learning模型LLM开源AI训练大模型Github开源项目
详尽介绍大型AI语言模型最新进展及开源资源,包括训练代码、数据集和预训练权重。收录Baichuan、Falcon、OpenLLaMA等模型,并关注开源与分布式训练框架如PyTorch和XLA生态。提供全面资源链接,帮助研究人员和开发者了解当前AI模型的最前沿动态。
GPT-RAG - GPT-RAG企业级数据集成与零信任安全
RAGEnterprise RAGGPT-RAG大模型AzureGithub开源项目
GPT-RAG解决方案加速器为企业提供了稳固的架构,适用于企业级RAG模式部署。该架构通过零信任安全和负责任的AI,确保响应的可靠性、可用性、可扩展性和可审计性。其模块化组件包括数据采集、编排和前端应用,使得企业能够从探索阶段顺利过渡到大规模生产和MVP阶段。
sum4all - 大模型总结服务,支持文件、图片、视频和播客的内容解析
大模型内容总结微信插件telegram机器人iOS快捷指令Github开源项目
Sum4all 提供多种内容总结服务,涵盖微信插件、Telegram 机器人和 iOS 快捷指令,支持文件、图片、视频和播客的内容解析。用户可选择 OpenAI、Gemini、讯飞等服务实现自定义提示词和搜索功能。详细的更新日志和安装指导帮助用户轻松部署,并支持将总结内容发送至在线笔记等平台。
AIHub - 多模型支持的AI助手客户端,具备丰富自定义功能
AIHubChatGPT Plus大模型自定义插件知识库Github开源项目
AIHub是一款集成多个大模型API的客户端,用户可以轻松构建自定义AI助手。它支持文本对话、图片对话、AI绘画和丰富的自定义插件,还可以搭建个人知识库和生成智能报告。支持多语言和多主题配置,并兼容OpenAI、Ollama、谷歌 Gemini、讯飞星火、百度文心等平台,扩展了AI的应用场景。
KnowLM - 支持数据处理、模型预训练、微调及知识增强的LLM框架
KnowLM大模型知识增强深度学习NLPGithub开源项目
该框架提供大型语言模型的数据处理、预训练和微调功能,包含ZhiXi、OneKE等知名模型,并具备指令处理、知识增强和幻觉检测等模块。框架持续优化,适用于信息提取和知识增强,简化语言模型的训练与应用。所有模型权重和数据集均在HuggingFace上可获得,整合EasyInstruct、EasyDetect和EasyEdit模块,提升知识推理与交互能力。
sd-webui-oldsix-prompt - SD-WebUI中文提示词插件
AI交流Q群llama_cpp_pythonprompt插件安装大模型Github开源项目
这个项目解决了prompt对国人不友好的问题,整理多个分类和提示词,支持中文输入和自定义词库,适用于webui和comfyui版本,并持续更新。支持动态随机提示词及大模型配置提供快速翻译和灵感。插件使用户能够便捷地管理和调用提示词库。
FindTheChatGPTer - 多款开源ChatGPT/GPT4替代品汇总与详细介绍
ChatGPTGPT4开源大模型OpenAIGithub开源项目
汇总多个开源ChatGPT/GPT4替代项目,包括ChatYuan、Colossal AI、ChatGLM等,详细介绍其技术实现、参数和应用领域。关注最新更新和开源地址,全面了解现有开源对话模型。
DeepLearing-Interview-Awesome-2024 - 2024深度学习面试题与资源汇总
DeepLearning-Interview-Awesome-2024大模型深度学习计算机视觉算法面试Github开源项目
该项目涵盖大模型、计算机视觉、深度学习基础与框架、行业应用等六大专题,提供最新的面试题目总结与详细解析。本指南通过高频面试题和学术创新思考的汇总,帮助学习者和求职者为2024年深度学习算法职位做好准备。项目内容持续更新,紧跟科技发展趋势。
dive-into-llms - 大语言模型实践教程
大模型编程实践人工智能教程LLMGithub开源项目
该项目提供一系列大语言模型实践教程,涵盖模型微调、部署、提示学习、知识编辑、水印技术等多个前沿主题。通过动手实践,学习者可快速掌握大模型技术,为相关课程和研究奠定基础。教程内容源自上海交通大学课程,适合AI爱好者和研究人员学习使用。
SecGPT - 专注网络安全的AI模型 助力智能化防御
SecGPT网络安全大模型人工智能训练Github开源项目
SecGPT是一个面向网络安全领域的大型语言模型。它可用于漏洞分析、溯源分析、流量分析和攻击研判等多种安全任务。该模型采用自主开发的训练代码以节省显存,并结合高质量的网络安全数据集和DPO强化学习技术,提高了输出质量。SecGPT为网络安全工作提供智能辅助,有助于增强防御能力。
LLMs_interview_notes - LLM核心技术与应用实践面试题集锦
大模型LLMs面试微调langchainGithub开源项目
该项目收集整理了大语言模型(LLMs)领域的面试题和学习资料,内容涵盖基础知识、进阶技能、微调方法、LangChain应用等方面。通过详细的问答解析,帮助读者理解LLM的核心概念、训练技巧和参数高效微调等关键技术。项目为准备面试和深入学习大模型技术的人提供了全面实用的参考资源。
AwesomeNLP - 从基础到前沿的NLP实战教程与学习资源
自然语言处理NLP大模型信息抽取知识图谱Github开源项目
这个开源项目提供了全面的NLP学习资源,涵盖文本分类、信息抽取、知识图谱、机器翻译等多个领域的理论和实战教程。项目为NLP初学者设计了详细的学习路径,同时也包含了大模型应用等前沿内容。资源丰富且实用,适合希望深入学习自然语言处理的人员参考。
llmeval-1 - 系统评估中文大语言模型的创新研究项目
LLMEVAL-1大语言模型评测大模型排行榜评测方法Github开源项目
LLMEVAL-1项目致力于系统研究大语言模型评价方法。该项目涵盖17个大类、453个问题,内容包括事实性问答、阅读理解和框架生成等多个领域。评测采用分项和对比两种方式,从正确性、流畅性、信息量、逻辑性和无害性五个维度进行。LLMEVAL-1通过结合众包和专业评测,为中文大语言模型提供了全面、客观的评估基准。