#语言模型

search-agents - 树搜索算法助力语言模型智能体优化网页交互决策
Tree Search语言模型AI代理网页环境VisualWebArenaGithub开源项目
这个开源项目开发了一种创新的树搜索算法,提升了语言模型智能体在网页环境中的探索和规划能力。该方法在VisualWebArena和WebArena基准测试中得到验证,支持GPT-4和Llama-3等多种模型。项目提供完整文档,包括安装指南、评估流程和基线复现方法,为研究人员和开发者提供了实用工具。
prize - 探索大型语言模型性能反向扩展现象
逆向缩放语言模型AI竞赛GPT-3机器学习Github开源项目
Inverse Scaling Prize比赛旨在发现大型语言模型性能反向扩展的任务。该比赛探索随着模型规模增大,在特定任务上表现反而下降的现象。这有助于揭示语言模型预训练和扩展的潜在问题,对模型的安全和负责任使用具有重要意义。比赛将评估提交的任务,并将优秀成果纳入基准测试,为语言模型研究提供新的洞察。
cascades - 实现复杂语言模型组合的Python库
Cascades语言模型Python库概率编程复杂组合Github开源项目
Cascades是一个开源Python库,专注于实现复杂的语言模型组合。它支持草稿纸、思维链、工具使用和选择推理等高级AI技术。作为一个嵌入Python的通用概率编程库,Cascades为AI研究和开发提供了灵活的实验框架。该项目基于相关学术论文,尽管不是Google官方支持的产品,但为语言模型应用领域贡献了创新实现。
BlockMerge_Gradient - Llama模型层级梯度混合融合工具
BlockMerge Gradient语言模型模型融合梯度值LlamaGithub开源项目
BlockMerge_Gradient是一款专为Llama 1/2语言模型设计的融合工具,通过梯度混合两个微调模型的层级来创建模型集成。该工具支持自定义梯度值和最大分片大小,可选择性处理层级或非层级张量。它能处理不同词汇表大小的模型,并自动复制相关分词器文件,提供灵活的模型融合方案。
langgraph - 基于图的多智能体语言模型应用开发框架
LangGraph语言模型多智能体状态管理图形结构Github开源项目
LangGraph是一个基于图的多智能体语言模型应用开发框架。它提供循环和分支逻辑、状态持久化、人机交互和流式输出等功能。与其他框架相比,LangGraph能更精细地控制应用流程和状态。该框架可与LangChain集成,但不依赖于它。开发者可利用LangGraph构建复杂的智能体工作流和定制化语言模型应用。
pyllms - 多模型连接和性能评估的Python语言模型库
PyLLMs语言模型APIPython库模型评估Github开源项目
PyLLMs是一个用于连接多种语言模型的Python库。它提供标准化响应元数据、多模型同时调用和性能基准测试功能。该库支持异步和流式处理,并可通过简单代码实现LLM连接。PyLLMs适用于自然语言处理和AI应用开发,为开发者提供了便捷的语言模型访问方式。
langchainjs - LangChain.js 为LLM应用开发提供灵活强大的框架
LangChain语言模型AI应用开发开源框架自然语言处理Github开源项目
LangChain.js是一个JavaScript框架,用于开发语言模型驱动的应用。它提供丰富的组件和集成,支持上下文感知和推理能力。框架包含开源库、生产化工具和部署选项,适用于构建问答系统和聊天机器人等应用。LangChain.js兼容多种环境,如Node.js、浏览器和Deno,为开发者提供灵活工具,助力创建复杂的LLM应用。
Chinese-Tiny-LLM - 中文大语言模型训练流程与高质量语料库开源项目
Chinese-Tiny-LLM语言模型预训练中文语料库自然语言处理Github开源项目
Chinese-Tiny-LLM项目提供完整的中文网络语料清洗流程和预训练代码,包含MAP-CC(8000亿中文token预训练数据集)、CHC-Bench(中文难例指令理解基准测试)和CT-LLM(2B参数中文中心语言模型)。该项目突破了传统依赖英语语料库的LLM训练方法,为构建更具包容性和适应性的语言模型奠定基础。
deita - 自动数据选择工具助力大语言模型指令调优
Deita指令调优数据选择语言模型开源项目Github
Deita是一个开源项目,为大型语言模型的指令调优提供自动数据选择工具。项目包含开源工具包、高质量轻量级数据集和高效训练模型。Deita模型使用仅十分之一的指令调优数据,就能达到其他先进聊天模型的性能水平。项目提供全面评估结果,展示了在多项基准测试中的表现。
llms - 大型语言模型的原理与实践应用全面解析
语言模型自然语言处理TransformerGPTBERTGithub开源项目
本项目全面介绍大型语言模型(LLMs)的基本概念、应用场景和技术演进。内容涵盖统计语言模型、神经网络语言模型,以及基于Transformer的预训练模型如GPT和BERT等。系统讲解LLMs核心原理,并探讨模型评估、文本生成和提示工程等实用技术。同时展示LLMs在计算机视觉等领域的创新应用,通过理论与实践结合,为读者提供深入了解LLMs技术的全面指南。
mlx_parallm - 为Apple Silicon设备实现高效并行推理
MLX ParaLLMApple Silicon批处理KV缓存并行推理语言模型Github开源项目
MLX ParaLLM是一个为Apple Silicon设备开发的开源项目,利用MLX框架实现批处理KV缓存技术,从而提高并行推理效率。项目支持Meta-Llama、Phi-3和Gemma等多种模型,兼容量化和float16格式。通过batch_generate方法,MLX ParaLLM实现自动填充、提示模板格式化和多种采样策略,适用于大规模并行文本生成任务。
genai-quickstart-pocs - Amazon Bedrock生成式AI应用示例集
Amazon Bedrock生成式AIRAG模型评估语言模型Github开源项目
项目展示了多个Amazon Bedrock生成式AI应用实例,包括文档摘要、RAG问答、图像生成等。提供Python和.NET两种实现,并集成Streamlit前端,方便快速验证概念。这些示例为开发者提供了丰富的参考,有助于构建创新AI解决方案。
openchat - 采用混合质量数据训练的高性能开源语言模型
OpenChat语言模型人工智能开源LlamaGithub开源项目
OpenChat是一个创新的开源语言模型库,采用C-RLFT策略从混合质量数据中学习。该模型在7B规模下实现了与ChatGPT相当的性能,无需偏好标签。项目致力于开发高性能、商用级的开源大语言模型,并持续进步。OpenChat支持多GPU部署,提供兼容OpenAI的API服务,适用于编码、聊天等多种任务。
zett - 突破语言模型与分词器的兼容性限制
Zero-Shot Tokenizer Transfer语言模型分词器超网络模型迁移Github开源项目
ZeTT是一个创新的开源项目,旨在解决语言模型与分词器之间的兼容性问题。该项目通过零样本分词器迁移技术,使任何语言模型能够与任意分词器协同工作,几乎不需要额外训练。ZeTT提供多个预训练超网络,支持26种语言和代码处理。用户可以轻松将现有模型适配新的分词器,提升模型的通用性。此外,ZeTT还支持训练自定义超网络和迁移微调模型等高级功能,为自然语言处理研究提供新的可能性。
prompt-api - Web开发者的浏览器内置语言模型API
AI浏览器API语言模型Web开发Github开源项目
prompt-api是一个实验性项目,为Web开发者提供统一的JavaScript API以访问浏览器内置语言模型。该API抽象了语言模型细节,实现本地数据处理、离线使用和降低开发成本。它支持零样本提示、系统提示和N-shot提示,并提供会话管理和能力检测功能。prompt-api为开发AI驱动的Web应用提供了新的可能性。
Mixture-of-depths - Transformer语言模型的动态计算资源分配方法
Mixture-of-Depths语言模型模型实现开源项目深度学习Github
Mixture-of-depths是一种Transformer语言模型优化方法,通过动态分配计算资源提高性能。该项目提供Mistral、Mixtral、LLama等多个主流模型的非官方实现。项目支持高级API接口,兼容transformers库,便于研究应用。这种方法旨在提升模型推理效率和灵活性,同时保持输出质量。
chain-of-hindsight - 基于人类反馈优化语言模型的开源框架
Chain of Hindsight语言模型反馈对齐模型训练评估Github开源项目
Chain-of-Hindsight是一个开源项目,提供了基于Jax的语言模型训练框架。该方法通过人类反馈来优化模型性能,支持LLaMA和GPT-J等大型模型。项目包括数据准备、模型训练和评估的完整流程,其反馈处理机制有助于模型在对话和摘要等任务中提升表现。最新更新改进了大模型分片和数据并行处理,为自然语言处理研究提供了实用工具。
self-rag - 通过自反学习使语言模型实现按需检索、生成和评估的框架
Self-RAG语言模型检索增强生成自我反思关键词生成Github开源项目
Self-RAG是一种创新框架,通过自反学习使语言模型实现按需检索、生成和评估。该方法预测反思标记,支持多次检索或跳过检索,并从多角度评估生成内容。这不仅提高了模型输出的事实性和质量,还保持了语言模型的通用性能。
ChatGPTDemo - 无需登录的免费AI智能对话系统
AI工具ChatGPT人工智能语言模型OpenAI对话系统
ChatGPTDemo是基于ChatGPT-4构建的AI对话平台,无需登录即可免费使用。平台采用先进的机器学习算法,支持多语言交互,可应用于聊天机器人开发、创意写作和报告生成等多个场景。作为第三方AI产品介绍网站,我们客观呈现ChatGPTDemo的功能特点,为用户提供便捷的人工智能体验。
Poe - AI对话与创作的综合平台
AI工具PoeAI聊天语言模型AI助手在线交互
Poe集成了多种先进AI模型,包括ChatGPT、GPT-4、Claude和DALLE 3等。用户可在此平台进行文本对话、即时问答,以及图像生成等多样化AI交互。Poe提供了一个便捷的环境,使各类AI功能易于访问和使用,满足不同的应用需求。该平台支持连续对话,为用户提供流畅的AI交互体验,使先进AI技术的应用变得简单直接。
ai798.cn - 全面汇总人工智能助手产品信息的专业平台
AI工具AI助手语言模型人工智能大模型生成式AI
ai798.cn专注于汇总和介绍各类人工智能助手产品。网站提供腾讯元宝、智谱清言、文心一言、豆包和KimiChat等多款AI助手的详细信息,包括产品功能、模型优势和发展历程。通过对比不同AI助手的特点,用户可以全面了解当前AI技术发展现状,为选择合适的AI工具提供参考。
GradientJ - 后台办公流程自动化的AI平台
AI工具GradientJ自动化非结构化数据后台流程语言模型
GradientJ是一个专注于后台办公自动化的AI平台,利用先进的语言模型技术处理非结构化数据。该平台可处理保单PDF、电子表格和监管文件,实现保险表格自动填写、医疗账单代码提取和客户入职流程简化。GradientJ提供可扩展的自动化解决方案,帮助企业通过软件替代传统人工处理和外包模式,实现高效的业务扩展。
PygmalionAI - 大型语言模型驱动的开源AI互动平台
AI工具PygmalionAI人工智能开源项目聊天机器人语言模型
PygmalionAI是一个正在开发的开源AI项目,专注于创建用于聊天、角色扮演和冒险的大型语言模型。该平台旨在提供多样化的AI互动体验,支持多种应用场景。项目鼓励社区参与,通过Discord、Hugging Face和GitHub与开发者和用户保持联系,共同推动AI技术的创新与应用。
Punchlines.ai - AI喜剧笑话生成助手
AI工具AI语言模型笑话生成深夜脱口秀punchlines.ai
Punchlines.ai是一款基于GPT语言模型的AI喜剧笑话生成工具。通过对数千个深夜喜剧独白笑话的学习,该工具能够根据用户提供的笑话开场自动生成妙语连珠。这一创新工具为喜剧创作者提供了独特的AI写作辅助,有助于快速产生有趣的笑料。无论专业喜剧演员还是业余爱好者,都可以借助这一AI工具提升喜剧创作能力。
Avian - 提供先进LLM推理和广泛数据连接的企业AI平台
AI工具Avian生成式AI企业数据API语言模型
Avian是一个企业级生成式AI平台,基于Meta的Llama 3.1 405B模型提供先进语言处理。平台支持100多种数据连接器的RAG技术,实现强大的自然语言理解和生成。Avian API具备原生工具调用、流式处理和OpenAI兼容性,注重数据隐私和安全。Google、Salesforce等大型企业采用该平台,获得可靠、安全和高效的LLM数据集成解决方案。
Free ChatGPT Omni (GPT4o) - GPT4o多模态AI对话平台 免费体验先进人工智能
AI工具GPT4o人工智能多模态语言模型OpenAI
Free ChatGPT Omni为用户提供免费GPT4o对话服务。该平台支持文本、音频和视觉的多模态交互,具备实时语音对话、高级语言理解和视觉分析能力。GPT4o能够处理多种语言,解答图片相关问题,还可生成包含可读文本的图像。与GPT-4 Turbo相比,GPT4o运行更快、成本更低,并且拥有更高的使用限制,显著提升了AI对话体验的便捷性和效率。
Surge AI - 全球顶尖AI数据标注与RLHF平台
AI工具Surge AI数据标注人工智能语言模型RLHF
Surge AI提供全球化数据标注服务,为AI和大型语言模型训练提供高质量数据。支持RLHF、内容审核、搜索评估等多种场景,覆盖40多种语言。通过现代化API和工具,帮助企业高效获取人工数据,加速AI开发与评估。全球顶级AI公司的首选合作伙伴。
ChatGPT Po Polsku - 波兰语ChatGPT,无限制免费使用的AI对话工具
AI工具ChatGPTAI语言模型聊天机器人波兰语
ChatGPT Po Polsku是基于OpenAI的GPT-3.5和GPT-4模型开发的波兰语AI对话工具。该工具完全免费,无需注册,消息不限量。它具备自然语言处理、上下文响应、个性化和多语言支持等功能,可帮助用户提升沟通效率,综合分析数据。尽管存在信息更新滞后等局限,ChatGPT Po Polsku仍是一款强大的AI语言工具,为波兰用户提供便捷高效的对话体验。
TextSynth - 大型AI模型API访问与推理优化服务平台
AI工具TextSynth语言模型文本生成API服务人工智能
TextSynth作为人工智能服务平台,提供Mistral、Mixtral、Llama2和Stable Diffusion等大型AI模型的API访问。平台通过REST API和交互式playground支持文本处理、图像生成和语音转文本等多种功能。采用自定义推理技术,TextSynth在标准硬件上实现更快速度和更低成本。自2020年成立以来,平台一直是GPT-2模型访问的先行者。TextSynth提供免费基础服务和按需付费选项,满足不同用户需求。
Mammouth AI - 整合多种顶级AI模型的便捷订阅服务
AI工具AI模型Mammouth语言模型图像生成订阅服务
Mammouth AI集成多种顶级AI模型,包括GPT、Claude、Gemini等语言模型和Midjourney、DALL-E等图像生成工具。通过单一月度订阅,用户可便捷访问这些先进AI技术。平台特色包括一键重新提示、聊天历史记录和多语言支持,旨在提供全面高效的AI应用体验,促进各行业创新发展。
Odyssey - Mac原生应用助力创意工作流程自动化
AI工具AI工作流程创意自动化图像处理语言模型批量处理
Odyssey为Mac用户提供AI驱动的创意工具,支持图像生成处理、语言模型应用和工作流自动化。本地运行保障数据隐私,适合各类创意工作者提高效率。应用涵盖艺术创作、设计制作和任务管理等多个领域。
Prompt Token Counter for OpenAI Models - OpenAI模型令牌计数在线工具
AI工具token计数语言模型OpenAIGPT-3.5自然语言处理
在线工具,用于计算OpenAI模型和提示的令牌数量,帮助用户确保内容符合模型令牌限制。优化语言模型交互,控制成本,管理响应长度,提高通信效率。提供令牌和提示相关知识,助力用户深入理解OpenAI模型。适用于开发者、研究人员和AI爱好者。
Seamless - 智能文献综述生成平台助力学术研究
AI工具AI辅助写作文献综述学术研究语言模型科研工具
Seamless作为先进的AI文献综述生成平台,为学术研究提供强大支持。通过整合Semantic Scholar数据库和GPT-4等大型语言模型,该工具能够根据用户输入快速生成高质量、基于实际文献的综述。涵盖工程、计算机科学、生物医学、法律和商业等多个领域,Seamless大幅提升文献综述的编写效率,为研究人员和学生提供宝贵的学术支持。
AI Buzz on twitter - AI领域最新动态与研究进展的实时资讯聚合
AI工具人工智能机器学习深度学习AlphaFold语言模型
AI Buzz on twitter汇聚人工智能领域的前沿资讯,每日更新AI最新突破、研究进展、应用创新和行业趋势。网站涵盖机器学习、深度学习、语言模型等多个AI主题,为读者提供全面及时的行业动态。通过精选Twitter热门AI话题,本平台成为AI爱好者、研究人员和从业者获取信息的便捷渠道。
Ava PLS - 开源桌面应用支持本地运行多功能语言模型
AI工具Ava PLS语言模型开源桌面应用本地运行自然语言处理
Ava PLS是一款基于AI的开源桌面应用,支持在本地计算机上运行语言模型。该应用可执行文本生成、语法纠正、改写、摘要和数据提取等多种语言任务。兼容macOS、Windows和Linux系统,采用Zig、C++和Swift UI等技术开发。Ava PLS提供私密高效的语言处理方案,适合需要离线或高安全性环境的用户。
RWKV-Runner - 一款全自动化轻量级RWKV管理和启动工具并提供与OpenAI API兼容的接口
RWKV Runner语言模型自动化OpenAI API部署Github开源项目
RWKV-Runner项目通过一个轻量级的可执行程序,简化了大型语言模型的使用,并提供与OpenAI API兼容的接口,使每个ChatGPT客户端都能作为RWKV客户端使用。项目支持多语言本地化,提供用户友好界面,自动安装依赖,包含一键启动、模型管理、前后端分离等功能。支持多级VRAM配置和CUDA加速,适用于大多数计算机。提供简单的部署示例、内置模型转换工具和远程模型检查功能。