#语言模型

search-agents - 树搜索算法助力语言模型智能体优化网页交互决策

Tree Search语言模型AI代理网页环境VisualWebArenaGithub开源项目

这个开源项目开发了一种创新的树搜索算法，提升了语言模型智能体在网页环境中的探索和规划能力。该方法在VisualWebArena和WebArena基准测试中得到验证，支持GPT-4和Llama-3等多种模型。项目提供完整文档，包括安装指南、评估流程和基线复现方法，为研究人员和开发者提供了实用工具。

prize - 探索大型语言模型性能反向扩展现象

逆向缩放语言模型AI竞赛GPT-3机器学习Github开源项目

Inverse Scaling Prize比赛旨在发现大型语言模型性能反向扩展的任务。该比赛探索随着模型规模增大，在特定任务上表现反而下降的现象。这有助于揭示语言模型预训练和扩展的潜在问题，对模型的安全和负责任使用具有重要意义。比赛将评估提交的任务，并将优秀成果纳入基准测试，为语言模型研究提供新的洞察。

cascades - 实现复杂语言模型组合的Python库

Cascades语言模型Python库概率编程复杂组合Github开源项目

Cascades是一个开源Python库，专注于实现复杂的语言模型组合。它支持草稿纸、思维链、工具使用和选择推理等高级AI技术。作为一个嵌入Python的通用概率编程库，Cascades为AI研究和开发提供了灵活的实验框架。该项目基于相关学术论文，尽管不是Google官方支持的产品，但为语言模型应用领域贡献了创新实现。

BlockMerge_Gradient - Llama模型层级梯度混合融合工具

BlockMerge Gradient语言模型模型融合梯度值LlamaGithub开源项目

BlockMerge_Gradient是一款专为Llama 1/2语言模型设计的融合工具，通过梯度混合两个微调模型的层级来创建模型集成。该工具支持自定义梯度值和最大分片大小，可选择性处理层级或非层级张量。它能处理不同词汇表大小的模型，并自动复制相关分词器文件，提供灵活的模型融合方案。

langgraph - 基于图的多智能体语言模型应用开发框架

LangGraph语言模型多智能体状态管理图形结构Github开源项目

LangGraph是一个基于图的多智能体语言模型应用开发框架。它提供循环和分支逻辑、状态持久化、人机交互和流式输出等功能。与其他框架相比，LangGraph能更精细地控制应用流程和状态。该框架可与LangChain集成，但不依赖于它。开发者可利用LangGraph构建复杂的智能体工作流和定制化语言模型应用。

pyllms - 多模型连接和性能评估的Python语言模型库

PyLLMs语言模型APIPython库模型评估Github开源项目

PyLLMs是一个用于连接多种语言模型的Python库。它提供标准化响应元数据、多模型同时调用和性能基准测试功能。该库支持异步和流式处理，并可通过简单代码实现LLM连接。PyLLMs适用于自然语言处理和AI应用开发，为开发者提供了便捷的语言模型访问方式。

langchainjs - LangChain.js 为LLM应用开发提供灵活强大的框架

LangChain语言模型AI应用开发开源框架自然语言处理Github开源项目

LangChain.js是一个JavaScript框架，用于开发语言模型驱动的应用。它提供丰富的组件和集成，支持上下文感知和推理能力。框架包含开源库、生产化工具和部署选项，适用于构建问答系统和聊天机器人等应用。LangChain.js兼容多种环境，如Node.js、浏览器和Deno，为开发者提供灵活工具，助力创建复杂的LLM应用。

Chinese-Tiny-LLM - 中文大语言模型训练流程与高质量语料库开源项目

Chinese-Tiny-LLM语言模型预训练中文语料库自然语言处理Github开源项目

Chinese-Tiny-LLM项目提供完整的中文网络语料清洗流程和预训练代码，包含MAP-CC（8000亿中文token预训练数据集）、CHC-Bench（中文难例指令理解基准测试）和CT-LLM（2B参数中文中心语言模型）。该项目突破了传统依赖英语语料库的LLM训练方法，为构建更具包容性和适应性的语言模型奠定基础。

deita - 自动数据选择工具助力大语言模型指令调优

Deita指令调优数据选择语言模型开源项目Github

Deita是一个开源项目，为大型语言模型的指令调优提供自动数据选择工具。项目包含开源工具包、高质量轻量级数据集和高效训练模型。Deita模型使用仅十分之一的指令调优数据，就能达到其他先进聊天模型的性能水平。项目提供全面评估结果，展示了在多项基准测试中的表现。

llms - 大型语言模型的原理与实践应用全面解析

语言模型自然语言处理TransformerGPTBERTGithub开源项目

本项目全面介绍大型语言模型(LLMs)的基本概念、应用场景和技术演进。内容涵盖统计语言模型、神经网络语言模型,以及基于Transformer的预训练模型如GPT和BERT等。系统讲解LLMs核心原理,并探讨模型评估、文本生成和提示工程等实用技术。同时展示LLMs在计算机视觉等领域的创新应用,通过理论与实践结合,为读者提供深入了解LLMs技术的全面指南。

mlx_parallm - 为Apple Silicon设备实现高效并行推理

MLX ParaLLMApple Silicon批处理KV缓存并行推理语言模型Github开源项目

MLX ParaLLM是一个为Apple Silicon设备开发的开源项目，利用MLX框架实现批处理KV缓存技术，从而提高并行推理效率。项目支持Meta-Llama、Phi-3和Gemma等多种模型，兼容量化和float16格式。通过batch_generate方法，MLX ParaLLM实现自动填充、提示模板格式化和多种采样策略，适用于大规模并行文本生成任务。

genai-quickstart-pocs - Amazon Bedrock生成式AI应用示例集

Amazon Bedrock生成式AIRAG模型评估语言模型Github开源项目

项目展示了多个Amazon Bedrock生成式AI应用实例，包括文档摘要、RAG问答、图像生成等。提供Python和.NET两种实现，并集成Streamlit前端，方便快速验证概念。这些示例为开发者提供了丰富的参考，有助于构建创新AI解决方案。

openchat - 采用混合质量数据训练的高性能开源语言模型

OpenChat语言模型人工智能开源LlamaGithub开源项目

OpenChat是一个创新的开源语言模型库,采用C-RLFT策略从混合质量数据中学习。该模型在7B规模下实现了与ChatGPT相当的性能,无需偏好标签。项目致力于开发高性能、商用级的开源大语言模型,并持续进步。OpenChat支持多GPU部署,提供兼容OpenAI的API服务,适用于编码、聊天等多种任务。

zett - 突破语言模型与分词器的兼容性限制

Zero-Shot Tokenizer Transfer语言模型分词器超网络模型迁移Github开源项目

ZeTT是一个创新的开源项目，旨在解决语言模型与分词器之间的兼容性问题。该项目通过零样本分词器迁移技术，使任何语言模型能够与任意分词器协同工作，几乎不需要额外训练。ZeTT提供多个预训练超网络，支持26种语言和代码处理。用户可以轻松将现有模型适配新的分词器，提升模型的通用性。此外，ZeTT还支持训练自定义超网络和迁移微调模型等高级功能，为自然语言处理研究提供新的可能性。

prompt-api - Web开发者的浏览器内置语言模型API

AI浏览器API语言模型Web开发Github开源项目

prompt-api是一个实验性项目，为Web开发者提供统一的JavaScript API以访问浏览器内置语言模型。该API抽象了语言模型细节，实现本地数据处理、离线使用和降低开发成本。它支持零样本提示、系统提示和N-shot提示，并提供会话管理和能力检测功能。prompt-api为开发AI驱动的Web应用提供了新的可能性。

Mixture-of-depths - Transformer语言模型的动态计算资源分配方法

Mixture-of-Depths语言模型模型实现开源项目深度学习Github

Mixture-of-depths是一种Transformer语言模型优化方法，通过动态分配计算资源提高性能。该项目提供Mistral、Mixtral、LLama等多个主流模型的非官方实现。项目支持高级API接口，兼容transformers库，便于研究应用。这种方法旨在提升模型推理效率和灵活性，同时保持输出质量。

chain-of-hindsight - 基于人类反馈优化语言模型的开源框架

Chain of Hindsight语言模型反馈对齐模型训练评估Github开源项目

Chain-of-Hindsight是一个开源项目，提供了基于Jax的语言模型训练框架。该方法通过人类反馈来优化模型性能，支持LLaMA和GPT-J等大型模型。项目包括数据准备、模型训练和评估的完整流程，其反馈处理机制有助于模型在对话和摘要等任务中提升表现。最新更新改进了大模型分片和数据并行处理，为自然语言处理研究提供了实用工具。

self-rag - 通过自反学习使语言模型实现按需检索、生成和评估的框架

Self-RAG语言模型检索增强生成自我反思关键词生成Github开源项目

Self-RAG是一种创新框架,通过自反学习使语言模型实现按需检索、生成和评估。该方法预测反思标记,支持多次检索或跳过检索,并从多角度评估生成内容。这不仅提高了模型输出的事实性和质量,还保持了语言模型的通用性能。

ChatGPTDemo - 无需登录的免费AI智能对话系统

AI工具ChatGPT人工智能语言模型OpenAI对话系统

ChatGPTDemo是基于ChatGPT-4构建的AI对话平台，无需登录即可免费使用。平台采用先进的机器学习算法，支持多语言交互，可应用于聊天机器人开发、创意写作和报告生成等多个场景。作为第三方AI产品介绍网站，我们客观呈现ChatGPTDemo的功能特点，为用户提供便捷的人工智能体验。

Poe - AI对话与创作的综合平台

AI工具PoeAI聊天语言模型AI助手在线交互

Poe集成了多种先进AI模型，包括ChatGPT、GPT-4、Claude和DALLE 3等。用户可在此平台进行文本对话、即时问答，以及图像生成等多样化AI交互。Poe提供了一个便捷的环境，使各类AI功能易于访问和使用，满足不同的应用需求。该平台支持连续对话，为用户提供流畅的AI交互体验，使先进AI技术的应用变得简单直接。

ai798.cn - 全面汇总人工智能助手产品信息的专业平台

AI工具AI助手语言模型人工智能大模型生成式AI

ai798.cn专注于汇总和介绍各类人工智能助手产品。网站提供腾讯元宝、智谱清言、文心一言、豆包和KimiChat等多款AI助手的详细信息，包括产品功能、模型优势和发展历程。通过对比不同AI助手的特点，用户可以全面了解当前AI技术发展现状，为选择合适的AI工具提供参考。

GradientJ - 后台办公流程自动化的AI平台

AI工具GradientJ自动化非结构化数据后台流程语言模型

GradientJ是一个专注于后台办公自动化的AI平台，利用先进的语言模型技术处理非结构化数据。该平台可处理保单PDF、电子表格和监管文件，实现保险表格自动填写、医疗账单代码提取和客户入职流程简化。GradientJ提供可扩展的自动化解决方案，帮助企业通过软件替代传统人工处理和外包模式，实现高效的业务扩展。

PygmalionAI - 大型语言模型驱动的开源AI互动平台

AI工具PygmalionAI人工智能开源项目聊天机器人语言模型

PygmalionAI是一个正在开发的开源AI项目，专注于创建用于聊天、角色扮演和冒险的大型语言模型。该平台旨在提供多样化的AI互动体验，支持多种应用场景。项目鼓励社区参与，通过Discord、Hugging Face和GitHub与开发者和用户保持联系，共同推动AI技术的创新与应用。

Punchlines.ai - AI喜剧笑话生成助手

AI工具AI语言模型笑话生成深夜脱口秀punchlines.ai

Punchlines.ai是一款基于GPT语言模型的AI喜剧笑话生成工具。通过对数千个深夜喜剧独白笑话的学习，该工具能够根据用户提供的笑话开场自动生成妙语连珠。这一创新工具为喜剧创作者提供了独特的AI写作辅助，有助于快速产生有趣的笑料。无论专业喜剧演员还是业余爱好者，都可以借助这一AI工具提升喜剧创作能力。

Avian - 提供先进LLM推理和广泛数据连接的企业AI平台

AI工具Avian生成式AI企业数据API语言模型

Avian是一个企业级生成式AI平台，基于Meta的Llama 3.1 405B模型提供先进语言处理。平台支持100多种数据连接器的RAG技术，实现强大的自然语言理解和生成。Avian API具备原生工具调用、流式处理和OpenAI兼容性，注重数据隐私和安全。Google、Salesforce等大型企业采用该平台，获得可靠、安全和高效的LLM数据集成解决方案。

Free ChatGPT Omni (GPT4o) - GPT4o多模态AI对话平台免费体验先进人工智能

AI工具GPT4o人工智能多模态语言模型OpenAI

Free ChatGPT Omni为用户提供免费GPT4o对话服务。该平台支持文本、音频和视觉的多模态交互，具备实时语音对话、高级语言理解和视觉分析能力。GPT4o能够处理多种语言，解答图片相关问题，还可生成包含可读文本的图像。与GPT-4 Turbo相比，GPT4o运行更快、成本更低，并且拥有更高的使用限制，显著提升了AI对话体验的便捷性和效率。

Surge AI - 全球顶尖AI数据标注与RLHF平台

AI工具Surge AI数据标注人工智能语言模型RLHF

Surge AI提供全球化数据标注服务,为AI和大型语言模型训练提供高质量数据。支持RLHF、内容审核、搜索评估等多种场景,覆盖40多种语言。通过现代化API和工具,帮助企业高效获取人工数据,加速AI开发与评估。全球顶级AI公司的首选合作伙伴。

ChatGPT Po Polsku - 波兰语ChatGPT，无限制免费使用的AI对话工具

AI工具ChatGPTAI语言模型聊天机器人波兰语

ChatGPT Po Polsku是基于OpenAI的GPT-3.5和GPT-4模型开发的波兰语AI对话工具。该工具完全免费,无需注册,消息不限量。它具备自然语言处理、上下文响应、个性化和多语言支持等功能,可帮助用户提升沟通效率,综合分析数据。尽管存在信息更新滞后等局限,ChatGPT Po Polsku仍是一款强大的AI语言工具,为波兰用户提供便捷高效的对话体验。

TextSynth - 大型AI模型API访问与推理优化服务平台

AI工具TextSynth语言模型文本生成API服务人工智能

TextSynth作为人工智能服务平台，提供Mistral、Mixtral、Llama2和Stable Diffusion等大型AI模型的API访问。平台通过REST API和交互式playground支持文本处理、图像生成和语音转文本等多种功能。采用自定义推理技术，TextSynth在标准硬件上实现更快速度和更低成本。自2020年成立以来，平台一直是GPT-2模型访问的先行者。TextSynth提供免费基础服务和按需付费选项，满足不同用户需求。

Mammouth AI - 整合多种顶级AI模型的便捷订阅服务

AI工具AI模型Mammouth语言模型图像生成订阅服务

Mammouth AI集成多种顶级AI模型，包括GPT、Claude、Gemini等语言模型和Midjourney、DALL-E等图像生成工具。通过单一月度订阅，用户可便捷访问这些先进AI技术。平台特色包括一键重新提示、聊天历史记录和多语言支持，旨在提供全面高效的AI应用体验，促进各行业创新发展。

Odyssey - Mac原生应用助力创意工作流程自动化

AI工具AI工作流程创意自动化图像处理语言模型批量处理

Odyssey为Mac用户提供AI驱动的创意工具,支持图像生成处理、语言模型应用和工作流自动化。本地运行保障数据隐私,适合各类创意工作者提高效率。应用涵盖艺术创作、设计制作和任务管理等多个领域。

Prompt Token Counter for OpenAI Models - OpenAI模型令牌计数在线工具

AI工具token计数语言模型OpenAIGPT-3.5自然语言处理

在线工具，用于计算OpenAI模型和提示的令牌数量，帮助用户确保内容符合模型令牌限制。优化语言模型交互，控制成本，管理响应长度，提高通信效率。提供令牌和提示相关知识，助力用户深入理解OpenAI模型。适用于开发者、研究人员和AI爱好者。

Seamless - 智能文献综述生成平台助力学术研究

AI工具AI辅助写作文献综述学术研究语言模型科研工具

Seamless作为先进的AI文献综述生成平台，为学术研究提供强大支持。通过整合Semantic Scholar数据库和GPT-4等大型语言模型，该工具能够根据用户输入快速生成高质量、基于实际文献的综述。涵盖工程、计算机科学、生物医学、法律和商业等多个领域，Seamless大幅提升文献综述的编写效率，为研究人员和学生提供宝贵的学术支持。

AI Buzz on twitter - AI领域最新动态与研究进展的实时资讯聚合

AI工具人工智能机器学习深度学习AlphaFold语言模型

AI Buzz on twitter汇聚人工智能领域的前沿资讯，每日更新AI最新突破、研究进展、应用创新和行业趋势。网站涵盖机器学习、深度学习、语言模型等多个AI主题，为读者提供全面及时的行业动态。通过精选Twitter热门AI话题，本平台成为AI爱好者、研究人员和从业者获取信息的便捷渠道。

Ava PLS - 开源桌面应用支持本地运行多功能语言模型

AI工具Ava PLS语言模型开源桌面应用本地运行自然语言处理

Ava PLS是一款基于AI的开源桌面应用，支持在本地计算机上运行语言模型。该应用可执行文本生成、语法纠正、改写、摘要和数据提取等多种语言任务。兼容macOS、Windows和Linux系统，采用Zig、C++和Swift UI等技术开发。Ava PLS提供私密高效的语言处理方案，适合需要离线或高安全性环境的用户。

RWKV-Runner - 一款全自动化轻量级RWKV管理和启动工具并提供与OpenAI API兼容的接口

RWKV Runner语言模型自动化OpenAI API部署Github开源项目

RWKV-Runner项目通过一个轻量级的可执行程序，简化了大型语言模型的使用，并提供与OpenAI API兼容的接口，使每个ChatGPT客户端都能作为RWKV客户端使用。项目支持多语言本地化，提供用户友好界面，自动安装依赖，包含一键启动、模型管理、前后端分离等功能。支持多级VRAM配置和CUDA加速，适用于大多数计算机。提供简单的部署示例、内置模型转换工具和远程模型检查功能。

相关文章

Article Cover

Cheshire Cat: 一个强大的AI助手开发框架

Article Cover

CAMEL: 探索多智能体系统的前沿技术

Article Cover

RWKV-Runner：一款强大的RWKV语言模型管理与启动工具

Article Cover

MatMul-Free LLM：革新大型语言模型的计算方式

Article Cover

Chronos: 革命性的时间序列预测模型

Article Cover

xLSTM: 扩展长短期记忆网络的革新性突破

Article Cover

Dolma:开源大规模语言模型预训练数据集与工具包

Article Cover

RAPTOR: 一种创新的递归抽象处理技术

Article Cover

StableLM: Stability AI的开源大型语言模型

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号