#大规模语言模型

Awesome-LLM-Survey:大型语言模型研究领域全面资料汇总与导航

1 个月前

Awesome-LLM-Survey是一个全面收集大型语言模型(LLM)相关研究论文和资源的项目,涵盖了LLM的指令微调、人类对齐、多模态、评估、应用等多个方面,为研究人员提供了丰富的参考资料。

Awesome-LLM-Survey LLM 人工智能大规模语言模型研究报告 Github 开源项目

1 个月前

ML-Papers-of-the-Week 学习资料汇总 - 每周精选顶级机器学习论文

1 个月前

ML-Papers-of-the-Week是一个精选每周顶级机器学习论文的开源项目。本文汇总了该项目的主要学习资源,包括GitHub仓库、每周论文列表、newsletter订阅等,帮助读者更好地了解和利用这一宝贵的学习资料。

LLMs ChatGPT AI安全大规模语言模型 multimodal models Github 开源项目

1 个月前

Easy-Translate：简单高效的多语言翻译工具

2 个月前

Easy-Translate是一个强大的翻译工具，支持多种语言之间的文本翻译。它基于最先进的机器翻译模型，提供高质量的翻译结果，同时设计简单易用，适合初学者和高级用户使用。本文将详细介绍Easy-Translate的功能特点、使用方法及其在自然语言处理领域的应用。

Easy-Translate 机器翻译多语言翻译大规模语言模型自然语言处理 Github 开源项目

2 个月前

大型语言模型(LLM)综述: 发展现状、应用与挑战

2 个月前

本文全面概述了大型语言模型(LLM)的研究进展、应用场景及面临的挑战。文章涵盖了LLM的基本概念、主要技术、评估方法、典型应用以及伦理和安全问题,为读者提供了LLM领域的全面认识。

Awesome-LLM-Survey LLM 人工智能大规模语言模型研究报告 Github 开源项目

2 个月前

ML-Papers-of-the-Week:每周精选机器学习顶级论文

2 个月前

深入探讨DAIR.AI的ML-Papers-of-the-Week项目,该项目每周精选并总结机器学习领域的顶级论文,为研究人员和从业者提供最新研究动态。

LLMs ChatGPT AI安全大规模语言模型 multimodal models Github 开源项目

2 个月前

Data-Juicer学习资料汇总 - 一站式多模态数据处理系统

1 个月前

Data-Juicer是一个一站式多模态数据处理系统,旨在为大语言模型提供更高质量、更丰富、更易"消化"的数据。本文汇总了Data-Juicer的各种学习资料,包括项目介绍、文档、示例、工具等,帮助读者快速入门和深入了解这个强大的数据处理工具。

Data-Juicer 多模态数据处理大规模语言模型数据模型协同开发数据处理 Github 开源项目

1 个月前

ChatIE学习资料汇总 - 零样本信息抽取利器

1 个月前

ChatIE是一个基于ChatGPT的零样本信息抽取工具,本文汇总了相关学习资源,帮助读者快速上手使用ChatIE进行实体关系抽取、命名实体识别和事件抽取等任务。

ChatIE 零样本信息抽取大规模语言模型实体关系三元组抽取命名实体识别 Github 开源项目

1 个月前

ToolBench: 开源大语言模型的工具操作能力提升平台

2 个月前

ToolBench是一个旨在提升开源大语言模型工具操作能力的综合平台,包含大规模高质量数据集、训练脚本、评估基准以及ToolLLaMA模型,为研究人员提供了全面的资源来增强语言模型的工具使用能力。

ToolBench AI工具 API 大规模语言模型工具使用能力 Github 开源项目

2 个月前

Data-Juicer: 为大模型提供更高质量、更丰富、更易"消化"的数据

2 个月前

Data-Juicer是一个一站式数据处理系统,旨在为大语言模型和多模态模型提供更高质量、更丰富、更易"消化"的训练数据。本文将详细介绍Data-Juicer的功能特性、使用方法及其在AI模型训练中的重要作用。

Data-Juicer 多模态数据处理大规模语言模型数据模型协同开发数据处理 Github 开源项目

2 个月前

ChatIE: 基于ChatGPT的智能信息抽取工具

2 个月前

ChatIE是一个创新的信息抽取工具,利用ChatGPT的强大能力来实现高效准确的实体关系抽取。本文将详细介绍ChatIE的设计理念、核心功能以及在实际应用中的优势。

ChatIE 零样本信息抽取大规模语言模型实体关系三元组抽取命名实体识别 Github 开源项目

2 个月前

相关项目

ChatIE

ChatIE项目利用ChatGPT的强大功能，将零样本信息抽取任务转化为多轮问答形式，形成了一个两阶段的创新框架。通过在多个数据集上的广泛评估，该框架在实体关系抽取、命名实体识别和事件抽取任务中表现出色，甚至超越了一些全监督模型，展现了在有限资源下构建信息抽取系统的巨大潜力。

ML-Papers-of-the-Week

The 'ML-Papers-of-the-Week' project curates pivotal machine learning research papers weekly, serving as a prime resource for AI researchers, practitioners, and enthusiasts eager to explore cutting-edge innovations and trends in AI.

data-juicer

Data-Juicer 是一款强大的一站式数据处理系统，专为大语言模型设计。它支持多模态数据处理，具有80多种操作符和20多个配置方案，提供高效且并行的数据处理能力。其友好的用户体验和全面的文档，使其成为生产环境中的优选方案。

Awesome-LLM-Survey

symato

该项目使用独特的音节、标记和声调分割方法，开发了高效的越南语语言模型。通过创新的token化技术和RWKV架构，解决了传统Transformer模型在处理越南语多字节编码时的性能瓶颈。项目包括小数据集实验、大规模数据处理及大型模型训练，展示了在有限计算资源下应用规模规律的潜力。模型具有广泛适应性，既节省计算资源，又保持高效的文本生成和语言理解能力。

wenda

闻达是一个开源的大规模语言模型调用平台，集成多种离线和在线LLM模型。平台内置本地知识库和搜索引擎，并提供Auto脚本功能用于自定义对话流程。适合个人和中小企业使用，注重知识安全和私密性。平台还包括对话历史管理和多用户支持等实用功能，旨在实现高效的特定环境内容生成。

ToolBench

ToolBench项目构建了大规模的指令微调数据集，旨在提升语言模型的工具使用能力。该项目收集了16464个真实API，覆盖单工具和多工具场景，采用深度优先搜索决策树方法生成注释。项目提供训练脚本和微调后的ToolLLaMA模型，其工具使用能力达到了与ChatGPT相当的水平。

starcoder2

StarCoder2是一系列代码生成模型，包括3B、7B和15B参数规模。模型在600多种编程语言和自然语言文本上训练，使用分组查询注意力机制，具有16,384个token的上下文窗口。支持代码补全、多GPU部署和量化推理，提供使用说明和微调指南。StarCoder2在代码生成任务中表现优异，是开发者的有力工具。

NeMo-Framework-Launcher

NeMo-Framework-Launcher是一个用于启动NeMo Framework训练作业的云原生工具。它专注于生成式AI模型的基础模型训练，集成了模型并行、分布式优化和混合精度训练等技术。该工具简化了在云端或本地集群上的训练流程，支持集群配置、数据处理、模型训练、微调和评估。适用于GPT、BERT和T5等模型，可扩展至数千GPU，支持大规模语言模型训练。

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com