大型语言模型(LLM)的论文和资源的汇总
LLMSurvey 汇总了大量关于大型语言模型(LLM) 的论文和资源。介绍了从GPT到LLaMA系列的技术演变,分析了在指令调整实验中不同类型指令对LLM性能的影响,同时提供了针对初学者的中文书籍,以帮助理解该领域的基本框架和发展路线。
LLMSurvey 是一个专注于大型语言模型(Large Language Models,LLM)相关资源和论文的集合。该项目旨在收集和整理与 LLM 相关的重要研究成果和资源,以便研究人员能够更好地了解和利用这些技术。LLMSurvey 的组织结构参考于一篇题为“LLMs 调查”的学术论文,该论文全面阐述了 LLM 的研究进展。
LLMSurvey 团队已经发布了该调查的中文版书籍。这本书专注于为 LLM 领域的初学者提供入门指导和全面框架,适合有深度学习基础的高年级本科生和低年级研究生。读者可以通过该书理解 LLM 的基本概念和发展路径。书籍可以从 这里 下载。
自2018年6月以来,包含“语言模型”关键词的论文数量逐渐增加,而自2019年10月以来,“大型语言模型”主题的论文数量爆发性增长,尤其是在 ChatGPT 发布后,每天平均新增8.58篇相关论文。相关统计数据通过搜索论文标题和摘要中的关键词获得。
LLMSurvey 提供了一个简要图示,展示了 GPT 系列模型的技术演进。该图采用实线和虚线分别表示模型间的强和弱演进关联,如不同模型之间的发展路径。
LLaMA 家族的研究工作量巨大,LLMSurvey 项目为便于逐步更新,提供了其演化图的源文件,并鼓励读者通过 GitHub 提交 pull request 来补充额外的模型。
LLMSurvey 收集了一些提示设计的实用技巧,提供了与提示相关的原理和要素。读者可以点击此处查看更详细的信息。项目团队也欢迎任何人通过 GitHub 提交相关建议。
LLMSurvey 中包括两类实验:
团队呼吁提供计算资源,以便进行更加全面的实验。
LLMSurvey 提供了一份关于 LLM 的时间线,涵盖了多个重要的模型发布,按公有和闭源两类进行分类。例如,GPT-3、LaMDA 等知名大模型均在列表之中。
LLMSurvey 是了解和研究大型语言模型的宝贵资源。通过收集和组织丰富的研究材料,该项目为学术界提供了一个学习、交流和创新的平台。团队鼓励各界人士关注该项目的更新,并参与到其中。
OpenAI Agents SDK,助力开发者便捷使用 OpenAI 相关功能。
openai-agents-python 是 OpenAI 推出的一款强大 Python SDK,它为开发者提供了与 OpenAI 模型交互的高效工具,支持工具调用、结果处理、追踪等功能,涵盖多种应用场景,如研究助手、财务研究等,能显著提升开发效率,让开发者更轻松地利用 OpenAI 的技术优势。
高分辨率纹理 3D 资产生成
Hunyuan3D-2 是腾讯开发的用于 3D 资产生成的强大工具,支持从文本描述、单张图片或多视角图片生成 3D 模型,具备快速形状生成能力,可生成带纹理的高质量 3D 模型,适用于多个领域,为 3D 创作提供了高效解决方案。
一个具备存储、管理和客户端操作等多种功能的分布式文件系统相关项目。
3FS 是一个功能强大的分布式文件系统项目,涵盖了存储引擎、元数据管理、客户端工具等多个模块。它支持多种文件操作,如创建文件和目录、设置布局等,同时具备高效的事件循环、节点选择和协程池管理等特性。适用于需要大规模数据存储和管理的场景,能够提高系统的性能和可靠性,是分布式存储领域的优质解决方案。
用于可扩展和多功能 3D 生成的结构化 3D 潜在表示
TRELLIS 是一个专注于 3D 生成的项目,它利用结构化 3D 潜在表示技术,实现了可扩展且多功能的 3D 生成。项目提供了多种 3D 生成的方法和工具,包括文本到 3D、图像到 3D 等,并且支持多种输出格式,如 3D 高斯、辐射场和网格等。通过 TRELLIS,用户可以根据文本描述或图像输入快速生成高质量的 3D 资产,适用于游戏开发、动画制作、虚拟现实等多个领域。
10 节课教你开启构建 AI 代理所需的一切知识
AI Agents for Beginners 是一个专为初学者打造的课程项目,提供 10 节课程,涵盖构建 AI 代理的必备知识,支持多种语言,包含规划设计、工具使用、多代理等丰富内容,助您快速入门 AI 代理领域。
AI Excel全自动制表工具
AEE 在线 AI 全自动 Excel 编辑器,提供智能录入、自动公式、数据整理、图表生成等功能,高效处理 Excel 任务,提升办公效率。支持自动高亮数据、批量计算、不规则数据录入,适用于企业、教育、金融等多场景。
基于 UI-TARS 视觉语言模型的桌面应用,可通过自然语言控制计算机进行多模态操作。
UI-TARS-desktop 是一款功能强大的桌面应用,基于 UI-TARS(视觉语言模型) 构建。它具备自然语言控制、截图与视觉识别、精确的鼠标键盘控制等功能,支持跨平台使用(Windows/MacOS),能提供实时反馈和状态显示,且数据完全本地处理,保障隐私安全。该应用集成了多种大语言模型和搜索方式,还可进行文件系统操作。适用于需要智能交互和自动化任务的场景,如信息检索、文件管理等。其提供了详细的文档,包括快速启动、部署、贡献指南和 SDK 使用说明等,方便开发者使用和扩展。
开源且先进的大规模视频生成模型项目
Wan2.1 是一个开源且先进的大规模视频生成模型项目,支持文本到图像、文本到视频、图像到视频等多种生成任务。它具备丰富的配置选项,可调整分辨率、扩散步数等参数,还能对提示词进行增强。使用了多种先进技术和工具,在视频和图像生成领域具有广泛应用前景,适合研究人员和开发者使用。
全流程 AI 驱动的数据可视化工具,助力用户轻松创作高颜值图表
爱图表(aitubiao.com)就是AI图表,是由镝数科技推出的一款创新型智能数据可视化平台,专注于为用户提供便捷的图表生成、数据分析和报告撰写服务。爱图表是中国首个在图表场景接入DeepSeek的产品。通过接入前沿的DeepSeek系列AI模型,爱图表结合强大的数据处理能力与智能化功能,致力于帮助职场人士高效处理和表达数据,提升工作效率和报告质量。
一款强大的视觉语言模型,支持图像和视频输入
Qwen2.5-VL 是一款强大的视觉语言模型,支持图像和视频输入,可用于多种场景,如商品特点总结、图像文字识别等。项目提供了 OpenAI API 服务、Web UI 示例等部署方式,还包含了视觉处理工具,有助于开发者快速集成和使用,提升工作效率。
最新AI工具、AI资讯
独家AI资源、AI项目落地
微信扫一扫关注公众号