大型语言模型调查综述
大型语言模型(LLMs)正在人工智能的许多领域取得巨大进展。因此,对LLMs的研究兴趣和进展呈爆炸式增长。现在每天都有数百篇关于LLMs的研究论文在各种会议上发表或发布到开放存取档案中。鉴于LLM相关论文的显著增长,本文汇编了关于LLMs的调查,以提供该领域的全面概述。这些调查大多发表或发布于过去几年,因此这个集合相对较新。我们希望我们的汇编能对想要快速了解该领域的人有所帮助。
大纲
- 综合调查
- Transformer
- 对齐
- 提示学习
- 数据
- 评估
- 社会问题
- 安全性
- 错误信息
- LLMs的属性
- 高效LLMs
- LLMs的学习方法
- 多模态LLMs
- 基于知识的LLMs
- LLMs的扩展
- 长序列LLMs
- LLMs应用
调查列表
综合调查
-
大型语言模型:一项调查, arXiv 2024.02 [论文]
-
AI生成内容(AIGC)的综合调查:从GAN到ChatGPT的生成式AI历史, arXiv 2023.03 [论文]
-
大型语言模型的挑战和应用, arXiv 2023.07 [论文]
-
预训练基础模型的综合调查:从BERT到ChatGPT的历史, arXiv 2023.05 [论文]
-
预训练、提示和预测:自然语言处理中提示方法的系统调查, ACM计算调查 2023.01 [论文]
Transformer
-
Transformer调查, arXiv 2022.10 [论文]
-
高效Transformer:一项调查, arXiv 2022.12 [论文]
-
更快更轻的Transformer实用调查, arXiv 2023.07 [论文]
-
注意力机制、Transformer、BERT和GPT:教程与调查, arXiv 2020.12 [论文]
对齐
-
弥合差距:整合(人类)反馈以进行自然语言生成的调查, arXiv 2023.06 [论文]
-
AI对齐:全面调查, arXiv 2024.02 [论文]
-
大型语言模型对齐:一项调查, arXiv 2023.09 [论文]
-
大型语言模型指令微调调查, arXiv 2023.08 [论文]
提示学习
上下文学习
思维链
-
更好的思维链提示策略:一项调查, arXiv 2023.10 [论文]
提示工程
推理
数据
评估
-
评估大型语言模型能力的初步尝试,arXiv 2023.06 [论文]
社会问题
-
大型语言模型公平性调查,arXiv 2023.08 [论文]
-
作为子群体代表模型的大型语言模型:一项回顾,arXiv 2023.10 [论文]
-
32门大学课程中对话人工智能的感知、表现和可检测性,SCI REP-UK 2023.08 [论文]
-
ChatGPT应该有偏见吗?大型语言模型中偏见的挑战和风险,arXiv 2023.04 [论文]
安全性
来源检测
安全
-
对抗性攻击揭示的大型语言模型漏洞调查,arXiv 2023.10 [论文]
-
大型语言模型(LLM)安全和隐私调查:好的、坏的和丑陋的,arXiv 2023.12 [论文]
-
诱使大型语言模型不服从:形式化、分析和检测越狱,arXiv 2023.05 [论文]
-
通过验证和确认视角看大型语言模型的安全性和可信度调查,arXiv 2023.05 [论文]
虚假信息
幻觉
-
知识图谱能否减少大型语言模型中的幻觉?:一项调查,arXiv 2023.11 [论文]
-
用知识增强大型语言模型:防止幻觉的调查,arXiv 2023.09 [论文]
-
大型语言模型幻觉缓解技术的全面调查,arXiv 2024.01 [论文]
事实性
大型语言模型的属性
-
大型语言模型可解释性调查,arXiv 2023.09 [论文]
-
大型语言模型的神秘与魅力:对涌现能力的解释和分析的全面调查,arXiv 2023.11 [论文]
-
从理解到应用:大型语言模型可解释性调查,arXiv 2024.01 [论文]
-
语言模型置信度估计和校准调查,arXiv 2023.11 [论文]
-
自然语言理解中大型语言模型的捷径学习,COMMUN ACM 2023.12 [论文]
高效大型语言模型
-
大型语言模型推理揭秘:调查与屋顶线模型洞察,arXiv 2024.03 [论文]
-
走向高效生成式大型语言模型服务:从算法到系统的调查,arXiv 2023.12 [论文]
-
大型语言模型压缩调查,arXiv 2023.08 [论文]
-
语言模型压缩算法全面调查,arXiv 2024.01 [论文]
-
预训练语言模型参数高效微调方法:批评性回顾与评估,arXiv 2023.12 [论文]
-
大型语言模型的模型压缩和高效推理:调查,arXiv 2024.02 [论文]
-
大型语言模型硬件加速器调查,arXiv 2024.01 [论文]
大型语言模型学习方法
多模态大型语言模型
-
大型语言模型遇上计算机视觉:简要调查,arXiv 2023.11 [论文]
-
如何弥合模态之间的差距:多模态大型语言模型全面调查,arXiv 2023.11 [论文]
-
多模态大型语言模型调查,arXiv 2023.06 [论文]
-
多模态大型语言模型:调查,arXiv 2023.11 [论文]
基于知识的大型语言模型
检索增强型大型语言模型
知识编辑
-
知识与大型语言模型集成的趋势:方法、基准和应用的调查与分类,arXiv 2023.11 [论文]
-
大型语言模型的知识编辑:调查,arXiv 2023.10 [论文]
-
编辑大型语言模型:问题、方法和机遇,arXiv 2023.05 [论文]
大型语言模型的扩展
带工具的大型语言模型
-
决策基础模型:问题、方法和机遇,arXiv 2023.03 [论文]
-
增强语言模型:调查,arXiv 2023.02 [论文]
-
大型语言模型遇上NL2Code:调查,arXiv 2022.12 [论文]
大型语言模型与交互
-
用于机器人的大型语言模型:调查,arXiv 2023.11 [论文]
-
自动驾驶多模态大型语言模型调查,WACV workshop 2023.11 [论文]
-
大语言模型赋能的基于智能体的建模与仿真:调查与展望,arXiv 2023.12 [论文]
-
与大语言模型角色扮演,arXiv 2023.11 [论文]
长序列大语言模型
大语言模型应用
教育
-
ChatGPT及其他:生成式人工智能在教育领域的革命,arXiv 2023.11 [论文]
-
ChatGPT和大语言模型在学术界:机遇与挑战,arXiv 2023.07 [论文]
-
ChatGPT有益吗?关于大语言模型在教育中的机遇与挑战,arXiv 2023.04 [论文]
法律
医疗保健
-
ChatGPT在医学文献中的优势、劣势、机遇和威胁(SWOT)分析:简要回顾,JMIR 2023.11 [论文]
-
医疗保健中的ChatGPT:分类法和系统综述,《生物医学计算方法与程序》2024.01 [论文]
-
识别改进途径的心理健康会话代理可解释性和安全性综述,NCBI 2023.10 [论文]
-
迈向心理学通用人工智能:大语言模型当前应用及未来前景调查,arXiv 2023.12 [论文]
-
心理健康护理中的大语言模型:范围界定综述,arXiv 2024.01 [论文]
-
ChatGPT作为大语言模型在医疗教育、研究和实践中的效用示例:关于未来前景的系统综述,arXiv 2023.12 [论文]
-
医疗保健中大语言模型(或生成式人工智能)监管监督的必要性,arXiv 2023.07 [论文]
-
临床基础模型的不稳固基础:电子病历大语言模型和基础模型调查,arXiv 2023.03 [论文]
游戏
自然语言处理任务
-
基于大型预训练语言模型的自然语言处理最新进展:一项调查,arXiv 2021.11 [论文]
-
如果大语言模型是巫师,那么代码就是魔杖:代码如何赋能大语言模型成为智能代理的调查,arXiv 2024.01 [论文]
软件工程
-
软件工程中的大语言模型:调查与开放问题,arXiv 2023.10 [论文]
-
软件工程中的大语言模型:系统文献综述,arXiv 2023.08 [论文]
-
使用大语言模型进行软件测试:调查、现状和愿景,arXiv 2023.07 [论文]
推荐系统
-
推荐系统的基础模型:调查与新视角,arXiv 2024.02 [论文]
-
个性化和可解释推荐的大语言模型调查,arXiv 2023.11 [论文]
-
生成式推荐的大语言模型:调查与前瞻性讨论,arXiv 2023.09 [论文]
图
其他
-
金融领域的大型语言模型:调查,ICAIF 2023.11 [论文]
-
数学语言模型:调查,arXiv 2023.12 [论文]
-
人工智能在环境学科的最新应用:综述,SCI TOTAL ENVIRON 2023.10 [论文]
-
在建筑能效和脱碳研究中应用大型语言模型的机遇与挑战:探索性概述,arXiv 2023.12 [论文]
-
当大型语言模型遇上引用:调查,arXiv 2023.09 [论文]
-
大型语言模型时代的文本水印调查,arXiv 2023.12 [论文]
-
GPT的未来:现有ChatGPT研究、当前挑战和可能的未来方向分类,SSRN 2023.04 [论文]
-
ChatGPT相关研究总结及对大型语言模型未来的展望,Meta-Radiology 2023.09 [论文]
致谢
我们要感谢为这个项目做出贡献的人。核心贡献者是
阮俊豪、孟龙、单伟桥、肖桐、朱靖波