LLM4IR-Survey

LLM4IR-Survey

大语言模型在信息检索领域的应用研究综述

LLM4IR-Survey项目汇集了大语言模型在信息检索领域应用的相关研究论文。项目涵盖查询重写、检索、重排序、阅读理解和搜索代理等方向，全面展示大语言模型在信息检索各环节的应用。该资源持续更新，反映最新研究进展和创新应用，为该领域的研究人员和从业者提供重要参考。

LLM信息检索查询重写检索器重排序Github开源项目

LLM4IR调研

这是与信息检索领域大型语言模型相关的论文集。这些论文根据我们的调研论文《大型语言模型在信息检索中的应用：一项调研》进行组织。

如果您发现任何错误或有任何建议，欢迎与我们联系。邮箱：yutaozhu94@gmail.com 和 dou@ruc.edu.cn。

🌟 引用

如果本文对您的研究有所帮助，请kindly引用我们的论文：

@article{LLM4IRSurvey,
    author={Yutao Zhu and
            Huaying Yuan and
            Shuting Wang and
            Jiongnan Liu and
            Wenhan Liu and
            Chenlong Deng and
            Haonan Chen and
            Zhicheng Dou and
            Ji-Rong Wen},
    title={Large Language Models for Information Retrieval: A Survey},
    journal={CoRR},
    volume={abs/2308.07107},
    year={2023},
    url={https://arxiv.org/abs/2308.07107},
    eprinttype={arXiv},
    eprint={2308.07107}
}

🚀 更新日志

版本2 [2024-01-19]
- 我们添加了一个新的章节介绍搜索代理，这代表了将LLM与IR系统集成的创新方法。
- 重写器：我们增加了最近关于基于LLM的查询重写的工作，其中大多数集中在对话式搜索上。
- 检索器：我们添加了利用LLM扩展检索器训练语料库或增强检索器架构的最新技术。
- 重排器：我们在三个部分分别增加了最新的基于LLM的排序工作：将LLM作为监督重排器、将LLM作为无监督重排器，以及利用LLM进行训练数据增强。
- 阅读器：我们添加了LLM增强阅读器领域的最新研究，包括介绍参考压缩技术的章节、讨论LLM增强阅读器应用的章节，以及分析LLM增强阅读器特征的章节。
- 未来方向：我们添加了关于搜索代理的章节和讨论将LLM引入IR系统可能造成偏见的章节。

📋 目录

📄 论文列表

查询重写器

提示方法

Query2doc：使用大型语言模型进行查询扩展，Wang等人，arXiv 2023。 [论文]
用于稀疏、密集和学习型稀疏检索的生成式和伪相关反馈，Mackie等人，arXiv 2023。 [论文]
使用大型语言模型的生成式相关反馈，Mackie等人，SIGIR 2023（短文）。 [论文]
GRM：使用相关性感知样本估计的生成式相关性建模用于文档检索，Mackie等人，arXiv 2023。 [论文]
大型语言模型了解您的上下文搜索意图：对话式搜索的提示框架，Mao等人，arXiv 2023。 [论文]
无需相关性标签的精确零样本密集检索，Gao等人，ACL 2023。 [论文]
通过提示大型语言模型进行查询扩展，Jagerman等人，arXiv 2023。 [论文]
大型语言模型是强大的零样本检索器，Shen等人，arXiv 2023。 [论文]
增强对话式搜索：大型语言模型辅助的信息化查询重写，Ye等人，EMNLP 2023（Findings）。 [论文]
生成式大语言模型能否为测试集创建查询变体？一项探索性研究，M. Alaofi等人，SIGIR 2023（短文）。 [论文]
基于语料库指导的大型语言模型查询扩展，Lei等人，EACL 2024（短文）。 [论文]
PromptReps：提示大型语言模型生成密集和稀疏表示用于零样本文档检索，Zhuang等人，arXiv 2024。 [论文]

微调方法

QUILL：使用检索增强和多阶段蒸馏的大型语言模型查询意图，Srinivasan等人，EMNLP 2022（工业界）。 [论文]（该论文在基线实验中探索了微调方法。）

知识蒸馏方法

QUILL：使用检索增强和多阶段蒸馏的大型语言模型查询意图，Srinivasan等人，EMNLP 2022（工业界）。 [论文]
通过搜索引擎和大型语言模型交互进行知识精炼，Feng等人，arXiv 2023。 [论文]
用于检索增强大型语言模型的查询重写，Ma等人，arXiv 2023。 [论文]

检索器

利用大语言模型生成搜索数据

InPars：使用大语言模型进行信息检索的数据增强, Bonifacio等人, arXiv 2022. [论文]
基于大语言模型文档扩展的密集段落检索预训练, 马等人, arXiv 2023. [论文]
InPars-v2：大语言模型作为信息检索的高效数据集生成器, Jeronymo等人, arXiv 2023. [论文]
Promptagator：基于8个示例的少样本密集检索, 戴等人, ICLR 2023. [论文]
AugTriever：通过可扩展数据增强的无监督密集检索, 孟等人, arXiv 2023. [论文]
UDAPDR：通过大语言模型提示和重排器蒸馏的无监督领域适应, Saad-Falco等人, arXiv 2023. [论文]
软提示微调：利用大语言模型增强密集检索, 彭等人, arXiv 2023. [论文]
CONVERSER：基于合成数据生成的少样本对话密集检索, 黄等人, ACL 2023. [论文]
利用大语言模型为多语言密集检索合成多语言训练数据, Thakur等人, arXiv 2023. [论文]
问题即所需：训练密集段落检索器, Sachan等人, ACL 2023. [论文]
超越事实性：大语言模型作为知识生成器的全面评估, 陈等人, EMNLP 2023. [论文]

运用大语言模型改进模型架构

通过对比预训练的文本和代码嵌入, Neelakantan等人, arXiv 2022. [论文]
微调LLaMA用于多阶段文本检索, 马等人, arXiv 2023. [论文]
大型双编码器是通用检索器, 倪等人, EMNLP 2022. [论文]
基于指令的任务感知检索, 浅井等人, ACL 2023 (Findings). [论文]
Transformer记忆作为可微分搜索索引, Tay等人, NeurIPS 2022. [论文]
大语言模型是内置的自回归搜索引擎, Ziems等人, ACL 2023 (Findings). [论文]

重排器

将大语言模型用作有监督重排序器

使用BERT进行多阶段文档排序，Nogueira等人，arXiv 2019。[论文]
使用预训练序列到序列模型进行文档排序，Nogueira等人，EMNLP 2020（发现）。[论文]
用于段落重排序的文本到文本多视图学习，Ju等人，SIGIR 2021（短文）。[论文]
使用预训练序列到序列模型进行文本排序的Expando-Mono-Duo设计模式，Pradeep等人，arXiv 2021。[论文]
RankT5：使用排序损失微调T5进行文本排序，Zhuang等人，SIGIR 2023（短文）。[论文]
微调LLaMA用于多阶段文本检索，Ma等人，arXiv 2023。[论文]
大语言模型用于文本排序的两阶段适应，Zhang等人，ACL 2024（发现）。[论文]
不依赖GPT的排序：基于开源大语言模型构建列表式重排序器，Zhang等人，arXiv 2023。[论文]

将大语言模型用作无监督重排序器

语言模型的整体评估，Liang等人，arXiv 2022。[论文]
使用零样本问题生成改进段落检索，Sachan等人，EMNLP 2022。[论文]
通过约束生成进行离散提示优化用于零样本重排序器，Cho等人，ACL 2023（发现）。[论文]
开源大语言模型是强大的零样本查询似然模型用于文档排序，Zhuang等人，EMNLP 2023（发现）。[论文]
PaRaDe：使用大语言模型的示例进行段落排序，Drozdov等人，EMNLP 2023（发现）。[论文]
超越是与否：通过评分细粒度相关性标签改进零样本大语言模型排序器，Zhuang等人，arXiv 2023。[论文]
ChatGPT擅长搜索吗？调查大语言模型作为重排序代理，Sun等人，EMNLP 2023。[论文]
使用大语言模型进行零样本列表式文档重排序，Ma等人，arXiv 2023。[论文]
在中间找到：排列自洽性改进大语言模型的列表式排序，Tang等人，arXiv 2023。[论文]
大语言模型通过成对排序提示成为有效的文本排序器，Qin等人，NAACL 2024（发现）。[论文]
一种用于大语言模型的有效且高效的零样本排序集合方法，Zhuang等人，SIGIR 2024。[论文]
InstUPR：基于指令的大语言模型无监督段落重排序，Huang和Chen，arXiv 2024。[论文]

利用大型语言模型进行训练数据增强

ExaRanker：基于解释增强的神经排序器，Ferraretto 等人，SIGIR 2023（短论文）。[论文]
InPars-Light：高效排序器的低成本无监督训练，Boytsov 等人，arXiv 2023。[论文]
为交叉编码器重排序生成合成文档，Askari 等人，arXiv 2023。[论文]
指令蒸馏使大型语言模型成为高效的零样本排序器，Sun 等人，arXiv 2023。[论文]
RankVicuna：使用开源大型语言模型进行零样本列表式文档重排序，Pradeep 等人，arXiv 2023。[论文]
RankZephyr：高效且鲁棒的零样本列表式重排序轻而易举！，Pradeep 等人，arXiv 2023。[论文]

读者

被动读者

REALM：检索增强语言模型预训练，Guu等人，ICML 2020. [论文]
检索增强生成用于知识密集型自然语言处理任务，Lewis等人，NeurIPS 2020. [论文]
REPLUG：检索增强黑盒语言模型，Shi等人，arXiv 2023. [论文]
Atlas：基于检索增强语言模型的少样本学习，Izacard等人，JMLR 2023. [论文]
通过少样本提示的互联网增强语言模型用于开放域问答，Lazaridou等人，arXiv 2022. [论文]
利用检索重新思考：忠实的大型语言模型推理，He等人，arXiv 2023. [论文]
FreshLLMs：通过搜索引擎增强刷新大型语言模型，Vu等人，arxiv 2023. [论文]
使大型语言模型能够生成带引用的文本，Gao等人，EMNLP 2023. [论文]
Chain-of-Note：增强检索增强语言模型的稳健性，Yu等人，arxiv 2023. [论文]
通过数据重要性学习改进检索增强大型语言模型，Lyu等人，arXiv 2023. [论文]
搜索增强指令学习，Luo等人，EMNLP 2023 (Findings). [论文]
RADIT：检索增强双重指令调优，Lin等人，arXiv 2023. [论文]
通过从万亿个标记中检索来改进语言模型，Borgeaud等人，ICML 2022. [论文]
上下文内检索增强语言模型，Ram等人，arXiv 2023. [论文]
交织检索与思维链推理以解决知识密集型多步骤问题，Trivedi等人，ACL 2023. [论文]
通过即插即用检索反馈改进语言模型，Yu等人，arXiv 2023. [论文]
通过迭代检索-生成协同增强检索增强大型语言模型，Shao等人，EMNLP 2023 (Findings). [论文]
检索-生成协同增强大型语言模型，Feng等人，arXiv 2023. [论文]
Self-RAG：通过自我反思学习检索、生成和评判，Asai等人，arXiv 2023. [论文]
主动检索增强生成，Jiang等人，EMNLP 2023. [论文]

主动读者

测量并缩小语言模型的组合性差距，Press等人，arXiv 2022. [论文]
展示-搜索-预测：组合检索和语言模型用于知识密集型自然语言处理，Khattab等人，arXiv 2022. [论文]
通过多条思维链的元推理回答问题，Yoran等人，arXiv 2023. [论文]

压缩器

LeanContext：利用LLMs进行高效的特定领域问答，Arefeen等人，arXiv 2023。[论文]
RECOMP：通过压缩和选择性增强改进检索增强型语言模型，Xu等人，arXiv 2023。[论文]
TCRA-LLM：用于降低推理成本的令牌压缩检索增强大型语言模型，Liu等人，EMNLP 2023（研究发现）。[论文]
学习过滤检索增强生成的上下文，Wang等人，arXiv 2023。[论文]

分析

迷失在中间：语言模型如何使用长上下文，Liu等人，arXiv 2023。[论文]
通过检索增强调查大型语言模型的事实知识边界，Ren等人，arXiv 2023。[论文]
探索检索器与大型语言模型的集成策略，Liu等人，arXiv 2023。[论文]
刻画检索增强型大型语言模型的归因和流畅性权衡，Aksitov等人，arXiv 2023。[论文]
何时不信任语言模型：调查参数化和非参数化记忆的有效性，Mallen等人，ACL 2023。[论文]

应用

用医学教科书增强黑盒LLMs进行临床问答，Wang等人，arXiv 2023。[论文]
ATLANTIC：用于跨学科科学的结构感知检索增强语言模型，Munikoti等人，arXiv 2023。[论文]
针对孟加拉语的跨语言检索增强情境学习，Li等人，arXiv 2023。[论文]
Clinfo.ai：一个使用科学文献回答医学问题的开源检索增强大型语言模型系统，Lozano等人，arXiv 2023。[论文]
通过检索增强大型语言模型提升金融情感分析，Zhang等人，ICAIF 2023。[论文]
使用检索增强大型语言模型进行可解释的长篇法律问答，Louis等人，arXiv 2023。[论文]
RETA-LLM：一个检索增强大型语言模型工具包，Liu等人，arXiv 2023。[论文]
变色龙：用于检索增强语言模型的异构和分解加速器系统，Jiang等人，arXiv 2023。[论文]
RaLLe：开发和评估检索增强大型语言模型的框架，Hoshi等人，EMNLP 2023。[论文]
不要忘记私有检索：大型语言模型的分布式私有相似性搜索，Zyskind等人，arXiv 2023。[论文]

搜索智能体

静态智能体

LaMDA：用于对话应用的语言模型，Thoppilan 等，arXiv 2022。[论文]
寻求知识的语言模型：用于对话和提示补全的模块化搜索和生成，Shuster 等，EMNLP 2022（Findings）。[论文]
教导语言模型使用经验证引用支持回答，Menick 等，arXiv 2022。[论文]
WebGLM：面向基于人类偏好的高效网络增强问答系统，Liu 等，KDD 2023。[论文]
具备规划、长上下文理解和程序合成能力的真实世界网络智能体，Gur 等，arXiv 2023。[论文]
知道去向何方：使大语言模型成为相关、负责任且值得信赖的搜索者，Shi 等，arXiv 2023。[论文]

动态智能体

WebGPT：基于人类反馈的浏览器辅助问答，Nakano 等，arXiv 2021。[论文]
WebShop：面向可扩展真实网络交互的基于语言智能体，Yao 等，arXiv 2022。[论文]
WebCPM：面向中文长文本问答的交互式网络搜索，Qin 等，ACL 2023。[论文]
Mind2Web：面向网络的通用智能体，Deng 等，arXiv 2023。[论文]
WebArena：用于构建自主智能体的真实网络环境，Zhou 等，arXiv 2023。[论文]
分层提示辅助大语言模型进行网络导航，Sridhar 等，EMNLP 2023（Findings）。[论文]

其他资源

ACL 2023 教程：基于检索的语言模型及其应用，Asai 等，ACL 2023。[链接]
大型语言模型综述，Zhao 等，arXiv 2023。[论文]
信息检索遇上大语言模型：来自中国信息检索界的战略报告，Ai 等，arXiv 2023。[论文]

编辑推荐精选

讯飞智文

讯飞智文

一键生成PPT和Word，让学习生活更轻松

讯飞智文是一个利用 AI 技术的项目，能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定，还是学生群体的职业生涯规划、实习避坑指南，亦或是活动策划、旅游攻略等内容，它都能提供支持，帮助用户精准表达，轻松呈现各种信息。

AI办公办公工具AI工具讯飞智文AI在线生成PPTAI撰写助手多语种文档生成AI自动配图热门

讯飞星火

讯飞星火

深度推理能力全新升级，全面对标OpenAI o1

科大讯飞的星火大模型，支持语言理解、知识问答和文本创作等多功能，适用于多种文件和业务场景，提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台，涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能，能为不同需求的用户提供便捷高效的帮助，助力用户轻松获取信息、解决问题，满足多样化使用场景。

热门AI开发模型训练AI工具讯飞星火大模型智能问答内容创作多语种支持智慧生活

Spark-TTS

Spark-TTS

一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型

Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目，由多个知名机构联合参与。该项目提供了高效的 LLM（大语言模型）驱动的语音合成方案，支持语音克隆和语音创建功能，可通过命令行界面（CLI）和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数，生成高质量的语音。该项目适用于多种场景，如有声读物制作、智能语音助手开发等。

Trae

Trae

字节跳动发布的AI编程神器IDE

Trae是一种自适应的集成开发环境（IDE），通过自动化和多元协作改变开发流程。利用Trae，团队能够更快速、精确地编写和部署代码，从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能，是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门

咔片PPT

咔片PPT

AI助力，做PPT更简单！

咔片是一款轻量化在线演示设计工具，借助 AI 技术，实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT，提供海量模板、智能美化、素材替换等功能，适用于销售、教师、学生等各类人群，能高效制作出高品质 PPT，满足不同场景演示需求。

讯飞绘文

讯飞绘文

选题、配图、成文，一站式创作，让内容运营更高效

讯飞绘文，一个AI集成平台，支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容，加速品牌传播，提升内容营销效果。

热门AI辅助写作AI工具讯飞绘文内容运营AI创作个性化文章多平台分发AI助手

材料星

材料星

专业的AI公文写作平台，公文写作神器

AI 材料星，专业的 AI 公文写作辅助平台，为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能，支持 30 + 文稿类型生成，助力快速完成领导讲话、工作总结、述职报告等材料，提升办公效率，是体制打工人的得力写作神器。

openai-agents-python

openai-agents-python

OpenAI Agents SDK，助力开发者便捷使用 OpenAI 相关功能。

openai-agents-python 是 OpenAI 推出的一款强大 Python SDK，它为开发者提供了与 OpenAI 模型交互的高效工具，支持工具调用、结果处理、追踪等功能，涵盖多种应用场景，如研究助手、财务研究等，能显著提升开发效率，让开发者更轻松地利用 OpenAI 的技术优势。

Hunyuan3D-2

Hunyuan3D-2

高分辨率纹理 3D 资产生成

Hunyuan3D-2 是腾讯开发的用于 3D 资产生成的强大工具，支持从文本描述、单张图片或多视角图片生成 3D 模型，具备快速形状生成能力，可生成带纹理的高质量 3D 模型，适用于多个领域，为 3D 创作提供了高效解决方案。

3FS

3FS

一个具备存储、管理和客户端操作等多种功能的分布式文件系统相关项目。

3FS 是一个功能强大的分布式文件系统项目，涵盖了存储引擎、元数据管理、客户端工具等多个模块。它支持多种文件操作，如创建文件和目录、设置布局等，同时具备高效的事件循环、节点选择和协程池管理等特性。适用于需要大规模数据存储和管理的场景，能够提高系统的性能和可靠性，是分布式存储领域的优质解决方案。

下拉加载更多

探索AI的无限可能

访问

AI工具导航精选AI信息

推荐工具精选

Trae

Trae

字节跳动发布的AI编程神器IDE

豆包

字节跳动旗下 AI 智能助手

讯飞文书

讯飞文书

提升文书撰写效率，满足高频需求

讯飞绘文

讯飞绘文

选题、配图、成文，一站式创作，让内容运营更高效

讯飞绘镜

讯飞绘镜

描述即创作，短视频轻松生成

阿里绘蛙

阿里绘蛙

AI驱动的电商营销工具，一键生成商拍图和种草文案

咔片PPT

咔片PPT

AI助力，做PPT更简单！

AI云服务特惠

懂AI专属折扣

关注微信公众号

最新AI工具、AI资讯
独家AI资源、AI项目落地

微信公众号二维码

微信扫一扫关注公众号

使用协议隐私政策广告服务

投诉举报邮箱: service@vectorlightyear.com

@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号