自然语言处理中的因果推断研究资源汇总
该项目汇集了因果推断在自然语言处理领域的研究论文和代码资源。内容包括文本作为处理、中介、结果和混杂因素的应用,以及因果推断改进NLP任务的方法。此外还涵盖了语言学、营销等社会科学的具体案例。这一资源库为研究人员提供了深入了解因果推断在NLP中应用的机会。
关于影响力、因果关系和语言的论文和代码库集合。
欢迎提交拉取请求!
类型 | 描述 | 代码 |
---|---|---|
半模拟 | 给定文本(亚马逊评论),提取处理(0或5星)和混淆因素(产品类型),然后根据提取的处理和混淆因素对结果(销量)进行采样。 | git |
完全合成 | 从二项分布中采样结果、处理和混淆因素,然后根据这些采样变量从均匀分布中采样词语。 | git |
标题 | 描述 | 代码 |
---|---|---|
文本和因果推理:使用文本从因果估计中移除混淆的综述 <br> Katherine A. Keith, David Jensen, 和 Brendan O'Connor | 对使用文本移除混淆的研究进行综述。还强调了文本和因果推理领域中的许多未解决问题。 | |
用于因果推理的文本特征选择 <br> Reid Pryzant 和 Dan Jurafsky | 关于文本作为处理(通过词典操作化)的博客文章 | git |
计量经济学遇上情感分析:方法和应用概述 <br> Andres Algaba, David Ardia, Keven Bluteau, Samuel Borms, 和 Kris Boudt | 综述总结了将替代数据(重点是文本)转化为变量并在计量经济模型中使用的各种方法。包括各种应用。 | git |
标题 | 描述 | 代码 |
---|---|---|
语言属性的因果效应 <br> Reid Pryzant, Dallas Card, Dan Jurafsky, Victor Veitch, Dhanya Sridhar | 开发了一种基于分类器处理的文本因果推断调整程序。证明了偏差的界限 | git |
使用文本分类器进行因果推断的挑战 <br> Zach Wood-Doughty, Ilya Shpitser, Mark Dredze | 研究了使用分类器估计处理标签可能产生的各种错误,提出了解决这些错误的调整方法 | git |
用于可解释社会科学的去混淆词典归纳 <br> Reid Pryzant, Kelly Shen, Dan Jurafsky, Stefan Wager | 研究了以词典或单个词语形式体现的文本效应,提出了估计效应和评估词典的算法 | git |
如何使用文本进行因果推断 <br> Naoki Egami, Christian J. Fong, Justin Grimmer, Margaret E. Roberts, and Brandon M. Stewart | (也涉及文本作为结果)。涵盖了将文本作为处理所需的假设,得出结论应该使用训练/测试集 | |
从文本语料库中发现处理方法 <br> Christian Fong, Justin Grimmer | 提出了一种新的实验设计和统计模型,可以同时在语料库中发现处理方法并估计这些发现的处理方法的因果效应 | |
措辞对消息传播的影响:Twitter上的主题和作者控制的自然实验 <br> Chenhao Tan, Lillian Lee, and Bo Pang | 通过研究包含相同URL且由同一用户撰写但使用不同措辞的推文来控制混淆因素 | |
什么时候词语重要?使用个体处理效应估计来理解词汇选择对受众感知的影响 <br> Zhao Wang and Aron Culotta | 测量词语对读者感知的影响。比较了多种准实验方法 | git |
标题 | 描述 | 代码 |
---|---|---|
调整文本嵌入以进行因果推断 <br> Victor Veitch, Dhanya Sridhar, and David Blei | (也涉及文本作为混淆因素) 通过预测倾向得分和潜在结果,同时进行掩码语言建模目标,调整BERT嵌入以进行因果推断 | tensorflow <br> pytorch |
操作化复杂原因:中介的实用观点 <br> Limor Gultchin, David Watson, Matt Kusner and Ricardo Silva | (也可视为文本作为处理) 开发了一种实用中介的概念,有助于在涉及复杂对象(如文本、图像或基因组学)的各种干预机制下进行因果效应估计。实用中介的识别具有可解释性优势,可以指导新干预措施的开发 | git |
文本作为因果中介:通过语言方面估计社会群体差异处理的因果研究设计 <br> Katherine A. Keith, Douglas Rice, and Brendan O'Connor | 提出了一种用于观察(非实验)数据的因果研究设计,以估计社会群体信号(如种族或性别)对说话者反应的自然直接和间接效应,将语言的不同方面作为因果中介 |
标题 | 描述 | 代码 |
---|---|---|
估计在线辩论中语气的因果效应 <br> Dhanya Sridhar and Lise Getoor | (也涉及文本作为混淆因素)。研究回复语气对在线辩论中后续回应情感的影响 | git |
司法身份如何改变法律裁决的文本 <br> Michael Gill and Andrew Hall | 研究随机分配女性法官或非白人法官如何影响法律裁决的语言 | |
使用深度预训练语言表示测量临床试验结果的语义相似性<br> Anna Koroleva, Sanjay Kamath, Patrick Paroubek |
标题 | 描述 | 代码 |
---|---|---|
CausalNLP:一个实用的文本因果推理工具包 <br> Arun S. Maiya | (也包括将文本作为处理)。描述了一个主要基于元学习 器的文本因果推理工具包。除了使用传统的词袋特征将文本编码为"受控"变量外,还包括Causal Bert的PyTorch实现(最初来自R. Pryzant)。还包括方便的方法,可以轻松地将文本转换为传统的数值或分类变量,以在因果分析中用作处理/混杂/结果变量(例如,情感、主题、情绪等)。 | git |
文本与因果推理:使用文本消除因果估计中混杂因素的综述 <br> Katherine A. Keith, David Jensen, 和 Brendan O'Connor | 对使用文本消除混杂的研究进行综述。还强调了文本和因果推理领域中的众多未解决问题。 | |
通过文本匹配调整混杂因素 <br> Margaret E Roberts, Brandon M Stewart, 和 Richard A Nielsen | 估计文本的低维摘要,并通过匹配这个摘要来消除混杂。提出了一种文本匹配方法,即主题逆回归匹配,该方法同时匹配主题内容和倾向得分。 | |
使用文本数据进行匹配:文档匹配方法和匹配质量测量的实验评估 <br> Reagan Mozer, Luke Miratrix, Aaron Russell Kaufman, L Jason Anastasopoulos | 描述并实证评估了一个文本文档匹配框架,该框架将现有方法分解为:文本表示的选择和距离度量的选择。 | |
学习反事实推理的表示 <br> Fredrik Johansson, Uri Shalit, David Sontag | 他们的一个半合成实验将新闻内容作为混杂因素。 | |
学习反事实推理的表示 <br> Fredrik Johansson, Uri Shalit, David Sontag | 他们的一个半合成实验将新闻内容作为混杂因素。 | |
概念化基于文本的因果推理中的处理泄漏 <br> Adel Daoud, Connor T. Jerzak, 和 Richard Johansson | 描述了在控制基于文本的混杂因素时处理信号泄漏的问题,这可能导致识别和估计问题。对处理泄漏如何导致平均处理效应(ATE)估计问题以及如何通过假设可分离性使用文本预处理来缓解这种偏差进行模拟研究。 |
标题 | 描述 | 代码 |
---|---|---|
迈向可信解释:基于因果合理化 <br> Wenbo Zhang, Tong Wu, Yunlong Wang, Yong Cai, Hengrui Cai | 本文利用因果概率来改进NLP自解释模型。 | git |
CausaLM:通过反事实语言模型进行因果模型解释 <br> Amir Feder, Nadav Oved, Uri Shalit 和 Roi Reichart | 提出了一种通过反事实语言表示生成因果解释的方法。 | git |
用于解释神经NLP的因果中介分析:以性别偏见为例 <br> Jesse Vig, Sebastian Gehrmann, Yonatan Belinkov, Sharon Qian, Daniel Nevo, Yaron Singer 和 Stuart Shieber | 使用因果中介分析来解释NLP模型。 | git |
Causal BERT:用于检测文本中事件间因果关系的语言模型 <br> Vivek Khetan, Roshni Ramnani, Mayuresh Anand, Subhashis Sengupta, Andrew E. Fano | 本文研究了语言模型在仅使用句子上下文、句子上下文结合事件信息以及利用领域内和领域外数据分布的掩蔽事件上下文的情况下,识别自然语言文本中表达的事件之间因果关系的能力。 |
标题 | 描述 | 代码 |
---|---|---|
通过自动生成的反事实案例提高文本分类的鲁棒性 <br> Zhao Wang 和 Aron Culotta | 通过匹配识别因果术语,然后生成反事实案例用于训练。 | git |
识别虚假相关性以实现鲁棒文本分类 <br> Zhao Wang 和 Aron Culotta | 通过匹配识别虚假词特征 | git |
使用对抗域适应发现和控制文本分类中的潜在混淆因素 <br> Virgile Landeiro, Tuan Tran 和 Aron Culotta | 在文本分类中控制未观察到的混淆因素 | |
在混淆偏移下的鲁棒文本分类 <br> Virgile Landeiro 和 Aron Culotta | 在文本分类中控制变化的混淆因素 | git |
通过反事实增强数据学习关键差异 <br> Divyansh Kaushik, Eduard Hovy, Zachary C. Lipton | 引入方法和资源来训练对虚假模式不敏感的模型 | git |
解释反事实增强数据的有效性 <br> Divyansh Kaushik, Amrith Setlur, Eduard Hovy, Zachary C. Lipton | 解释反事实增强数据在训练对虚假模式不敏感的模型方面的有效性 | git |
标题 | 描述 | 代码 |
---|---|---|
使用深度神经网络将适应性与一致性解耦 <br> Andreas Weise, Rivka Levitan | 在建模语音适应性时分离说话者的个人风格。 | |
从情绪日志数据估计运动的因果效应 <br> Dhanya Sridhar, Aaron Springer, Victoria Hollis, Steve Whittaker, Lise Getoor | 混淆因素:情绪触发因素的文本。混淆调整方法:倾向得分匹配 |
标题 | 描述 | 代码 |
---|---|---|
从产品描述的语言预测销量 <br> Reid Pryzant, Young-Joo Chung 和 Dan Jurafsky | 在控制品牌和价格的情况下,找出最能预测销量的产品描述特征。 | git |
用于将广告表现归因于其写作风格的可解释神经网络架构 <br> Reid Pryzant, Kazoo Sone 和 Sugato Basu | 在控制广告主和定位的情况下,找出最能预测高点击率的广告文案特征。 | git |
标题 | 描述 | 代码 |
---|---|---|
通过品格影响:在线讨论中声誉的说服力 <br> Emaad Manzoor, George H. Chen, Dokyun Lee, Michael D. Smith | 在双机器学习框架中使用语言神经模型来控制非结构化论证文本。 | |
标题 | 描述 | 代码 |
---|---|---|
MIMICause:临床笔记中因果关系类型的表示和自动提取 <br> Vivek Khetan, Md Imbesat Rizvi, Jessica Huber, Paige Bartusiak, Bogdan Sacaleanu, Andrew Fano | 该工作提出了注释指南,开发了一个注释语料库,并提供了基线分数,以识别临床笔记中一对生物医学概念之间的因果关系类型和方向;这些关系可能以隐含或显式方式表达,可能在单个句子中或跨多个句子中识别。 |
标题 | 描述 | 代码 |
---|---|---|
社交媒体中社会支持的语言及其对自杀意念风险的影响 <br> Munmun De Choudhury 和 Emre Kiciman | 混杂因素:先前在 Reddit 论坛上发布的文本。混杂因素调整方法:分层倾向得分匹配。 | |
从社交媒体的心理健康内容中发现自杀意念的转变 <br> Munmun De Choudhury, Emre Kiciman, Mark Dredze, Glen Coppersmith, Mrinal Kumar | 混杂因素:用户之前的帖子和收到的评论。混杂因素调整方法:分层倾向得分匹配 |
标题 | 描述 | 代码 |
---|---|---|
通过强调美味和愉悦的属性来增加蔬菜摄入量:以味道为重点的标签多站点随机对照干预研究 <br> Bradley Turnwald, Jaclyn Bertoldo, Margaret Perry, Peggy Policastro, Maureen Timmons, Christopher Bosso, Priscilla Connors, Robert Valgenti, Lindsey Pine, Ghislaine Challamel, Christopher Gardner, Alia Crum | 对自助餐厅食品标签进行随机对照试验,观察这些标签对学生选取食物量的影响。 | |
精神病药物使用效果的社交媒体研究 <br> Koustuv Saha, Benjamin Sugar, John Torous, Bruno Abrahao, Emre Kıcıman, Munmun De Choudhury | 混杂因素:用户在 Twitter 上的先前帖子。混杂因素调整方法:分层倾向得分匹配。 |
标题 | 描述 | 代码 |
---|---|---|
一种深度因果推断方法,用于测量在线非营利小额信贷平台中组建群体贷款的效果 <br> Thai T Pham 和 Yuanyuan Shen | 混杂因素:Kiva 上的小额贷款描述。混杂因素调整方法:对嵌入向量应用 A-IPTW 和 TMLE。 |
标题 | 描述 | 代码 |
---|---|---|
隐含性别偏见的无监督发现 | 使用倾向得分匹配和对抗性学习,使模 型专注于偏见而非其他特征。 | |
推文对被推者的治疗效果:通过实验减少种族主义骚扰 <br> Kevin Munger | 进行随机对照试验,向种族主义 Twitter 用户发送缓解消息,改变"发送者"用户并观察对后续行为的影响。 |
标题 | 描述 | 代码 |
---|---|---|
估计锻炼对用户在线行为的影响 <br> Seyed Amin Mirlohi Falavarjani, Hawre Hosseini, Zeinab Noorian, Ebrahim Bagheri | 混杂因素:干预前主题兴趣变化。混杂调整方法:基于主题模型的匹配。 | |
提炼个人经历的结果:社交媒体的倾向得分分析 <br> Alexandra Olteanu, Onur Varol, Emre Kiciman | 混杂因素:Twitter上过去的用词。混杂调整方法:分层倾向得分匹配。 | |
使用纵向社交媒体分析理解早期大学饮酒行为的影响 <br> Emre Kiciman, Scott Counts, Melissa Gasser | 混杂因素:Twitter上的先前帖子。混杂调整方法:分层倾向得分匹配。 | |
使用匹配样本从Twitter估计锻炼对心理健康的影响 <br> Virgile Landeiro and Aron Culotta | 混杂因素:性别、位置、个人资料。混杂调整方法:匹配。 | git |
从2017年至2021年患者报告的糖尿病相关推文中提取显式和隐式因果关系:深度学习方法 <br> Adrian Ahne, Vivek Khetan, Xavier Tanner, Md Imbessat Hasan Rizvi, Thomas Czernichow, Francisco Orchard , Charline Bour, Andrew Fano, Guy Fagherazzi | 手动标注了一个因果数据集,并使用主动学习进行扩充。首先,通过微调BERTweet模型检测包含因果信息的句子(因果句)。其次,使用多个模型在因果句中识别因果对。最后,在半监督方法中,将因果对聚合形成因果网络,并在D3中可视化。 |
标题 | 描述 | 代码 |
---|---|---|
万物皆有因:在法律文本分析中利用因果推断 <br> Xiao Liu, Da Yin, Yansong Feng, Yuting Wu, Dongyan Zhao | 从法律描述自动构建因果图,并利用构建的图表消除类似指控的歧义。处理与混杂因素:来自法律描述的因素。 | git |
标题 | 描述 | 代码 |
---|---|---|
通过因果视角对在线仇恨言论的调查 <br> Antigoni M. Founta, Lucia Specia | 对测量在线仇恨言论相关因果效应的研究进行调查。该调查还强调了潜在的知识空白和问题,并提供了如何进一步扩展仇恨言论因果视角的建议。 | |
具有因果解释的稳健网络欺凌检测 <br> Lu Cheng, Ruocheng Guo, Huan Liu | 提出一个原则性框架,识别并阻止潜在隐藏混杂因素 对网络欺凌检测的影响。 | |
在线大学社区中仇恨言论的普遍性及其心理影响 <br> Koustuv Saha, Eshwar Chandrasekharan, Munmun De Choudhury | 测量在Reddit社区中接触仇恨言论对压力水平增加的心理影响。混杂因素:子版块和用户活动。混杂调整方法:倾向得分匹配。 |
标题 | 描述 | 代码 |
---|---|---|
用于因果效应估计的图干预网络 <br> Jean Kaddour, Qi Liu, Yuchen Zhu, Matt J. Kusner, Ricardo Silva | 将Robinson分解(如在R-learner或广义随机森林中使用)推广到向量化处理(如文本、图像、图)。 | git |
AI Excel全自动制表工具
AEE 在线 AI 全自动 Excel 编辑器,提供智能录入、自动公式、数据整理、图表生成等功能,高效处理 Excel 任务,提升办公效率。支持自动高亮数据、批量计算、不规则数据录入,适用于企业、教育、金融等多场景。
基于 UI-TARS 视觉语言模型的桌面应用,可通过自然语言控制计算机进行多模态操作。
UI-TARS-desktop 是一款功能强大的桌面 应用,基于 UI-TARS(视觉语言模型)构建。它具备自然语言控制、截图与视觉识别、精确的鼠标键盘控制等功能,支持跨平台使用(Windows/MacOS),能提供实时反馈和状态显示,且数据完全本地处理,保障隐私安全。该应用集成了多种大语言模型和搜索方式,还可进行文件系统操作。适用于需要智能交互和自动化任务的场景,如信息检索、文件管理等。其提供了详细的文档,包括快速启动、部署、贡献指南和 SDK 使用说明等,方便开发者使用和扩展。
开源且先进的大规模视频生成模型项目
Wan2.1 是一个开源且先进的大规模视频生成模型项目,支持文本到图像、文本到视频、图像到视频等多种生成任务。它具备丰富的配置选项,可调整分辨率、扩散步数等参数,还能对提示词进行增强。使用了多种先进技术 和工具,在视频和图像生成领域具有广泛应用前景,适合研究人员和开发者使用。
全流程 AI 驱动的数据可视化工具,助力用户轻松创作高颜值图表
爱图表(aitubiao.com)就是AI图表,是由镝数科技推出的一款创新型智能数据可视化平台,专注于为用户提供便捷的图表生成、数据分析和报告撰写服务。爱图表是中国首个在图表场景接入DeepSeek的产品。通过接入前沿的DeepSeek系列AI模型,爱图表结合强大的数据处理能力与智能化功能,致力于帮助职场人士高效处理和表达数据,提升工作效率和报告质量。
一款强大的视觉语言模型,支持图像和视频输入
Qwen2.5-VL 是一款强大的视觉语言模型,支持图像和视频输入,可用于多种场景,如商品特点总结、图像文字识别等。项目提供了 OpenAI API 服务、Web UI 示例等部署方式,还包含了视觉处理工具,有助于开发者快速集成和使用,提升工作效率。
HunyuanVideo 是一个可基于文本生成高质量图像和视频的项目。
HunyuanVideo 是一个专注于文本到图像及视频生成的项目。它具备强大的视频生成能力,支持多种分辨率和视频长度选择,能根据用户输入的文本生成逼真的图像和视频。使用先进的技术架构和算法,可灵活调整生成参数,满足不同场景的需求,是文本生成图像视频领域的优质工具。
一个基于 Gradio 构建的 WebUI,支持与浏览器智能体进行便捷交互。
WebUI for Browser Use 是一个强大的项 目,它集成了多种大型语言模型,支持自定义浏览器使用,具备持久化浏览器会话等功能。用户可以通过简洁友好的界面轻松控制浏览器智能体完成各类任务,无论是数据提取、网页导航还是表单填写等操作都能高效实现,有利于提高工作效率和获取信息的便捷性。该项目适合开发者、研究人员以及需要自动化浏览器操作的人群使用,在 SEO 优化方面,其关键词涵盖浏览器使用、WebUI、大型语言模型集成等,有助于提高网页在搜索引擎中的曝光度。
基于 ESP32 的小智 AI 开发项目,支持多种网络连接与协议,实现语音交互等功能。
xiaozhi-esp32 是一个极具创新性的基于 ESP32 的开发项目,专注于人工智能语音交互领域。项目涵盖了丰富的功能,如网络连接、OTA 升级、设备激活等,同时支持多 种语言。无论是开发爱好者还是专业开发者,都能借助该项目快速搭建起高效的 AI 语音交互系统,为智能设备开发提供强大助力。
一个用于 OCR 的项目,支持多种模型和服务器进行 PDF 到 Markdown 的转换,并提供测试和报告功能。
olmocr 是一个专注于光学字符识别(OCR)的 Python 项目,由 Allen Institute for Artificial Intelligence 开发。它支持多种模型和服务器,如 vllm、sglang、OpenAI 等,可将 PDF 文件的页面转换为 Markdown 格式。项目还提供了测试框架和 HTML 报告生成功能,方便用户对 OCR 结果进行评估和分析。适用于科研、文档处理等领域,有助于提高工作效率和准确性。
飞书多维表格 ×DeepSeek R1 满血版
飞书多维表格联合 DeepSeek R1 模型,提供 AI 自动化解决方案,支持批量写作、数据分析、跨模态处理等功能,适用于电商、短视频、影视创作等场景,提升企业生产力与创作效率。关键词:飞书多维表格、DeepSeek R1、AI 自动化、批量处理、企业协同工具。
最新AI工具、AI资讯
独家AI资源、AI项目落地
微信扫一扫关注公众号