项目介绍:GPT4论文助手
项目背景
GPT4论文助手(gpt_paper_assistant)是一个专为科研爱好者设计的工具,它每天自动扫描ArXiv数据库,利用GPT4和作者匹配技术,帮助用户找到感兴趣的论文。用户可以选择将这些信息通过Slack机器人发送,或在一个静态的GitHub Pages网站上查看。这个项目通过GitHub Actions定期运行,确保用户能及时获取到最新的科研动态。
功能特点
- 自动化运行:通过GitHub Actions自动扫描ArXiv的论文,并每天更新至Slack或GitHub Pages。
- 成本效益:根据使用体验,在
cs.CL
领域的运行费用非常低,只需$0.07。 - 定制化配置:用户可以通过配置文件设置感兴趣的论文主题和作者,筛选出最相关的学术内容。
最新更新
- 2月15日,2024年:修复了RSS格式下作者解析的错误,并调整了标题过滤的成本估算,解决了当RSS中没有论文时可能导致的崩溃问题。
- 2月7日,2024年:修复了由于ArXiv改变RSS格式引起的重要问题,增加并启用了标题过滤功能以降低成本。
快速开始
在GitHub Actions上运行
- 将仓库复制或分叉到新的GitHub仓库,并启用定期工作流。
- 根据需要填写和编辑论文主题及作者的配置文件。
- 设置ArXiv类别,并将OpenAI密钥(OAI_KEY)设置为GitHub秘密。
- 配置GitHub Pages生成,运行后每天1点(UTC)定期发布更新。
本地运行
- 本地运行时,与GitHub版本的配置步骤类似,需在本地环境设置密钥并运行主程序
main.py
。 - 如需分析效率或排除运行中问题,建议获取Semantic Scholar API密钥。
配置提示
用户可以通过编辑paper_topics.txt
文件,明确自己的学术兴趣,例如新的机器学习方法、语言模型的性能提升等。这样可帮助GPT更精准识别出用户感兴趣的论文。
工作原理
该项目通过抓取ArXiv的RSS数据获取当天论文,并通过以下流程筛选:
- 作者匹配:使用Semantic Scholar API验证作者身份并进行初步筛选。
- GPT相关性评估:对剩余论文进行相关性和新颖性评估,根据用户配置决定是否保留。
- 结果排序和输出:最后按分数进行排序,输出满足条件的论文至指定终端。
贡献者
本项目的代码和仓库由Tatsunori Hashimoto创建,遵循Apache 2.0协议。感谢Chenglei Si在GPT过滤器的测试和基准建立方面所做的贡献。
无论是充满好奇心的学术新手,还是对科研充满热情的资深研究人员,GPT4论文助手都致力于为您提供简便快捷的学术论文获取途径,让您的学术之旅更高效。