SimBiber:一个使用官方信息简化bibtex的工具
动机
由于页面限制,我们经常需要将包含大量信息的官方bib简化为仅保留必要信息(如作者、标题、会议/期刊名称等)的简短版本。
我们推出了__SimBiber__,这是一个用Python编写的简单工具,可以自动简化这些信息。希望它能对您有所帮助。
我们还强烈推荐另一个出色的工具Rebiber,它是一个用官方信息规范化bibtex的工具。
提示:如果您先使用Rebiber,然后再使用Simbiber,您将获得更好的体验。
免责声明
SimBiber是一个相对较新的项目,正在积极开发中。 我们希望它在各种情况下都能发挥作用,但不能保证它产生的结果一定严格符合官方规范。
因此,您最好再次检查简化后的bib文件的准确性。
所有图标均从互联网收集,如有侵权,请联系我们删除。
更新日志
- 2023.02.33
- 修复了一些与"-keep"参数相关的错误。
- 2021.05.02
- 修复了一些不使用"-keep"参数时的错误。
- 2021.05.01
- 支持自定义要保留的键。
- 2021.04.23
-
支持IJCAI(调查轨道)。
-
统一README。
-
- 2021.04.11
-
支持pip安装。
-
简化输入参数。
-
添加免责声明。
-
- 2021.03.02
修复删除重复项时的一些错误。
- 2021.02.15
修复将ACL(如EACL)会议简化为ACL的错误。-
支持ACL Findings和EMNLP findings。
- 2021.01.21
-
支持删除重复项,如果你的参考文献中有相同标题的条目。(自动选择会议引用)
修复一些关于某些会议的错误。-
增加更多会议类别。(现在支持113个会议)
-
- 2021.01.11
修复输出路径与输入路径相同时的错误。支持删除重复项,如果你的参考文献同时包含arXiv和会议引用。-
支持按文件夹简化文件。
-
支持使用默认输出路径。
增加更多会议类别。(现在支持112个会议)
- 2021.01.08
我们修复了booktitle包含"{"或"}"时的错误,并增加了更多会议类别。(现在支持105个会议) - 2021.01.06
我们修复了一些小错误,并增加了更多会议类别。(现在支持84个会议) - 2021.12.31
我们构建并发布了第一个版本。
安装
git clone https://github.com/MLNLP-World/Simbiber.git
cd Simbiber/
pip install -e .
或者
pip install simbiber
如果你想使用最新的GitHub版本,其中包含更多错误修复,请使用第一种安装方法。
最后,如果你不带任何参数运行"simbiber",得到以下结果,则安装成功!
使用方法(v0.8.1)
simbiber -i [输入bib路径] -o [输出bib路径]
提示:所有路径参数都支持绝对路径和相对路径
简化参数 | 完整参数 | 用途 |
---|---|---|
-i | --input_path | 要简化的输入bib 文件 或目录 的路径。 |
-o | --output_path | [可选] 要保存的输出bib文件的路径。 请注意:
|
-c | --config_path | [可选]映射配置文件的路径。路径可以是文件目录路径,如config ,或单个文件路径,如config.json 。请注意: 如果要简化大型bib文件,最好提取外部 json 配置文件以获得满意的速度。 |
-a | --if_append_output | [可选] 是否将简化后的数据追加到输出bib文件。 |
-r | --remove_duplicate | [可选] 如果您的bib同时包含arXiv和会议引用,是否删除重复项。 请注意: 如果设为 True ,可能需要更多时间来写入简化后的bib文件。请耐心等待。 |
-cch | --cache_num | [可选]一次想要简化的bib条目数量。 请注意: 如果要简化大型bib文件,最好调整此参数以获得满意的速度。 |
-m | --merge | [可选]如果input_path 是文件夹,您想合并该文件夹中所有bib文件的键。 |
-s | --enable_simplify | [可选]是否启用简化 |
-keep | --keep_keys | [可选]您想在每个bib条目中保留的键。 完整形式类似于 -keep "pages,doi" 。注意:如果出现无法识别的参数错误,最好使用--keep_keys |
输入和输出示例
使用官方信息的简化输出条目示例(支持xxx="..."
或xxx={...}
形式的bibitem):
@inproceedings{li-etal-2019-survey,
title = "A Sophisticated Survey about Chinese Poem and Beers",
author = "Li, Bai and
Ha, Pi and
Jin, Shibai and
Xue, Hua and
Mao, Tai",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP)",
month = nov,
year = "2019",
address = "Hong Kong, China",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/D19-1214",
doi = "10.18653/v1/D19-1214",
pages = "2078--2087",
abstract = "意图检测和槽填充是构建口语理解(SLU)系统的两个主要任务。这两个任务紧密相连,槽通常高度依赖于意图。在本文中,我们提出了一种新颖的SLU框架,以更好地融入意图信息,从而进一步指导槽填充。在我们的框架中,我们采用了带有Stack-Propagation的联合模型,可以直接使用意图信息作为槽填充的输入,从而捕获意图语义知识。此外,为了进一步减轻错误传播,我们对Stack-Propagation框架执行了词级别的意图检测。在两个公开数据集上的实验表明,我们的模型达到了最先进的性能,并且大幅超越了之前的其他方法。最后,我们在我们的框架中使用了双向Transformer编码器表示(BERT)模型,这进一步提升了我们在SLU任务中的性能。",
}
使用官方信息的简化输出条目示例:
@inproceedings{li-etal-2019-survey,
author = {Li, Bai and
Ha, Pi and
Jin, Shibai and
Xue, Hua and
Mao, Tai},
booktitle = {Proc. of EMNLP},
title = {A Sophisticated Survey about Chinese Poem and Beers},
year = {2019}
}
支持的会议
config
目录包含一系列转换后的json文件,用于官方全名和简化名称之间的映射。
AI
全名 | 简称 |
---|---|
人工智能促进协会 | AAAI |
国际自主代理与多代理系统联合会议 | AAMAS |
ACM国际多媒体会议 | ACM MM |
人工智能与统计学 | AISTATS |
算法学习理论国际会议 | ALT |
IEEE进化计算大会 | CEC |
欧洲人工智能会议 | ECAI |
IEEE国际模糊系统会议 | FUZZ IEEE |
遗传与进化计算会议 | GECCO |
国际人工神经网络会议 | ICANN |
国际自动规划与调度会议 | ICAPS |
国际基于案例推理与开发会议 | ICCBR |
国际神经信息处理会议 | ICONIP |
国际机器人与自动化会议 | ICRA |
国际人工智能工具会议 | ICTAI |
国际人工智能联合会议 | IJCAI |
国际人工智能联合会议(综述专场) | IJCAI(Survey Track) |
国际神经网络联合会议 | IJCNN |
国际智能机器人与系统会议 | IROS |
国际知识表示与推理原理会议 | KR |
国际知识科学、工程与管理会议 | KSEM |
ACM SIGGRAPH年会 | SIGGRAPH |
ACM计算理论研讨会 | STOC |
国际人工智能中的不确定性会议 | UAI |
自然并行问题求解 | PPSN |
泛太平洋人工智能国际会议 | PRICAI |
国际人工智能技术与应用会议 | TAAI |
计算机视觉
全名 | 简称 |
---|---|
国际3D视觉会议 | 3DV |
亚洲计算机视觉会议 | ACCV |
ACM国际多媒体会议 | ACM MM |
英国机器视觉会议 | BMVC |
国际计算机视觉与模式识别会议 | CVPR |
欧洲计算机视觉会议 | ECCV |
国际计算机视觉会议 | ICCV |
国际文档分析与识别会议 | ICDAR |
IEEE国际图像处理会议 | ICIP |
国际多媒体与博览会议 | ICME |
国际模式识别会议 | ICPR |
IEEE可视化会议 | IEEE VIS |
国际医学图像计算与计算机辅助干预学会会议 | MICCAI |
ACM SIGGRAPH年会 | SIGGRAPH |
IEEE冬季计算机视觉应用会议 | WACV |
数据挖掘
全名 | 简称 |
---|---|
自动知识库构建 | AKBC |
亚太网络会议 | APWeb |
国际信息与知识管理会议 | CIKM |
高级应用数据库系统 | DASFAA |
欧洲机器学习与知识发现实践原理会议 | ECML-PKDD |
IEEE国际数据工程会议 | ICDE |
IEEE国际数据挖掘会议 | ICDM |
国际数据库理论会议 | ICDT |
ACM SIGKDD知识发现与数据挖掘会议 | KDD |
语言资源与评估会议 | LREC |
国际移动数据管理会议 | MDM |
太平洋亚洲知识发现与数据挖掘会议 | PAKDD |
ACM数据库系统原理研讨会 | PODS |
ACM推荐系统会议系列 | RecSys |
SIAM国际数据挖掘会议 | SDM |
ACM SIGMOD国际数据管理会议 | SIGMOD |
国际超大规模数据库会议 | VLDB |
ACM国际网络搜索与数据挖掘会议 | WSDM |
万维网会议 | WWW |
国际扩展数据库技术会议 | EDBT |
国际创新数据系统研究会议 | CIDR |
信息检索
全名 | 简称 |
---|---|
欧洲信息检索研究会议 | ECIR |
扩展语义网会议 | ESWC |
ACM国际多媒体检索会议 | ICMR |
ACM SIGIR国际信息检索理论会议 | ICTIR |
国际语义网会议 | ISWC |
国际信息检索研究与发展会议 | SIGIR |
机器学习
全名 | 简称 |
---|---|
亚洲机器学习会议 | ACML |
国际人工智能与统计学会议 | AISTATS |
欧洲机器学习会议 | ECML |
国际学习表示会议 | ICLR |
国际机器学习会议 | ICML |
医疗机器学习 | ML4H |
神经信息处理系统 | NeurIPS |
人工智能中的不确定性会议 | UAI |
自然语言处理
全名 | 简称 |
---|---|
计算语言学协会亚洲分会 | AACL |
计算语言学协会 | ACL |
中国计算语言学 | CCL |
国际计算语言学会议 | COLING |
年度计算学习理论会议 | COLT |
计算自然语言学习会议 | CoNLL |
计算语言学协会欧洲分会 | EACL |
自然语言处理实证方法 | EMNLP |
国际声学、语音与信号处理会议 | ICASSP |
国际文档分析与识别会议 | ICDAR |
国际神经信息处理会议 | ICONIP |
国际语音通信协会会议 | INTERSPEECH |
语言资源与评估会议 | LREC |
计算语言学协会北美分会 | NAACL |
自然语言处理与中文计算 | NLPCC |
自然语言处理表示学习研讨会 | RepL4NLP |
SIGdial对话与话语会议 | SIGDIAL |
国际语义评估研讨会 | SemEval |
阿拉伯自然语言处理研讨会 | WANLP |
主观性、情感和社交媒体分析计算方法研讨会 | WASSA |
在线滥用与危害研讨会 | WOAH |
计算机体系结构
全名 | 简称 |
---|---|
国际编程语言与操作系统架构支持会议 | ASPLOS |
USENIX年度技术会议 | ATC |
设计、自动化与测试欧洲会议 | DATE |
欧洲计算机系统会议 | EuroSys |
文件与存储技术会议 | FAST |
高性能计算机架构 | HPCA |
国际计算机架构研讨会 | ISCA |
IEEE/ACM国际微架构研讨会 | MICRO |
ACM SIGPLAN并行编程原理与实践研讨会 | PPoPP |
高性能计算、网络、存储和分析国际会议 | SC |
ACM云计算研讨会 | SoCC |
系统
全称 | 简称 |
---|---|
ACM SIGSOFT软件工程基础研讨会/欧洲软件工程会议 | FSE/ESEC |
国际软件工程会议 | ICSE |
国际软件测试与分析研讨会 | ISSTA |
USENIX操作系统设计与实现研讨会 | OSDI |
ACM操作系统原理研讨会 | SOSP |
安全
全称 | 简称 |
---|---|
年度计算机安全应用会议 | ACSA |
ACM亚洲计算机与通信安全会议 | AsiaCCS |
ACM计算机与通信安全会议 | CCS |
可靠系统与网络 | DSN |
欧洲计算机安全研究研讨会 | ESORICS |
欧洲安全与隐私研讨会 | EuroS&P |
国际信息与通信安全会议 | ICICS |
网络与分布式系统安全研讨会 | NDSS |
入侵检测最新进展国际研讨会 | RAID |
IEEE安全与隐私研讨会 | SP |
Usenix安全研讨会 | USENIX Security |
添加新会议
您可以手动将DBLP中的任何会议添加到配置映射中。
以ICLR为例:
- 步骤1:访问DBLP
- 步骤2:找到会议的全称
- 步骤3:在
config/ML.json
或parserConfig.json
中添加映射(您应指定配置路径)
{"International Conference on Learning Representations": "ICLR"}
联系方式
如果您有任何问题或建议,请发送电子邮件至Libo Qin或Qiguang Chen,或在此处创建GitHub问题。
我们欢迎您加入我们并在https://docs.qq.com/sheet/DWFF1aWlVV1hISU12?tab=h2idmj 更新会议信息。