SimBiber - 自动简化BibTeX文献引用的开源工具

SimBiber：一个使用官方信息简化bibtex的工具

更新日志 • 安装 • 使用方法 • 输入输出示例 • 支持的会议 • 添加新会议 • 联系方式 • 组织者 • 贡献者

动机

由于页面限制，我们经常需要将包含大量信息的官方bib简化为仅保留必要信息（如作者、标题、会议/期刊名称等）的简短版本。

我们推出了__SimBiber__，这是一个用Python编写的简单工具，可以自动简化这些信息。希望它能对您有所帮助。

我们还强烈推荐另一个出色的工具Rebiber，它是一个用官方信息规范化bibtex的工具。

提示：如果您先使用Rebiber，然后再使用Simbiber，您将获得更好的体验。

免责声明

SimBiber是一个相对较新的项目，正在积极开发中。我们希望它在各种情况下都能发挥作用，但不能保证它产生的结果一定严格符合官方规范。

因此，您最好再次检查简化后的bib文件的准确性。

所有图标均从互联网收集，如有侵权，请联系我们删除。

更新日志

2023.02.33
- 修复了一些与"-keep"参数相关的错误。
2021.05.02
- 修复了一些不使用"-keep"参数时的错误。
2021.05.01
- 支持自定义要保留的键。
2021.04.23
- 支持IJCAI（调查轨道）。
- 统一README。
2021.04.11
- 支持pip安装。
- 简化输入参数。
- 添加免责声明。
2021.03.02
- ~~修复删除重复项时的一些错误。~~
2021.02.15
- ~~修复将ACL（如EACL）会议简化为ACL的错误。~~
- 支持ACL Findings和EMNLP findings。
2021.01.21
- 支持删除重复项，如果你的参考文献中有相同标题的条目。（自动选择会议引用）
- ~~修复一些关于某些会议的错误。~~
- 增加更多会议类别。（现在支持113个会议）
2021.01.11
- ~~修复输出路径与输入路径相同时的错误。~~
- ~~支持删除重复项，如果你的参考文献同时包含arXiv和会议引用。~~
- 支持按文件夹简化文件。
- 支持使用默认输出路径。
- ~~增加更多会议类别。（现在支持112个会议）~~
2021.01.08 ~~我们修复了booktitle包含"{"或"}"时的错误，并增加了更多会议类别。（现在支持105个会议）~~
2021.01.06 ~~我们修复了一些小错误，并增加了更多会议类别。（现在支持84个会议）~~
2021.12.31 ~~我们构建并发布了第一个版本。~~

安装

git clone https://github.com/MLNLP-World/Simbiber.git
cd Simbiber/
pip install -e .

或者

pip install simbiber

如果你想使用最新的GitHub版本，其中包含更多错误修复，请使用第一种安装方法。

最后，如果你不带任何参数运行"simbiber"，得到以下结果，则安装成功！

使用方法(v0.8.1)

simbiber -i [输入bib路径] -o [输出bib路径]

提示：所有路径参数都支持绝对路径和相对路径

简化参数	完整参数	用途
`-i`	`--input_path`	要简化的输入bib `文件`或`目录`的路径。
`-o`	`--output_path`	[可选] 要保存的输出bib文件的路径。请注意：仅在简化单个bib文件时生效。如果`output_path==input_path`，将覆写输入文件。不使用此参数时，将自动填充：如果简化单个bib`文件`，将覆写输入文件；如果简化bib`目录`，将输出到`./out`目录。
`-c`	`--config_path`	[可选]映射配置文件的路径。路径可以是文件目录路径，如`config`，或单个文件路径，如`config.json`。请注意：如果要简化大型bib文件，最好提取外部`json`配置文件以获得满意的速度。
`-a`	`--if_append_output`	[可选] 是否将简化后的数据追加到输出bib文件。
`-r`	`--remove_duplicate`	[可选] 如果您的bib同时包含arXiv和会议引用，是否删除重复项。请注意：如果设为`True`，可能需要更多时间来写入简化后的bib文件。请耐心等待。
`-cch`	`--cache_num`	[可选]一次想要简化的bib条目数量。请注意：如果要简化大型bib文件，最好调整此参数以获得满意的速度。
`-m`	`--merge`	[可选]如果`input_path`是文件夹，您想合并该文件夹中所有bib文件的键。
`-s`	`--enable_simplify`	[可选]是否启用简化
`-keep`	`--keep_keys`	[可选]您想在每个bib条目中保留的键。完整形式类似于`-keep "pages,doi"`。注意：如果出现无法识别的参数错误，最好使用`--keep_keys`

输入和输出示例

使用官方信息的简化输出条目示例（支持xxx="..."或xxx={...}形式的bibitem）：

@inproceedings{li-etal-2019-survey,
    title = "A Sophisticated Survey about Chinese Poem and Beers",
    author = "Li, Bai  and
     Ha, Pi  and
     Jin, Shibai  and
     Xue, Hua  and
     Mao, Tai",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP)",
    month = nov,
    year = "2019",
    address = "Hong Kong, China",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/D19-1214",
    doi = "10.18653/v1/D19-1214",
    pages = "2078--2087",
    abstract = "意图检测和槽填充是构建口语理解（SLU）系统的两个主要任务。这两个任务紧密相连，槽通常高度依赖于意图。在本文中，我们提出了一种新颖的SLU框架，以更好地融入意图信息，从而进一步指导槽填充。在我们的框架中，我们采用了带有Stack-Propagation的联合模型，可以直接使用意图信息作为槽填充的输入，从而捕获意图语义知识。此外，为了进一步减轻错误传播，我们对Stack-Propagation框架执行了词级别的意图检测。在两个公开数据集上的实验表明，我们的模型达到了最先进的性能，并且大幅超越了之前的其他方法。最后，我们在我们的框架中使用了双向Transformer编码器表示（BERT）模型，这进一步提升了我们在SLU任务中的性能。",
}

使用官方信息的简化输出条目示例：

@inproceedings{li-etal-2019-survey,
    author = {Li, Bai  and
     Ha, Pi  and
     Jin, Shibai  and
     Xue, Hua  and
     Mao, Tai},
    booktitle = {Proc. of EMNLP},
    title = {A Sophisticated Survey about Chinese Poem and Beers},
    year = {2019}
}

支持的会议

config目录包含一系列转换后的json文件，用于官方全名和简化名称之间的映射。

AI

全名	简称
人工智能促进协会	AAAI
国际自主代理与多代理系统联合会议	AAMAS
ACM国际多媒体会议	ACM MM
人工智能与统计学	AISTATS
算法学习理论国际会议	ALT
IEEE进化计算大会	CEC
欧洲人工智能会议	ECAI
IEEE国际模糊系统会议	FUZZ IEEE
遗传与进化计算会议	GECCO
国际人工神经网络会议	ICANN
国际自动规划与调度会议	ICAPS
国际基于案例推理与开发会议	ICCBR
国际神经信息处理会议	ICONIP
国际机器人与自动化会议	ICRA
国际人工智能工具会议	ICTAI
国际人工智能联合会议	IJCAI
国际人工智能联合会议（综述专场）	IJCAI(Survey Track)
国际神经网络联合会议	IJCNN
国际智能机器人与系统会议	IROS
国际知识表示与推理原理会议	KR
国际知识科学、工程与管理会议	KSEM
ACM SIGGRAPH年会	SIGGRAPH
ACM计算理论研讨会	STOC
国际人工智能中的不确定性会议	UAI
自然并行问题求解	PPSN
泛太平洋人工智能国际会议	PRICAI
国际人工智能技术与应用会议	TAAI

计算机视觉

全名	简称
国际3D视觉会议	3DV
亚洲计算机视觉会议	ACCV
ACM国际多媒体会议	ACM MM
英国机器视觉会议	BMVC
国际计算机视觉与模式识别会议	CVPR
欧洲计算机视觉会议	ECCV
国际计算机视觉会议	ICCV
国际文档分析与识别会议	ICDAR
IEEE国际图像处理会议	ICIP
国际多媒体与博览会议	ICME
国际模式识别会议	ICPR
IEEE可视化会议	IEEE VIS
国际医学图像计算与计算机辅助干预学会会议	MICCAI
ACM SIGGRAPH年会	SIGGRAPH
IEEE冬季计算机视觉应用会议	WACV

数据挖掘

全名	简称
自动知识库构建	AKBC
亚太网络会议	APWeb
国际信息与知识管理会议	CIKM
高级应用数据库系统	DASFAA
欧洲机器学习与知识发现实践原理会议	ECML-PKDD
IEEE国际数据工程会议	ICDE
IEEE国际数据挖掘会议	ICDM
国际数据库理论会议	ICDT
ACM SIGKDD知识发现与数据挖掘会议	KDD
语言资源与评估会议	LREC
国际移动数据管理会议	MDM
太平洋亚洲知识发现与数据挖掘会议	PAKDD
ACM数据库系统原理研讨会	PODS
ACM推荐系统会议系列	RecSys
SIAM国际数据挖掘会议	SDM
ACM SIGMOD国际数据管理会议	SIGMOD
国际超大规模数据库会议	VLDB
ACM国际网络搜索与数据挖掘会议	WSDM
万维网会议	WWW
国际扩展数据库技术会议	EDBT
国际创新数据系统研究会议	CIDR

信息检索

全名	简称
欧洲信息检索研究会议	ECIR
扩展语义网会议	ESWC
ACM国际多媒体检索会议	ICMR
ACM SIGIR国际信息检索理论会议	ICTIR
国际语义网会议	ISWC
国际信息检索研究与发展会议	SIGIR

机器学习

全名	简称
亚洲机器学习会议	ACML
国际人工智能与统计学会议	AISTATS
欧洲机器学习会议	ECML
国际学习表示会议	ICLR
国际机器学习会议	ICML
医疗机器学习	ML4H
神经信息处理系统	NeurIPS
人工智能中的不确定性会议	UAI

自然语言处理

全名	简称
计算语言学协会亚洲分会	AACL
计算语言学协会	ACL
中国计算语言学	CCL
国际计算语言学会议	COLING
年度计算学习理论会议	COLT
计算自然语言学习会议	CoNLL
计算语言学协会欧洲分会	EACL
自然语言处理实证方法	EMNLP
国际声学、语音与信号处理会议	ICASSP
国际文档分析与识别会议	ICDAR
国际神经信息处理会议	ICONIP
国际语音通信协会会议	INTERSPEECH
语言资源与评估会议	LREC
计算语言学协会北美分会	NAACL
自然语言处理与中文计算	NLPCC
自然语言处理表示学习研讨会	RepL4NLP
SIGdial对话与话语会议	SIGDIAL
国际语义评估研讨会	SemEval
阿拉伯自然语言处理研讨会	WANLP
主观性、情感和社交媒体分析计算方法研讨会	WASSA
在线滥用与危害研讨会	WOAH

计算机体系结构

全名	简称
国际编程语言与操作系统架构支持会议	ASPLOS
USENIX年度技术会议	ATC
设计、自动化与测试欧洲会议	DATE
欧洲计算机系统会议	EuroSys
文件与存储技术会议	FAST
高性能计算机架构	HPCA
国际计算机架构研讨会	ISCA
IEEE/ACM国际微架构研讨会	MICRO
ACM SIGPLAN并行编程原理与实践研讨会	PPoPP
高性能计算、网络、存储和分析国际会议	SC
ACM云计算研讨会	SoCC

系统

全称	简称
ACM SIGSOFT软件工程基础研讨会/欧洲软件工程会议	FSE/ESEC
国际软件工程会议	ICSE
国际软件测试与分析研讨会	ISSTA
USENIX操作系统设计与实现研讨会	OSDI
ACM操作系统原理研讨会	SOSP

安全

全称	简称
年度计算机安全应用会议	ACSA
ACM亚洲计算机与通信安全会议	AsiaCCS
ACM计算机与通信安全会议	CCS
可靠系统与网络	DSN
欧洲计算机安全研究研讨会	ESORICS
欧洲安全与隐私研讨会	EuroS&P
国际信息与通信安全会议	ICICS
网络与分布式系统安全研讨会	NDSS
入侵检测最新进展国际研讨会	RAID
IEEE安全与隐私研讨会	SP
Usenix安全研讨会	USENIX Security

添加新会议

您可以手动将DBLP中的任何会议添加到配置映射中。

以ICLR为例：

步骤1：访问DBLP
步骤2：找到会议的全称
步骤3：在config/ML.json或parserConfig.json中添加映射（您应指定配置路径）

{"International Conference on Learning Representations": "ICLR"}

联系方式

如果您有任何问题或建议，请发送电子邮件至Libo Qin或Qiguang Chen，或在此处创建GitHub问题。

我们欢迎您加入我们并在https://docs.qq.com/sheet/DWFF1aWlVV1hISU12?tab=h2idmj 更新会议信息。

组织者

贡献者

感谢以下贡献者：