Project Icon

SimBiber

自动简化BibTeX文献引用的开源工具

SimBiber是一个开源的BibTeX简化工具,可将官方引用格式自动转换为仅含核心信息的简洁版本。支持100多种学术会议和期刊格式,能处理单个文件或整个文件夹。用户可自定义保留字段,灵活管理参考文献。该工具安装简单,操作便捷,适用于学术写作中的文献引用规范化。

SimBiber:一个使用官方信息简化bibtex的工具

version Status-building PRs-Welcome stars FORK Issues


动机

由于页面限制,我们经常需要将包含大量信息的官方bib简化为仅保留必要信息(如作者、标题、会议/期刊名称等)的简短版本。

我们推出了__SimBiber__,这是一个用Python编写的简单工具,可以自动简化这些信息。希望它能对您有所帮助。

我们还强烈推荐另一个出色的工具Rebiber,它是一个用官方信息规范化bibtex的工具。

提示:如果您先使用Rebiber,然后再使用Simbiber,您将获得更好的体验。

免责声明

SimBiber是一个相对较新的项目,正在积极开发中。 我们希望它在各种情况下都能发挥作用,但不能保证它产生的结果一定严格符合官方规范。

因此,您最好再次检查简化后的bib文件的准确性。

所有图标均从互联网收集,如有侵权,请联系我们删除。

更新日志

  • 2023.02.33
    • 修复了一些与"-keep"参数相关的错误。
  • 2021.05.02
    • 修复了一些不使用"-keep"参数时的错误。
  • 2021.05.01
    • 支持自定义要保留的键。
  • 2021.04.23
    • 支持IJCAI(调查轨道)。
    • 统一README。
  • 2021.04.11
    • 支持pip安装
    • 简化输入参数。
    • 添加免责声明。
  • 2021.03.02
    • 修复删除重复项时的一些错误。
  • 2021.02.15
    • 修复将ACL(如EACL)会议简化为ACL的错误。
    • 支持ACL FindingsEMNLP findings
  • 2021.01.21
    • 支持删除重复项,如果你的参考文献中有相同标题的条目。(自动选择会议引用)
    • 修复一些关于某些会议的错误。
    • 增加更多会议类别。(现在支持113个会议)
  • 2021.01.11
    • 修复输出路径与输入路径相同时的错误。
    • 支持删除重复项,如果你的参考文献同时包含arXiv和会议引用。
    • 支持按文件夹简化文件。
    • 支持使用默认输出路径。
    • 增加更多会议类别。(现在支持112个会议)
  • 2021.01.08 我们修复了booktitle包含"{"或"}"时的错误,并增加了更多会议类别。(现在支持105个会议)
  • 2021.01.06 我们修复了一些小错误,并增加了更多会议类别。(现在支持84个会议)
  • 2021.12.31 我们构建并发布了第一个版本。

安装

git clone https://github.com/MLNLP-World/Simbiber.git
cd Simbiber/
pip install -e .

或者

pip install simbiber

如果你想使用最新的GitHub版本,其中包含更多错误修复,请使用第一种安装方法。

最后,如果你不带任何参数运行"simbiber",得到以下结果,则安装成功!

使用方法(v0.8.1)

simbiber -i [输入bib路径] -o [输出bib路径] 

提示:所有路径参数都支持绝对路径和相对路径

简化参数完整参数用途
-i--input_path要简化的输入bib 文件目录的路径。
-o--output_path[可选] 要保存的输出bib文件的路径。
请注意:
  • 仅在简化单个bib文件时生效。
    • 如果output_path==input_path,将覆写输入文件。
  • 不使用此参数时,将自动填充:
    • 如果简化单个bib文件,将覆写输入文件;
    • 如果简化bib目录,将输出到./out目录。
-c--config_path[可选]映射配置文件的路径。路径可以是文件目录路径,如config,或单个文件路径,如config.json
请注意: 如果要简化大型bib文件,最好提取外部json配置文件以获得满意的速度。
-a--if_append_output[可选] 是否将简化后的数据追加到输出bib文件。
-r--remove_duplicate[可选] 如果您的bib同时包含arXiv和会议引用,是否删除重复项。
请注意: 如果设为True,可能需要更多时间来写入简化后的bib文件。请耐心等待。
-cch--cache_num[可选]一次想要简化的bib条目数量。
请注意: 如果要简化大型bib文件,最好调整此参数以获得满意的速度。
-m--merge[可选]如果input_path是文件夹,您想合并该文件夹中所有bib文件的键。
-s--enable_simplify[可选]是否启用简化
-keep--keep_keys[可选]您想在每个bib条目中保留的键。
完整形式类似于-keep "pages,doi"。注意:如果出现无法识别的参数错误,最好使用--keep_keys

输入和输出示例

使用官方信息的简化输出条目示例(支持xxx="..."xxx={...}形式的bibitem):

@inproceedings{li-etal-2019-survey,
    title = "A Sophisticated Survey about Chinese Poem and Beers",
    author = "Li, Bai  and
     Ha, Pi  and
     Jin, Shibai  and
     Xue, Hua  and
     Mao, Tai",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP)",
    month = nov,
    year = "2019",
    address = "Hong Kong, China",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/D19-1214",
    doi = "10.18653/v1/D19-1214",
    pages = "2078--2087",
    abstract = "意图检测和槽填充是构建口语理解(SLU)系统的两个主要任务。这两个任务紧密相连,槽通常高度依赖于意图。在本文中,我们提出了一种新颖的SLU框架,以更好地融入意图信息,从而进一步指导槽填充。在我们的框架中,我们采用了带有Stack-Propagation的联合模型,可以直接使用意图信息作为槽填充的输入,从而捕获意图语义知识。此外,为了进一步减轻错误传播,我们对Stack-Propagation框架执行了词级别的意图检测。在两个公开数据集上的实验表明,我们的模型达到了最先进的性能,并且大幅超越了之前的其他方法。最后,我们在我们的框架中使用了双向Transformer编码器表示(BERT)模型,这进一步提升了我们在SLU任务中的性能。",
}

使用官方信息的简化输出条目示例:

@inproceedings{li-etal-2019-survey,
    author = {Li, Bai  and
     Ha, Pi  and
     Jin, Shibai  and
     Xue, Hua  and
     Mao, Tai},
    booktitle = {Proc. of EMNLP},
    title = {A Sophisticated Survey about Chinese Poem and Beers},
    year = {2019}
}

支持的会议

config目录包含一系列转换后的json文件,用于官方全名和简化名称之间的映射。

AI

全名简称
人工智能促进协会AAAI
国际自主代理与多代理系统联合会议AAMAS
ACM国际多媒体会议ACM MM
人工智能与统计学AISTATS
算法学习理论国际会议ALT
IEEE进化计算大会CEC
欧洲人工智能会议ECAI
IEEE国际模糊系统会议FUZZ IEEE
遗传与进化计算会议GECCO
国际人工神经网络会议ICANN
国际自动规划与调度会议ICAPS
国际基于案例推理与开发会议ICCBR
国际神经信息处理会议ICONIP
国际机器人与自动化会议ICRA
国际人工智能工具会议ICTAI
国际人工智能联合会议IJCAI
国际人工智能联合会议(综述专场)IJCAI(Survey Track)
国际神经网络联合会议IJCNN
国际智能机器人与系统会议IROS
国际知识表示与推理原理会议KR
国际知识科学、工程与管理会议KSEM
ACM SIGGRAPH年会SIGGRAPH
ACM计算理论研讨会STOC
国际人工智能中的不确定性会议UAI
自然并行问题求解PPSN
泛太平洋人工智能国际会议PRICAI
国际人工智能技术与应用会议TAAI

计算机视觉

全名简称
国际3D视觉会议3DV
亚洲计算机视觉会议ACCV
ACM国际多媒体会议ACM MM
英国机器视觉会议BMVC
国际计算机视觉与模式识别会议CVPR
欧洲计算机视觉会议ECCV
国际计算机视觉会议ICCV
国际文档分析与识别会议ICDAR
IEEE国际图像处理会议ICIP
国际多媒体与博览会议ICME
国际模式识别会议ICPR
IEEE可视化会议IEEE VIS
国际医学图像计算与计算机辅助干预学会会议MICCAI
ACM SIGGRAPH年会SIGGRAPH
IEEE冬季计算机视觉应用会议WACV

数据挖掘

全名简称
自动知识库构建AKBC
亚太网络会议APWeb
国际信息与知识管理会议CIKM
高级应用数据库系统DASFAA
欧洲机器学习与知识发现实践原理会议ECML-PKDD
IEEE国际数据工程会议ICDE
IEEE国际数据挖掘会议ICDM
国际数据库理论会议ICDT
ACM SIGKDD知识发现与数据挖掘会议KDD
语言资源与评估会议LREC
国际移动数据管理会议MDM
太平洋亚洲知识发现与数据挖掘会议PAKDD
ACM数据库系统原理研讨会PODS
ACM推荐系统会议系列RecSys
SIAM国际数据挖掘会议SDM
ACM SIGMOD国际数据管理会议SIGMOD
国际超大规模数据库会议VLDB
ACM国际网络搜索与数据挖掘会议WSDM
万维网会议WWW
国际扩展数据库技术会议EDBT
国际创新数据系统研究会议CIDR

信息检索

全名简称
欧洲信息检索研究会议ECIR
扩展语义网会议ESWC
ACM国际多媒体检索会议ICMR
ACM SIGIR国际信息检索理论会议ICTIR
国际语义网会议ISWC
国际信息检索研究与发展会议SIGIR

机器学习

全名简称
亚洲机器学习会议ACML
国际人工智能与统计学会议AISTATS
欧洲机器学习会议ECML
国际学习表示会议ICLR
国际机器学习会议ICML
医疗机器学习ML4H
神经信息处理系统NeurIPS
人工智能中的不确定性会议UAI

自然语言处理

全名简称
计算语言学协会亚洲分会AACL
计算语言学协会ACL
中国计算语言学CCL
国际计算语言学会议COLING
年度计算学习理论会议COLT
计算自然语言学习会议CoNLL
计算语言学协会欧洲分会EACL
自然语言处理实证方法EMNLP
国际声学、语音与信号处理会议ICASSP
国际文档分析与识别会议ICDAR
国际神经信息处理会议ICONIP
国际语音通信协会会议INTERSPEECH
语言资源与评估会议LREC
计算语言学协会北美分会NAACL
自然语言处理与中文计算NLPCC
自然语言处理表示学习研讨会RepL4NLP
SIGdial对话与话语会议SIGDIAL
国际语义评估研讨会SemEval
阿拉伯自然语言处理研讨会WANLP
主观性、情感和社交媒体分析计算方法研讨会WASSA
在线滥用与危害研讨会WOAH

计算机体系结构

全名简称
国际编程语言与操作系统架构支持会议ASPLOS
USENIX年度技术会议ATC
设计、自动化与测试欧洲会议DATE
欧洲计算机系统会议EuroSys
文件与存储技术会议FAST
高性能计算机架构HPCA
国际计算机架构研讨会ISCA
IEEE/ACM国际微架构研讨会MICRO
ACM SIGPLAN并行编程原理与实践研讨会PPoPP
高性能计算、网络、存储和分析国际会议SC
ACM云计算研讨会SoCC

系统

全称简称
ACM SIGSOFT软件工程基础研讨会/欧洲软件工程会议FSE/ESEC
国际软件工程会议ICSE
国际软件测试与分析研讨会ISSTA
USENIX操作系统设计与实现研讨会OSDI
ACM操作系统原理研讨会SOSP

安全

全称简称
年度计算机安全应用会议ACSA
ACM亚洲计算机与通信安全会议AsiaCCS
ACM计算机与通信安全会议CCS
可靠系统与网络DSN
欧洲计算机安全研究研讨会ESORICS
欧洲安全与隐私研讨会EuroS&P
国际信息与通信安全会议ICICS
网络与分布式系统安全研讨会NDSS
入侵检测最新进展国际研讨会RAID
IEEE安全与隐私研讨会SP
Usenix安全研讨会USENIX Security

添加新会议

您可以手动将DBLP中的任何会议添加到配置映射中。

以ICLR为例:

  • 步骤1:访问DBLP
  • 步骤2:找到会议的全称
  • 步骤3:在config/ML.jsonparserConfig.json中添加映射(您应指定配置路径)
{"International Conference on Learning Representations": "ICLR"}

联系方式

如果您有任何问题或建议,请发送电子邮件至Libo QinQiguang Chen,或在此处创建GitHub问题。

我们欢迎您加入我们并在https://docs.qq.com/sheet/DWFF1aWlVV1hISU12?tab=h2idmj 更新会议信息。

组织者

贡献者

感谢以下贡献者:

项目侧边栏1项目侧边栏2
推荐项目
Project Cover

豆包MarsCode

豆包 MarsCode 是一款革命性的编程助手,通过AI技术提供代码补全、单测生成、代码解释和智能问答等功能,支持100+编程语言,与主流编辑器无缝集成,显著提升开发效率和代码质量。

Project Cover

AI写歌

Suno AI是一个革命性的AI音乐创作平台,能在短短30秒内帮助用户创作出一首完整的歌曲。无论是寻找创作灵感还是需要快速制作音乐,Suno AI都是音乐爱好者和专业人士的理想选择。

Project Cover

有言AI

有言平台提供一站式AIGC视频创作解决方案,通过智能技术简化视频制作流程。无论是企业宣传还是个人分享,有言都能帮助用户快速、轻松地制作出专业级别的视频内容。

Project Cover

Kimi

Kimi AI助手提供多语言对话支持,能够阅读和理解用户上传的文件内容,解析网页信息,并结合搜索结果为用户提供详尽的答案。无论是日常咨询还是专业问题,Kimi都能以友好、专业的方式提供帮助。

Project Cover

阿里绘蛙

绘蛙是阿里巴巴集团推出的革命性AI电商营销平台。利用尖端人工智能技术,为商家提供一键生成商品图和营销文案的服务,显著提升内容创作效率和营销效果。适用于淘宝、天猫等电商平台,让商品第一时间被种草。

Project Cover

吐司

探索Tensor.Art平台的独特AI模型,免费访问各种图像生成与AI训练工具,从Stable Diffusion等基础模型开始,轻松实现创新图像生成。体验前沿的AI技术,推动个人和企业的创新发展。

Project Cover

SubCat字幕猫

SubCat字幕猫APP是一款创新的视频播放器,它将改变您观看视频的方式!SubCat结合了先进的人工智能技术,为您提供即时视频字幕翻译,无论是本地视频还是网络流媒体,让您轻松享受各种语言的内容。

Project Cover

美间AI

美间AI创意设计平台,利用前沿AI技术,为设计师和营销人员提供一站式设计解决方案。从智能海报到3D效果图,再到文案生成,美间让创意设计更简单、更高效。

Project Cover

稿定AI

稿定设计 是一个多功能的在线设计和创意平台,提供广泛的设计工具和资源,以满足不同用户的需求。从专业的图形设计师到普通用户,无论是进行图片处理、智能抠图、H5页面制作还是视频剪辑,稿定设计都能提供简单、高效的解决方案。该平台以其用户友好的界面和强大的功能集合,帮助用户轻松实现创意设计。

投诉举报邮箱: service@vectorlightyear.com
@2024 懂AI·鲁ICP备2024100362号-6·鲁公网安备37021002001498号