Pandoc

通用标记转换器

Pandoc是一个Haskell库，用于将一种标记格式转换为另一种，同时也是一个使用该库的命令行工具。

它可以从以下格式转换：

bibtex（BibTeX参考文献）
biblatex（BibLaTeX参考文献）
bits（BITS XML，jats的别名）
commonmark（CommonMark Markdown）
commonmark_x（带扩展的CommonMark Markdown）
creole（Creole 1.0）
csljson（CSL JSON参考文献）
csv（CSV表格）
tsv（TSV表格）
djot（Djot标记）
docbook（DocBook）
docx（Word docx）
dokuwiki（DokuWiki标记）
endnotexml（EndNote XML参考文献）
epub（EPUB）
fb2（FictionBook2电子书）
gfm（GitHub风格的Markdown），或已弃用且不太准确的markdown_github；仅当需要gfm不支持的扩展时才使用markdown_github。
haddock（Haddock标记）
html（HTML）
ipynb（Jupyter笔记本）
jats（JATS XML）
jira（Jira/Confluence wiki标记）
json（原生AST的JSON版本）
latex（LaTeX）
markdown（Pandoc的Markdown）
markdown_mmd（MultiMarkdown）
markdown_phpextra（PHP Markdown Extra）
markdown_strict（原始未扩展的Markdown）
mediawiki（MediaWiki标记）
man（roff man）
muse（Muse）
native（原生Haskell）
odt（OpenOffice文本文档）
opml（OPML）
org（Emacs Org模式）
ris（RIS参考文献）
rtf（富文本格式）
rst（reStructuredText）
t2t（txt2tags）
textile（Textile）
tikiwiki（TikiWiki标记）
twiki（TWiki标记）
typst（typst）
vimwiki（Vimwiki）
自定义Lua读取器的路径，请参阅下面的自定义读取器和写入器

</div>

它可以转换为

<div id="output-formats"> - `asciidoc`（由 [AsciiDoctor](https://asciidoctor.org/) 解释的现代 [AsciiDoc](https://www.methods.co.nz/asciidoc/)） - `asciidoc_legacy`（由 [`asciidoc-py`](https://github.com/asciidoc-py/asciidoc-py) 解释的 [AsciiDoc](https://www.methods.co.nz/asciidoc/)） - `asciidoctor`（`asciidoc` 的已弃用同义词） - `beamer`（[LaTeX beamer](https://ctan.org/pkg/beamer) 幻灯片） - `bibtex`（[BibTeX](https://ctan.org/pkg/bibtex) 参考文献） - `biblatex`（[BibLaTeX](https://ctan.org/pkg/biblatex) 参考文献） - `chunkedhtml`（多个链接 HTML 文件的 zip 压缩包） - `commonmark`（[CommonMark](https://commonmark.org) Markdown） - `commonmark_x`（带扩展的 [CommonMark](https://commonmark.org) Markdown） - `context`（[ConTeXt](https://www.contextgarden.net/)） - `csljson`（[CSL JSON](https://citeproc-js.readthedocs.io/en/latest/csl-json/markup.html) 参考文献） - `djot`（[Djot 标记](https://djot.net)） - `docbook` 或 `docbook4`（[DocBook](https://docbook.org) 4） - `docbook5`（DocBook 5） - `docx`（[Word docx](https://en.wikipedia.org/wiki/Office_Open_XML)） - `dokuwiki`（[DokuWiki 标记](https://www.dokuwiki.org/dokuwiki)） - `epub` 或 `epub3`（[EPUB](http://idpf.org/epub) v3 电子书） - `epub2`（EPUB v2） - `fb2`（[FictionBook2](http://www.fictionbook.org/index.php/Eng:XML_Schema_Fictionbook_2.1) 电子书） - `gfm`（[GitHub 风格的 Markdown](https://help.github.com/articles/github-flavored-markdown/)），或已弃用且不太准确的 `markdown_github`；仅当您需要 [`gfm`](https://pandoc.org/MANUAL.html#markdown-variants) 不支持的扩展时才使用 [`markdown_github`](https://pandoc.org/MANUAL.html#markdown-variants)。 - `haddock`（[Haddock 标记](https://www.haskell.org/haddock/doc/html/ch03s08.html)） - `html` 或 `html5`（[HTML](https://www.w3.org/html/)，即 [HTML5](https://html.spec.whatwg.org/)/XHTML [多用途标记](https://www.w3.org/TR/html-polyglot/)） - `html4`（[XHTML](https://www.w3.org/TR/xhtml1/) 1.0 过渡版） - `icml`（[InDesign ICML](https://manualzz.com/doc/9627253/adobe-indesign-cs6-idml-cookbook)） - `ipynb`（[Jupyter 笔记本](https://nbformat.readthedocs.io/en/latest/)） - `jats_archiving`（[JATS](https://jats.nlm.nih.gov) XML，存档和交换标记集） - `jats_articleauthoring`（[JATS](https://jats.nlm.nih.gov) XML，文章创作标记集） - `jats_publishing`（[JATS](https://jats.nlm.nih.gov) XML，期刊出版标记集） - `jats`（`jats_archiving` 的别名） - `jira`（[Jira](https://jira.atlassian.com/secure/WikiRendererHelpAction.jspa?section=all)/Confluence wiki 标记） - `json`（原生 AST 的 JSON 版本） - `latex`（[LaTeX](https://www.latex-project.org/)） - `man`（[roff man](https://man.cx/groff_man(7))） - `markdown`（[Pandoc 的 Markdown](https://pandoc.org/MANUAL.html#pandocs-markdown)） - `markdown_mmd`（[MultiMarkdown](https://fletcherpenney.net/multimarkdown/)） - `markdown_phpextra`（[PHP Markdown Extra](https://michelf.ca/projects/php-markdown/extra/)） - `markdown_strict`（原始未扩展的 [Markdown](https://daringfireball.net/projects/markdown/)） - `markua`（[Markua](https://leanpub.com/markua/read)） - `mediawiki`（[MediaWiki 标记](https://www.mediawiki.org/wiki/Help:Formatting)） - `ms`（[roff ms](https://man.cx/groff_ms(7))） - `muse`（[Muse](https://amusewiki.org/library/manual)） - `native`（原生 Haskell） - `odt`（[OpenOffice 文本文档](https://en.wikipedia.org/wiki/OpenDocument)） - `opml`（[OPML](http://dev.opml.org/spec2.html)） - `opendocument`（[OpenDocument](http://opendocument.xml.org)） - `org`（[Emacs Org 模式](https://orgmode.org)） - `pdf`（[PDF](https://www.adobe.com/pdf/)） - `plain`（纯文本） - `pptx`（[PowerPoint](https://en.wikipedia.org/wiki/Microsoft_PowerPoint) 幻灯片） - `rst`（[reStructuredText](https://docutils.sourceforge.io/docs/ref/rst/introduction.html)） - `rtf`（[富文本格式](https://en.wikipedia.org/wiki/Rich_Text_Format)） - `texinfo`（[GNU Texinfo](https://www.gnu.org/software/texinfo/)） - `textile`（[Textile](https://textile-lang.com)） - `slideous`（[Slideous](https://goessner.net/articles/slideous/) HTML 和 JavaScript 幻灯片） - `slidy`（[Slidy](https://www.w3.org/Talks/Tools/Slidy2/) HTML 和 JavaScript 幻灯片） - `dzslides`（[DZSlides](https://paulrouget.com/dzslides/) HTML5 + JavaScript 幻灯片） - `revealjs`（[reveal.js](https://revealjs.com/) HTML5 + JavaScript 幻灯片） - `s5`（[S5](https://meyerweb.com/eric/tools/s5/) HTML 和 JavaScript 幻灯片） - `tei`（[TEI Simple](https://github.com/TEIC/TEI-Simple)） - `typst`（[typst](https://typst.app)） - `xwiki`（[XWiki 标记](https://www.xwiki.org/xwiki/bin/view/Documentation/UserGuide/Features/XWikiSyntax/)） - `zimwiki`（[ZimWiki 标记](https://zim-wiki.org/manual/Help/Wiki_Syntax.html)） - 自定义 Lua 写入器的路径，详见下方的[自定义读取器和写入器](https://pandoc.org/MANUAL.html#custom-readers-and-writers)

Pandoc 还可以通过 LaTeX、Groff ms 或 HTML 生成 PDF 输出。

Pandoc 的增强版 Markdown 包括表格、定义列表、元数据块、脚注、引用、数学公式等语法。详见下方用户手册中的 Pandoc 的 Markdown。

Pandoc 采用模块化设计：它由一组读取器（用于解析给定格式的文本并生成文档的原生表示，即抽象语法树或 AST）和一组写入器（用于将这种原生表示转换为目标格式）组成。因此，添加输入或输出格式只需添加读取器或写入器即可。用户还可以运行自定义 pandoc 过滤器来修改中间 AST（参见过滤器和 Lua 过滤器的文档）。

由于 pandoc 对文档的中间表示比许多它所转换的格式更缺乏表现力，因此不应期望在每种格式之间都能完美转换。Pandoc 尝试保留文档的结构元素，但不保留格式细节，如页边距大小。而且某些文档元素，如复杂表格，可能不适合 pandoc 的简单文档模型。虽然从 pandoc 的 Markdown 到所有格式的转换都力求完美，但从比 pandoc 的 Markdown 更具表现力的格式进行转换可能会有所损失。