PPTX2MD
一个将PowerPoint pptx文件转换为Markdown的工具。
保留的格式:
- 标题。支持使用模糊匹配的自定义目录。
- 任意深度的列表。
- 带有粗体、斜体、颜色和超链接的文本。
- 图片。它们被提取为图像文件,并插入相对路径。
- 带有合并单元格的表格。
- 从上到下再从左到右的块顺序。
支持的输出格式:
- Markdown
- Tiddlywiki的wikitext
- Madoko
如果你喜欢这个项目,请给它加星!
安装与使用
安装
你需要在系统上安装3.6版本以上的_Python和_pip,然后在终端运行:
pip install pptx2md
使用
安装完成后,使用命令pptx2md [pptx文件名]
将_pptx文件_转换为markdown。
默认的输出文件名是out.md
,任何提取的图片(并插入到.md中)都将放置在/img/
文件夹中。
**注意:**不支持旧版的.ppt文件,请先将它们转换为新的.pptx版本。
升级与卸载:
pip install --upgrade pptx2md
pip uninstall pptx2md
自定义标题
默认情况下,这个工具将所有pptx标题解析为一级
markdown标题。为了获得层次化的目录,可以在文件中提供预定义的标题列表,并使用-t
参数提供。
这是一个示例标题文件(titles.txt):
标题1
标题1.1
标题1.1.1
标题1.2
标题1.3
标题2
标题2.1
标题2.2
标题2.1.1
标题2.1.2
标题2.3
标题3
以空格开头的第一行被视为二级标题,空格的数量是缩进的单位。在这个例子中, 标题1.1
将被输出为## 标题1.1
。由于它在开头有两个空格,2是标题缩进的单位,所以 标题1.1.1
有4个空格,将被输出为### 标题1.1.1
。标题文本通过模糊匹配进行匹配,未匹配的pptx标题将被视为最深层的标题。
使用方法:pptx2md [文件名] -t titles.txt
。
其他参数
-t [文件名]
提供标题文件-o [文件名]
输出文件的路径-i [路径]
提取图片的目录--image-width [宽度]
图片的最大宽度,单位为px。如果设置,图片将以html img标签形式插入。--disable-image
禁用图片提取--disable-escaping
不尝试转义特殊字符--disable-notes
不添加演讲者备注--disable-wmf
保持wmf格式的图片不变(避免在linux下出现异常)--disable-color
禁用HTML中的颜色标签--enable-slides
用\n---\n
分隔幻灯片,这可以帮助你将pptx幻灯片转换为markdown幻灯片--min-block-size [大小]
输出文本块的最小字符数--wiki
/--mdk
如果你恰好使用tiddlywiki或madoko,这个参数会输出相应的标记语言--qmd
输出用于quarto驱动的演示文稿的qmd标记语言。它还具有一种简单的方法来推断每张幻灯片的列数。
注意:如果需要,安装wand以提高成功转换wmf图像的机会。
截图
数据链路层设计问题
提供给网络层的服务
成帧
错误控制和流量控制
错误检测和纠正
纠错码(ECC)
错误检测码
基本数据链路协议
滑动窗口协议
一位滑动窗口协议
使用回退N的协议
使用选择重传
滑动窗口协议的性能
数据链路协议示例
PPP
- 上图:标题列表文件内容。
- 下图:生成的目录。
- 左侧:源pptx文件。
- 右侧:生成的markdown文件(由madoko渲染)。
详细解析规则
- 当一个块中的段落有不同的级别时生成列表,否则生成段落。
- 当一个标题与前一个标题的模糊匹配分数大于92时,它会被_省略_。
- 一些预设的主题颜色样式被转换为粗体。
- RGB颜色被保留。
- 源文本被转义。
- 分组形状被递归展平。