如何在 Python 中使用转换器类转换文档

如何在 Python 中使用转换器类转换文档

使用转换器类转换文档

Aspose.Words FOSS for Python 在文档导出过程中使用内部转换器类。虽然大多数用户与 Document.save() 交互,但了解这些转换器类对于高级场景很有用。

先决条件

安装库:

pip install aspose-words-foss>=26.4.0

需要 Python 3.10 或更高版本。

ParagraphConverter

ParagraphConverter 将文档段落转换为目标输出格式。关键方法:

  • ParagraphConverter.get_paragraph_info() — 从段落中提取格式信息
  • ParagraphConverter.get_run_formatting() — 获取文本运行的格式
  • ParagraphConverter.format_text() — 将格式应用于文本内容

表格转换器

TableConverter 将文档表格转换为目标格式(例如 Markdown 表格):

  • TableConverter.convert() — 将表格元素转换为输出格式

列表处理程序

ListHandler 在转换期间管理列表状态:

  • ListHandler.set_reader() — 设置文档读取器上下文
  • ListHandler.reset() — 重置列表跟踪状态
  • ListHandler.get_list_info() — 获取段落的列表项详细信息
  • ListHandler.format_list_item() — 使用标记和缩进格式化列表项
  • ListHandler.break_list() — 发出列表序列结束信号

快速转换示例

对于大多数使用场景,请直接使用 Document.save() —— 转换器类会自动调用:

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

摘要

转换器用途
ParagraphConverter转换带格式的段落
TableConverter将表格转换为输出格式
ListHandler在导出期间管理列表状态
 中文