如何在 Python 中使用转换器类转换文档
使用转换器类转换文档
Aspose.Words FOSS for Python 在文档导出过程中使用内部转换器类。虽然大多数用户与 Document.save() 交互,但了解这些转换器类对于高级场景很有用。
先决条件
安装库:
pip install aspose-words-foss>=26.4.0需要 Python 3.10 或更高版本。
ParagraphConverter
ParagraphConverter 将文档段落转换为目标输出格式。关键方法:
ParagraphConverter.get_paragraph_info()— 从段落中提取格式信息ParagraphConverter.get_run_formatting()— 获取文本运行的格式ParagraphConverter.format_text()— 将格式应用于文本内容
表格转换器
TableConverter 将文档表格转换为目标格式(例如 Markdown 表格):
TableConverter.convert()— 将表格元素转换为输出格式
列表处理程序
ListHandler 在转换期间管理列表状态:
ListHandler.set_reader()— 设置文档读取器上下文ListHandler.reset()— 重置列表跟踪状态ListHandler.get_list_info()— 获取段落的列表项详细信息ListHandler.format_list_item()— 使用标记和缩进格式化列表项ListHandler.break_list()— 发出列表序列结束信号
快速转换示例
对于大多数使用场景,请直接使用 Document.save() —— 转换器类会自动调用:
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)摘要
| 转换器 | 用途 |
|---|---|
ParagraphConverter | 转换带格式的段落 |
TableConverter | 将表格转换为输出格式 |
ListHandler | 在导出期间管理列表状态 |