Python のコンバーター クラスを使用したドキュメントの変換方法
コンバーター クラスを使用したドキュメントの変換方法
Aspose.Words FOSS for Python は、ドキュメントのエクスポート時に内部コンバータークラスを使用します。ほとんどのユーザーは Document.save() とやり取りしますが、コンバータークラスを理解することは高度なシナリオで役立ちます。
前提条件
ライブラリをインストールする:
pip install aspose-words-foss>=26.4.0Python 3.10 以降が必要です。
ParagraphConverter
ParagraphConverter は文書の段落をターゲット出力形式に変換します。主なメソッドは次のとおりです:
ParagraphConverter.get_paragraph_info()— 段落から書式情報を抽出するParagraphConverter.get_run_formatting()— テキストランの書式を取得するParagraphConverter.format_text()— テキストコンテンツに書式を適用する
TableConverter
TableConverter は、ドキュメントのテーブルを対象フォーマット(Markdown テーブルなど)に変換します:
TableConverter.convert()— テーブル要素を出力形式に変換する
ListHandler
ListHandler は変換中にリストの状態を管理します:
ListHandler.set_reader()— ドキュメントリーダーのコンテキストを設定するListHandler.reset()— リスト追跡状態をリセットするListHandler.get_list_info()— 段落のリスト項目詳細を取得するListHandler.format_list_item()— マーカーとインデントを使用してリスト項目をフォーマットするListHandler.break_list()— リストシーケンスの終了を通知する
クイック変換例
ほとんどのユースケースでは、Document.save() を直接使用してください — コンバータクラスは自動的に呼び出されます:
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)概要
| コンバータ | 目的 |
|---|---|
ParagraphConverter | 書式付き段落を変換する |
TableConverter | テーブルを出力形式に変換する |
ListHandler | エクスポート中にリスト状態を管理する |