Python のコンバーター クラスを使用したドキュメントの変換方法

Python のコンバーター クラスを使用したドキュメントの変換方法

コンバーター クラスを使用したドキュメントの変換方法

Aspose.Words FOSS for Python は、ドキュメントのエクスポート時に内部コンバータークラスを使用します。ほとんどのユーザーは Document.save() とやり取りしますが、コンバータークラスを理解することは高度なシナリオで役立ちます。

前提条件

ライブラリをインストールする:

pip install aspose-words-foss>=26.4.0

Python 3.10 以降が必要です。

ParagraphConverter

ParagraphConverter は文書の段落をターゲット出力形式に変換します。主なメソッドは次のとおりです:

  • ParagraphConverter.get_paragraph_info() — 段落から書式情報を抽出する
  • ParagraphConverter.get_run_formatting() — テキストランの書式を取得する
  • ParagraphConverter.format_text() — テキストコンテンツに書式を適用する

TableConverter

TableConverter は、ドキュメントのテーブルを対象フォーマット(Markdown テーブルなど)に変換します:

  • TableConverter.convert() — テーブル要素を出力形式に変換する

ListHandler

ListHandler は変換中にリストの状態を管理します:

  • ListHandler.set_reader() — ドキュメントリーダーのコンテキストを設定する
  • ListHandler.reset() — リスト追跡状態をリセットする
  • ListHandler.get_list_info() — 段落のリスト項目詳細を取得する
  • ListHandler.format_list_item() — マーカーとインデントを使用してリスト項目をフォーマットする
  • ListHandler.break_list() — リストシーケンスの終了を通知する

クイック変換例

ほとんどのユースケースでは、Document.save() を直接使用してください — コンバータクラスは自動的に呼び出されます:

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

概要

コンバータ目的
ParagraphConverter書式付き段落を変換する
TableConverterテーブルを出力形式に変換する
ListHandlerエクスポート中にリスト状態を管理する
 日本語