Wie man Dokumente mit Converter-Klassen in Python konvertiert

Wie man Dokumente mit Converter-Klassen in Python konvertiert

Wie man Dokumente mit Converter‑Klassen konvertiert

Aspose.Words FOSS for Python verwendet interne Konverterklassen beim Dokumentexport. Während die meisten Benutzer mit Document.save() interagieren, ist das Verständnis der Konverterklassen für erweiterte Szenarien nützlich.

Voraussetzungen

Installieren Sie die Bibliothek:

pip install aspose-words-foss>=26.4.0

Benötigt Python 3.10 oder höher.

ParagraphConverter

ParagraphConverter wandelt Dokumentabsätze in das Zielausgabeformat um. Schlüsselmethoden:

  • ParagraphConverter.get_paragraph_info() — Formatierungsinformationen aus einem Absatz extrahieren
  • ParagraphConverter.get_run_formatting() — Formatierung für einen Textlauf abrufen
  • ParagraphConverter.format_text() — Formatierung auf Textinhalt anwenden

TableConverter

TableConverter konvertiert Dokumenttabellen in das Zielformat (wie z. B. Markdown-Tabellen):

  • TableConverter.convert() — ein Tabellenelement in das Ausgabeformat konvertieren

ListHandler

ListHandler verwaltet den Listenstatus während der Konvertierung:

  • ListHandler.set_reader() — Dokumentlesekontext festlegen
  • ListHandler.reset() — Listentracking‑Status zurücksetzen
  • ListHandler.get_list_info() — Listenelementdetails für einen Absatz abrufen
  • ListHandler.format_list_item() — Listenelement mit Marker und Einrückung formatieren
  • ListHandler.break_list() — Ende einer Listensequenz signalisieren

Schnelles Konvertierungsbeispiel

Für die meisten Anwendungsfälle verwenden Sie Document.save() direkt — die Konverterklassen werden automatisch aufgerufen:

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

Zusammenfassung

KonverterZweck
ParagraphConverterAbsätze mit Formatierung transformieren
TableConverterTabellen in das Ausgabeformat konvertieren
ListHandlerListenstatus während des Exports verwalten
 Deutsch