Πώς να μετατρέψετε έγγραφα με κλάσεις μετατροπέα σε Python

Πώς να μετατρέψετε έγγραφα με κλάσεις μετατροπέα σε Python

Πώς να μετατρέψετε έγγραφα με κλάσεις μετατροπέα

Το Aspose.Words FOSS for Python χρησιμοποιεί εσωτερικές κλάσεις μετατροπέα κατά την εξαγωγή εγγράφων. Ενώ οι περισσότεροι χρήστες αλληλεπιδρούν με Document.save(), η κατανόηση των κλάσεων μετατροπέα είναι χρήσιμη για προχωρημένα σενάρια.

Προαπαιτούμενα

Εγκαταστήστε τη βιβλιοθήκη:

pip install aspose-words-foss>=26.4.0

Απαιτεί Python 3.10 ή νεότερη έκδοση.

ParagraphConverter

ParagraphConverter μετατρέπει τις παραγράφους του εγγράφου στη μορφή εξόδου-στόχο. Κύριες μέθοδοι:

  • ParagraphConverter.get_paragraph_info() — εξαγωγή πληροφοριών μορφοποίησης από μια παράγραφο
  • ParagraphConverter.get_run_formatting() — λήψη μορφοποίησης για ένα τμήμα κειμένου
  • ParagraphConverter.format_text() — εφαρμογή μορφοποίησης στο περιεχόμενο κειμένου

Μετατροπέας Πίνακα

TableConverter μετατρέπει τους πίνακες εγγράφου στη μορφή-στόχο (όπως Markdown tables):

  • TableConverter.convert() — μετατρέψτε ένα στοιχείο πίνακα στη μορφή εξόδου

ListHandler

ListHandler διαχειρίζεται την κατάσταση λίστας κατά τη μετατροπή:

  • ListHandler.set_reader() — ορίστε το πλαίσιο ανάγνωσης εγγράφου
  • ListHandler.reset() — επαναφέρετε την κατάσταση παρακολούθησης λίστας
  • ListHandler.get_list_info() — λάβετε λεπτομέρειες στοιχείου λίστας για μια παράγραφο
  • ListHandler.format_list_item() — μορφοποιήστε ένα στοιχείο λίστας με δείκτη και εσοχή
  • ListHandler.break_list() — σήμα για το τέλος μιας ακολουθίας λίστας

Γρήγορο Παράδειγμα Μετατροπής

Για τις περισσότερες περιπτώσεις χρήσης, χρησιμοποιήστε Document.save() απευθείας — οι κλάσεις μετατροπέα ενεργοποιούνται αυτόματα:

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

Περίληψη

ΜετατροπέαςΣκοπός
ParagraphConverterΜετασχηματισμός παραγράφων με μορφοποίηση
TableConverterΜετατροπή πινάκων σε μορφή εξόδου
ListHandlerΔιαχείριση κατάστασης λίστας κατά την εξαγωγή
 Ελληνικά