Come convertire documenti con le classi Converter in Python

Come convertire documenti con le classi Converter in Python

Come convertire i documenti con le classi Converter

Aspose.Words FOSS for Python utilizza classi convertitore interne durante l’esportazione del documento. Sebbene la maggior parte degli utenti interagisca con Document.save(), comprendere le classi convertitore è utile per scenari avanzati.

Prerequisiti

Installa la libreria:

pip install aspose-words-foss>=26.4.0

Richiede Python 3.10 o versioni successive.

ParagraphConverter

ParagraphConverter trasforma i paragrafi del documento nel formato di output di destinazione. Metodi chiave:

  • ParagraphConverter.get_paragraph_info() — estrarre le informazioni di formattazione da un paragrafo
  • ParagraphConverter.get_run_formatting() — ottenere la formattazione per un run di testo
  • ParagraphConverter.format_text() — applicare la formattazione al contenuto del testo

TableConverter

TableConverter converte le tabelle del documento nel formato di destinazione (ad esempio tabelle Markdown):

  • TableConverter.convert() — convertire un elemento tabella nel formato di output

ListHandler

ListHandler gestisce lo stato della lista durante la conversione:

  • ListHandler.set_reader() — imposta il contesto del lettore di documento
  • ListHandler.reset() — reimposta lo stato di tracciamento dell’elenco
  • ListHandler.get_list_info() — ottieni i dettagli dell’elemento di elenco per un paragrafo
  • ListHandler.format_list_item() — formatta un elemento di elenco con marcatore e rientro
  • ListHandler.break_list() — segnala la fine di una sequenza di elenco

Esempio di conversione rapida

Per la maggior parte dei casi d’uso, usa Document.save() direttamente — le classi di conversione vengono invocate automaticamente:

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

Riepilogo

ConvertitoreScopo
ParagraphConverterTrasformare i paragrafi con formattazione
TableConverterConvertire le tabelle nel formato di output
ListHandlerGestire lo stato delle liste durante l’esportazione
 Italiano