Hur man konverterar dokument med konverterarklasser i Python
Hur man konverterar dokument med konverterarklasser
Aspose.Words FOSS for Python använder interna konverterarklasser vid dokumentexport. Även om de flesta användare interagerar med Document.save(), är förståelse för konverterarklasserna användbar för avancerade scenarier.
Förutsättningar
Installera biblioteket:
pip install aspose-words-foss>=26.4.0Kräver Python 3.10 eller senare.
ParagraphConverter
ParagraphConverter omvandlar dokumentparagrafer till målutdataformatet. Nyckelmetoder:
ParagraphConverter.get_paragraph_info()— extrahera formateringsinformation från ett styckeParagraphConverter.get_run_formatting()— hämta formatering för ett textsegmentParagraphConverter.format_text()— tillämpa formatering på textinnehåll
Tabellkonverterare
TableConverter konverterar dokumenttabeller till målformatet (t.ex. Markdown‑tabeller):
TableConverter.convert()— konvertera ett tabell‑element till utdataformatet
ListHandler
ListHandler hanterar listtillstånd under konvertering:
ListHandler.set_reader()— ange dokumentläsarkontextenListHandler.reset()— återställ listspårningstillståndetListHandler.get_list_info()— hämta listobjektsdetaljer för ett styckeListHandler.format_list_item()— formatera ett listobjekt med markör och indragListHandler.break_list()— signalera slutet på en listsekvens
Snabbt konverteringsexempel
För de flesta användningsfall, använd Document.save() direkt — konverterarklasserna anropas automatiskt:
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)Sammanfattning
| Konverterare | Syfte |
|---|---|
ParagraphConverter | Transformera stycken med formatering |
TableConverter | Konvertera tabeller till utdataformat |
ListHandler | Hantera listtillstånd under export |