Как конвертировать документы с помощью классов конвертера в Python
Как конвертировать документы с помощью классов конвертера
Aspose.Words FOSS for Python использует внутренние классы конвертеров при экспорте документов. Хотя большинство пользователей взаимодействует с Document.save(), понимание классов конвертеров полезно для продвинутых сценариев.
Требования
Установите библиотеку:
pip install aspose-words-foss>=26.4.0Требуется Python 3.10 или новее.
ParagraphConverter
ParagraphConverter преобразует абзацы документа в целевой формат вывода. Ключевые методы:
ParagraphConverter.get_paragraph_info()— извлечь информацию о форматировании из абзацаParagraphConverter.get_run_formatting()— получить форматирование для текстового фрагментаParagraphConverter.format_text()— применить форматирование к текстовому содержимому
TableConverter
TableConverter преобразует таблицы документа в целевой формат (например, таблицы Markdown):
TableConverter.convert()— преобразовать элемент таблицы в формат вывода
ListHandler
ListHandler управляет состоянием списка во время преобразования:
ListHandler.set_reader()— установить контекст чтения документаListHandler.reset()— сбросить состояние отслеживания спискаListHandler.get_list_info()— получить детали элемента списка для абзацаListHandler.format_list_item()— форматировать элемент списка с маркером и отступомListHandler.break_list()— сигнализировать о завершении последовательности списка
Быстрый пример конвертации
Для большинства сценариев использования используйте Document.save() напрямую — классы конвертеров вызываются автоматически:
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)Сводка
| Конвертер | Назначение |
|---|---|
ParagraphConverter | Преобразовать абзацы с форматированием |
TableConverter | Преобразовать таблицы в формат вывода |
ListHandler | Управлять состоянием списка при экспорте |