Как конвертировать документы с помощью классов конвертера в Python

Как конвертировать документы с помощью классов конвертера в Python

Как конвертировать документы с помощью классов конвертера

Aspose.Words FOSS for Python использует внутренние классы конвертеров при экспорте документов. Хотя большинство пользователей взаимодействует с Document.save(), понимание классов конвертеров полезно для продвинутых сценариев.

Требования

Установите библиотеку:

pip install aspose-words-foss>=26.4.0

Требуется Python 3.10 или новее.

ParagraphConverter

ParagraphConverter преобразует абзацы документа в целевой формат вывода. Ключевые методы:

  • ParagraphConverter.get_paragraph_info() — извлечь информацию о форматировании из абзаца
  • ParagraphConverter.get_run_formatting() — получить форматирование для текстового фрагмента
  • ParagraphConverter.format_text() — применить форматирование к текстовому содержимому

TableConverter

TableConverter преобразует таблицы документа в целевой формат (например, таблицы Markdown):

  • TableConverter.convert() — преобразовать элемент таблицы в формат вывода

ListHandler

ListHandler управляет состоянием списка во время преобразования:

  • ListHandler.set_reader() — установить контекст чтения документа
  • ListHandler.reset() — сбросить состояние отслеживания списка
  • ListHandler.get_list_info() — получить детали элемента списка для абзаца
  • ListHandler.format_list_item() — форматировать элемент списка с маркером и отступом
  • ListHandler.break_list() — сигнализировать о завершении последовательности списка

Быстрый пример конвертации

Для большинства сценариев использования используйте Document.save() напрямую — классы конвертеров вызываются автоматически:

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

Сводка

КонвертерНазначение
ParagraphConverterПреобразовать абзацы с форматированием
TableConverterПреобразовать таблицы в формат вывода
ListHandlerУправлять состоянием списка при экспорте
 Русский