Как да конвертирате документи с класове за конвертиране в Python

Как да конвертирате документи с класове за конвертиране в Python

Как да конвертирате документи с класове за конвертиране

Aspose.Words FOSS for Python използва вътрешни класове за конвертиране по време на експортиране на документи. Въпреки че повечето потребители взаимодействат с Document.save(), разбирането на класовете за конвертиране е полезно за напреднали сценарии.

Предварителни условия

Инсталирайте библиотеката:

pip install aspose-words-foss>=26.4.0

Изисква Python 3.10 или по-нова.

ParagraphConverter

ParagraphConverter преобразува абзаците на документа в целевия изходен формат. Ключови методи:

  • ParagraphConverter.get_paragraph_info() — извличане на информация за форматиране от параграф
  • ParagraphConverter.get_run_formatting() — получаване на форматиране за текстов фрагмент
  • ParagraphConverter.format_text() — прилагане на форматиране към текстово съдържание

TableConverter

TableConverter преобразува таблиците в документа към целевия формат (например Markdown таблици):

  • TableConverter.convert() — конвертиране на елемент от таблица в изходния формат

ListHandler

ListHandler управлява състоянието на списъка по време на конверсия:

  • ListHandler.set_reader() — задаване на контекст на четеца на документа
  • ListHandler.reset() — нулиране на състоянието за проследяване на списъка
  • ListHandler.get_list_info() — получаване на детайли за елемент от списъка за параграф
  • ListHandler.format_list_item() — форматиране на елемент от списъка с маркер и отстъп
  • ListHandler.break_list() — сигнализиране за край на последователност от списъци

Бърз пример за конвертиране

За повечето случаи на употреба използвайте Document.save() директно — класовете за конвертиране се извикват автоматично:

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

Обобщение

КонверторЦел
ParagraphConverterТрансформиране на параграфи с форматиране
TableConverterКонвертиране на таблици към изходен формат
ListHandlerУправление на състоянието на списъка по време на експортиране
 Български