Cách Chuyển Đổi Tài Liệu bằng Các Lớp Converter trong Python

Cách Chuyển Đổi Tài Liệu bằng Các Lớp Converter trong Python

Cách Chuyển Đổi Tài Liệu bằng Các Lớp Converter

Aspose.Words FOSS for Python sử dụng các lớp chuyển đổi nội bộ trong quá trình xuất tài liệu. Mặc dù hầu hết người dùng tương tác với Document.save(), việc hiểu các lớp chuyển đổi là hữu ích cho các kịch bản nâng cao.

Điều kiện tiên quyết

Cài đặt thư viện:

pip install aspose-words-foss>=26.4.0

Yêu cầu Python 3.10 trở lên.

ParagraphConverter

ParagraphConverter chuyển đổi các đoạn văn của tài liệu sang định dạng đầu ra mục tiêu. Các phương pháp chính:

  • ParagraphConverter.get_paragraph_info() — trích xuất thông tin định dạng từ một đoạn văn
  • ParagraphConverter.get_run_formatting() — lấy định dạng cho một đoạn văn bản
  • ParagraphConverter.format_text() — áp dụng định dạng cho nội dung văn bản

TableConverter

TableConverter chuyển đổi các bảng trong tài liệu sang định dạng đích (chẳng hạn như các bảng Markdown):

  • TableConverter.convert() — chuyển đổi một phần tử bảng sang định dạng đầu ra

ListHandler

ListHandler quản lý trạng thái danh sách trong quá trình chuyển đổi:

  • ListHandler.set_reader() — đặt ngữ cảnh trình đọc tài liệu
  • ListHandler.reset() — đặt lại trạng thái theo dõi danh sách
  • ListHandler.get_list_info() — lấy chi tiết mục danh sách cho một đoạn văn
  • ListHandler.format_list_item() — định dạng mục danh sách với dấu đánh dấu và thụt lề
  • ListHandler.break_list() — tín hiệu kết thúc chuỗi danh sách

Ví dụ chuyển đổi nhanh

Đối với hầu hết các trường hợp sử dụng, hãy sử dụng Document.save() trực tiếp — các lớp chuyển đổi sẽ được gọi tự động:

import aspose.words_foss as aw

doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)

Tóm tắt

Trình chuyển đổiMục đích
ParagraphConverterChuyển đổi các đoạn văn có định dạng
TableConverterChuyển đổi bảng sang định dạng đầu ra
ListHandlerQuản lý trạng thái danh sách trong quá trình xuất
 Tiếng Việt