Cách Chuyển Đổi Tài Liệu bằng Các Lớp Converter trong Python
Cách Chuyển Đổi Tài Liệu bằng Các Lớp Converter
Aspose.Words FOSS for Python sử dụng các lớp chuyển đổi nội bộ trong quá trình xuất tài liệu. Mặc dù hầu hết người dùng tương tác với Document.save(), việc hiểu các lớp chuyển đổi là hữu ích cho các kịch bản nâng cao.
Điều kiện tiên quyết
Cài đặt thư viện:
pip install aspose-words-foss>=26.4.0Yêu cầu Python 3.10 trở lên.
ParagraphConverter
ParagraphConverter chuyển đổi các đoạn văn của tài liệu sang định dạng đầu ra mục tiêu. Các phương pháp chính:
ParagraphConverter.get_paragraph_info()— trích xuất thông tin định dạng từ một đoạn vănParagraphConverter.get_run_formatting()— lấy định dạng cho một đoạn văn bảnParagraphConverter.format_text()— áp dụng định dạng cho nội dung văn bản
TableConverter
TableConverter chuyển đổi các bảng trong tài liệu sang định dạng đích (chẳng hạn như các bảng Markdown):
TableConverter.convert()— chuyển đổi một phần tử bảng sang định dạng đầu ra
ListHandler
ListHandler quản lý trạng thái danh sách trong quá trình chuyển đổi:
ListHandler.set_reader()— đặt ngữ cảnh trình đọc tài liệuListHandler.reset()— đặt lại trạng thái theo dõi danh sáchListHandler.get_list_info()— lấy chi tiết mục danh sách cho một đoạn vănListHandler.format_list_item()— định dạng mục danh sách với dấu đánh dấu và thụt lềListHandler.break_list()— tín hiệu kết thúc chuỗi danh sách
Ví dụ chuyển đổi nhanh
Đối với hầu hết các trường hợp sử dụng, hãy sử dụng Document.save() trực tiếp — các lớp chuyển đổi sẽ được gọi tự động:
import aspose.words_foss as aw
doc = aw.Document("input.docx")
doc.save("output.pdf", aw.SaveFormat.PDF)Tóm tắt
| Trình chuyển đổi | Mục đích |
|---|---|
ParagraphConverter | Chuyển đổi các đoạn văn có định dạng |
TableConverter | Chuyển đổi bảng sang định dạng đầu ra |
ListHandler | Quản lý trạng thái danh sách trong quá trình xuất |