Как читать метаданные изображений из OneNote в Python
Каждый Image узел в документе OneNote содержит метаданные рядом с необработанными байтами пикселей: оригинальное имя файла, размеры отображения (ширина и высота в пунктах), альтернативный текст для доступности и, при желании, URL гиперссылки, если изображение было связано. Aspose.Note FOSS для Python раскрывает все эти поля через Image класс.
Требования
pip install aspose-noteСвойства изображения
| Свойство | Тип | Описание |
|---|---|---|
img.Bytes | bytes | Необработанные данные изображения. Записать на диск с помощью open(name, "wb").write(img.Bytes). |
img.FileName | `str | None` |
img.Width | `float | None` |
img.Height | `float | None` |
img.AlternativeTextDescription | `str | None` |
img.AlternativeTextTitle | `str | None` |
img.HyperlinkUrl | `str | None` |
img.Tags | list[NoteTag] | Теги OneNote, прикреплённые к этому изображению (звёздочка, флажок и т.д.). |
Шаг 1: Загрузить документ и найти изображения
from aspose.note import Document, Image
doc = Document("MyNotes.one")
images = doc.GetChildNodes(Image)
print(f"Found {len(images)} image(s)")Шаг 2: Прочитать метаданные для каждого изображения
Защищайте все nullable‑поля с помощью is not None перед использованием:
from aspose.note import Document, Image
doc = Document("MyNotes.one")
for i, img in enumerate(doc.GetChildNodes(Image), start=1):
print(f"\nImage {i}:")
print(f" Filename: {img.FileName or '(no filename)'}")
print(f" Size: {img.Bytes and len(img.Bytes):,} bytes")
if img.Width is not None and img.Height is not None:
print(f" Dimensions: {img.Width:.1f} × {img.Height:.1f} pts")
if img.AlternativeTextDescription:
print(f" Alt text: {img.AlternativeTextDescription}")
if img.HyperlinkUrl:
print(f" Hyperlink: {img.HyperlinkUrl}")
if img.Tags:
for tag in img.Tags:
print(f" Tag: {tag.Label or tag.Icon}")Полный пример: Сохранить изображения с отчетом о метаданных
from pathlib import Path
from aspose.note import Document, Image
def report_and_save_images(one_path: str, out_dir: str = "images") -> None:
doc = Document(one_path)
images = doc.GetChildNodes(Image)
if not images:
print("No images found.")
return
out = Path(out_dir)
out.mkdir(exist_ok=True)
for i, img in enumerate(images, start=1):
# Determine save name
name = img.FileName or f"image_{i}.bin"
dest = out / name
# Save bytes
dest.write_bytes(img.Bytes)
# Report metadata
dims = (
f"{img.Width:.0f}×{img.Height:.0f}pts"
if img.Width is not None and img.Height is not None
else "unknown size"
)
alt = img.AlternativeTextDescription or ""
link = img.HyperlinkUrl or ""
print(f" [{i}] {name} {dims}"
+ (f" alt='{alt}'" if alt else "")
+ (f" url={link}" if link else ""))
print(f"\nSaved {len(images)} image(s) to '{out_dir}/'")
report_and_save_images("MyNotes.one")Фильтрация изображений по свойству
Изображения с гиперссылками
from aspose.note import Document, Image
doc = Document("MyNotes.one")
linked = [img for img in doc.GetChildNodes(Image) if img.HyperlinkUrl]
for img in linked:
print(f"{img.FileName or 'image'} → {img.HyperlinkUrl}")Изображения с альтернативным текстом
from aspose.note import Document, Image
doc = Document("MyNotes.one")
with_alt = [img for img in doc.GetChildNodes(Image) if img.AlternativeTextDescription]
for img in with_alt:
print(f"{img.FileName}: {img.AlternativeTextDescription}")Примечания
img.Bytesвсегда присутствует (возвращаетb""для нечитаемых изображений, никогдаNone). Проверьтеlen(img.Bytes) > 0перед сохранением.img.AlternativeTextTitleможет бытьNoneесли исходный документ не задаёт заголовок. Используйтеimg.AlternativeTextDescriptionв качестве резервного варианта.- Размеры указаны в точках (1 пункт = 1/72 дюйма), соответствующий конвенциям PowerPoint и PDF.