Cómo leer los metadatos de imágenes de OneNote en Python
Cada Image nodo en un documento de OneNote lleva metadatos junto a los bytes de píxeles sin procesar: el nombre de archivo original, las dimensiones de visualización (ancho y alto en puntos), texto alternativo para accesibilidad y, opcionalmente, una URL de hipervínculo si la imagen estaba enlazada. Aspose.Note FOSS para Python expone todos estos campos a través del Image clase.
Requisitos previos
pip install aspose-notePropiedades de la Imagen
| Propiedad | Tipo | Descripción |
|---|---|---|
img.Bytes | bytes | Datos de imagen sin procesar. Escribir en disco con open(name, "wb").write(img.Bytes). |
img.FileName | `str | None` |
img.Width | `float | None` |
img.Height | `float | None` |
img.AlternativeTextDescription | `str | None` |
img.AlternativeTextTitle | `str | None` |
img.HyperlinkUrl | `str | None` |
img.Tags | list[NoteTag] | Etiquetas de OneNote adjuntas a esta imagen (estrella, casilla de verificación, etc.). |
Paso 1: Cargar el documento y encontrar imágenes
from aspose.note import Document, Image
doc = Document("MyNotes.one")
images = doc.GetChildNodes(Image)
print(f"Found {len(images)} image(s)")Paso 2: Leer los metadatos de cada imagen
Proteja todos los campos anulables con is not None antes de usar:
from aspose.note import Document, Image
doc = Document("MyNotes.one")
for i, img in enumerate(doc.GetChildNodes(Image), start=1):
print(f"\nImage {i}:")
print(f" Filename: {img.FileName or '(no filename)'}")
print(f" Size: {img.Bytes and len(img.Bytes):,} bytes")
if img.Width is not None and img.Height is not None:
print(f" Dimensions: {img.Width:.1f} × {img.Height:.1f} pts")
if img.AlternativeTextDescription:
print(f" Alt text: {img.AlternativeTextDescription}")
if img.HyperlinkUrl:
print(f" Hyperlink: {img.HyperlinkUrl}")
if img.Tags:
for tag in img.Tags:
print(f" Tag: {tag.Label or tag.Icon}")Ejemplo completo: Guardar imágenes con informe de metadatos
from pathlib import Path
from aspose.note import Document, Image
def report_and_save_images(one_path: str, out_dir: str = "images") -> None:
doc = Document(one_path)
images = doc.GetChildNodes(Image)
if not images:
print("No images found.")
return
out = Path(out_dir)
out.mkdir(exist_ok=True)
for i, img in enumerate(images, start=1):
# Determine save name
name = img.FileName or f"image_{i}.bin"
dest = out / name
# Save bytes
dest.write_bytes(img.Bytes)
# Report metadata
dims = (
f"{img.Width:.0f}×{img.Height:.0f}pts"
if img.Width is not None and img.Height is not None
else "unknown size"
)
alt = img.AlternativeTextDescription or ""
link = img.HyperlinkUrl or ""
print(f" [{i}] {name} {dims}"
+ (f" alt='{alt}'" if alt else "")
+ (f" url={link}" if link else ""))
print(f"\nSaved {len(images)} image(s) to '{out_dir}/'")
report_and_save_images("MyNotes.one")Filtrar imágenes por propiedad
Imágenes con hipervínculos
from aspose.note import Document, Image
doc = Document("MyNotes.one")
linked = [img for img in doc.GetChildNodes(Image) if img.HyperlinkUrl]
for img in linked:
print(f"{img.FileName or 'image'} → {img.HyperlinkUrl}")Imágenes con texto alternativo
from aspose.note import Document, Image
doc = Document("MyNotes.one")
with_alt = [img for img in doc.GetChildNodes(Image) if img.AlternativeTextDescription]
for img in with_alt:
print(f"{img.FileName}: {img.AlternativeTextDescription}")Notas
img.Bytessiempre está presente (devuelveb""para imágenes ilegibles, nuncaNone)len(img.Bytes) > 0antes de guardar.img.AlternativeTextTitlepuede serNonesi el documento fuente no establece un título. Utiliceimg.AlternativeTextDescriptioncomo alternativa.- Las dimensiones están en puntos (1 punto = 1/72 de pulgada), coincidiendo con las convenciones de PowerPoint y PDF.