Cómo leer los metadatos de imágenes de OneNote en Python

Cómo leer los metadatos de imágenes de OneNote en Python

Cada Image nodo en un documento de OneNote lleva metadatos junto a los bytes de píxeles sin procesar: el nombre de archivo original, las dimensiones de visualización (ancho y alto en puntos), texto alternativo para accesibilidad y, opcionalmente, una URL de hipervínculo si la imagen estaba enlazada. Aspose.Note FOSS para Python expone todos estos campos a través del Image clase.


Requisitos previos

pip install aspose-note

Propiedades de la Imagen

PropiedadTipoDescripción
img.BytesbytesDatos de imagen sin procesar. Escribir en disco con open(name, "wb").write(img.Bytes).
img.FileName`strNone`
img.Width`floatNone`
img.Height`floatNone`
img.AlternativeTextDescription`strNone`
img.AlternativeTextTitle`strNone`
img.HyperlinkUrl`strNone`
img.Tagslist[NoteTag]Etiquetas de OneNote adjuntas a esta imagen (estrella, casilla de verificación, etc.).

Paso 1: Cargar el documento y encontrar imágenes

from aspose.note import Document, Image

doc = Document("MyNotes.one")
images = doc.GetChildNodes(Image)
print(f"Found {len(images)} image(s)")

Paso 2: Leer los metadatos de cada imagen

Proteja todos los campos anulables con is not None antes de usar:

from aspose.note import Document, Image

doc = Document("MyNotes.one")

for i, img in enumerate(doc.GetChildNodes(Image), start=1):
    print(f"\nImage {i}:")
    print(f"  Filename:    {img.FileName or '(no filename)'}")
    print(f"  Size:        {img.Bytes and len(img.Bytes):,} bytes")

    if img.Width is not None and img.Height is not None:
        print(f"  Dimensions:  {img.Width:.1f} × {img.Height:.1f} pts")

    if img.AlternativeTextDescription:
        print(f"  Alt text:    {img.AlternativeTextDescription}")

    if img.HyperlinkUrl:
        print(f"  Hyperlink:   {img.HyperlinkUrl}")

    if img.Tags:
        for tag in img.Tags:
            print(f"  Tag:         {tag.Label or tag.Icon}")

Ejemplo completo: Guardar imágenes con informe de metadatos

from pathlib import Path
from aspose.note import Document, Image

def report_and_save_images(one_path: str, out_dir: str = "images") -> None:
    doc = Document(one_path)
    images = doc.GetChildNodes(Image)
    if not images:
        print("No images found.")
        return

    out = Path(out_dir)
    out.mkdir(exist_ok=True)

    for i, img in enumerate(images, start=1):
        # Determine save name
        name = img.FileName or f"image_{i}.bin"
        dest = out / name

        # Save bytes
        dest.write_bytes(img.Bytes)

        # Report metadata
        dims = (
            f"{img.Width:.0f}×{img.Height:.0f}pts"
            if img.Width is not None and img.Height is not None
            else "unknown size"
        )
        alt = img.AlternativeTextDescription or ""
        link = img.HyperlinkUrl or ""

        print(f"  [{i}] {name}  {dims}"
              + (f"  alt='{alt}'" if alt else "")
              + (f"  url={link}" if link else ""))

    print(f"\nSaved {len(images)} image(s) to '{out_dir}/'")

report_and_save_images("MyNotes.one")

Filtrar imágenes por propiedad

Imágenes con hipervínculos

from aspose.note import Document, Image

doc = Document("MyNotes.one")
linked = [img for img in doc.GetChildNodes(Image) if img.HyperlinkUrl]
for img in linked:
    print(f"{img.FileName or 'image'}{img.HyperlinkUrl}")

Imágenes con texto alternativo

from aspose.note import Document, Image

doc = Document("MyNotes.one")
with_alt = [img for img in doc.GetChildNodes(Image) if img.AlternativeTextDescription]
for img in with_alt:
    print(f"{img.FileName}: {img.AlternativeTextDescription}")

Notas

  • img.Bytes siempre está presente (devuelve b"" para imágenes ilegibles, nunca None) len(img.Bytes) > 0 antes de guardar.
  • img.AlternativeTextTitle puede ser None si el documento fuente no establece un título. Utilice img.AlternativeTextDescription como alternativa.
  • Las dimensiones están en puntos (1 punto = 1/72 de pulgada), coincidiendo con las convenciones de PowerPoint y PDF.

Ver también

 Español