Cómo se pueden ver o consultar, los distintos tipos de archivos que pueden contener metadatos (PNG, PDF, DOC, JPEG, …) y publicamos una aplicación desarrollada en Delphi que lee los metadatos del los archivos de imagen PNG. También publicamos otra aplicación gratuita con código fuente que obtiene la miniatura (thumbnail) de las imágenes JPEG.

Definición de metadatos

Los metadatos en informática son datos adicionales almacenados en un fichero. Estos datos suelen definir más en profundidad algunas características de un fichero. Por ejemplo, un pdf de Acrobat contiene la información propia (imágenes y texto) y puede contener información adicional que no se ve directamente en forma de metadatos como: título del documento, asunto, autor, cargo del autor, descripción, autor de la descripción, palabras clave, estado de copyright, aviso de copyright, URL de la información sobre copyright, etc.

El uso de los metadatos más frecuente es para mejorar la velocidad y rendimiento de las búsquedas, pues los buscadores pueden buscar previamente en los metadatos antes de hacerlo en todo el contenido del fichero. Usando informaciones adicionales los resultados son más precisos, y el usuario se ahorra filtraciones manuales complementarias.

Otro de los usos de los metadatos es facilitar el flujo de trabajo convirtiendo datos automáticamente de un formato a otro. Para eso es necesario que los metadatos describan el contenido y la estructura de los datos.

Algunos metadatos hacen posible una compresión de datos más eficaz. Por ejemplo, si en un vídeo el software sabe distinguir el primer plano del fondo puede usar algoritmos de compresión diferentes y así mejorar la cuota de compresión.

Estándar para música y vídeos: ID3, AjpdSoft Modificar ID3 MP3

En algunos casos se han definido estándares para metadatos, como es el caso del ID3 que es usado para incluir metadatos (etiquetas) en un archivo contenedor audiovisual, tales como álbum, título o artista. Se utiliza principalmente en ficheros sonoros como MP3.

El etiquetado de ficheros audiovisuales es imprescindible para su catalogación. La clasificación mediante carpetas y nombres de fichero es insuficiente para grandes colecciones ya que solamente facilita un único criterio de búsqueda.

Mediante el etiquetado es posible organizar una colección mediante múltiples criterios. Permite una búsqueda más rápida y sencilla de aquellos archivos que se desean.

A continuación mostramos una aplicación desarrollada en Delphi (con código fuente o source code incluido) completa y gratuita que obtiene los metadatos de un fichero MP3 usando el estándar ID3:

Y esta otra aplicación que permite modificar las etiquetas ID3 de uno o varios ficheros MP3 a la vez:

AjpdSoft Modificar ID3 MP3

Estándares para imágenes: Exif, IPTC, XMP

A continuación indicamos algunos de los estándares más conocidos para guardar metadatos en las imágenes:

  • Exif: Exchangeable image file format es una especificación para formatos de archivos de imagen usado por las cámaras digitales. Fue creado por la Japan Electronic Industry Development Association (JEIDA). La especificación usa los formatos de archivos existentes como JPEG, TIFF y RIFF, el formato de archivo de audio WAVE, a los que se agrega tags específicos de metadatos. No está soportado en JPEG 2000 o PNG.
  • IPTC: es un estándar desarrollado en la década de 1970 por el Consejo de la Prensa Internacional de Telecomunicaciones. Fue desarrollado inicialmente como un estándar para el intercambio de información entre las organizaciones de noticias y ha evolucionado con el tiempo. Alrededor de 1994, Adobe Photoshop «File Info» habilitó un formulario para que los usuarios pudieran insertar y editar los metadatos de IPTC en archivos de imagen digital. Posteriormente fue aprobado por las agencias de fotografía, convirtíéndose en un estándar válido para almacenar metadatos en ficheros de imágenes.
  • XMP: es un nuevo estándar basado en XML, desarrollado por Adobe en 2001. Adobe trabaja con el IPTC para incorporar la antigua «encabezados IPTC» en el nuevo marco de XMP y en 2005 el «esquema básico de IPTC XMP» pliego de condiciones fue puesto en libertad. XMP es un código abierto, estándar público, por lo que es más fácil para los desarrolladores a adoptar la especificación en software de terceros. metadatos XMP se puede añadir a muchos tipos de archivos, pero para imágenes gráficas en general se almacenan en archivos JPEG y TIFF.

Cómo consultar los metadatos de los ficheros PNG, DOC, PDF, XLS, JPEG, AVI

En sistemas operativos Microsoft Windows

En el caso de Microsoft Windows 7, para consultar los metadatos de un fichero png, doc, xls, jpeg, etc., es suficiente con abrir el Explorador de Windows, seleccionaremos el fichero, pulsaremos el botón derecho del ratón y seleccionaremos «Propiedades»:

Cómo consultar los metadatos de los ficheros PNG, DOC, PDF, XLS, JPEG

En la pestaña «Detalles» de la ventana de Propiedades del fichero podremos ver los metadatos adicionales: título, asunto, clasificación, etiquetas, comentarios, autores, fecha de captura, nombre del programa, fecha de adquisición, copyright, etc. Podremos editar muchos de estos metadatos directamente:

Cómo consultar los metadatos de los ficheros PNG, DOC, PDF, XLS, JPEG

Si queremos eliminar todos los metadatos de un fichero, en la ventana anterior pulsaremos en «Quitar propiedades e información personal», en la ventana que aparecerá de «Quitar propiedades» marcaremos «Quitar las siguientes propiedades de este archivo» y seleccionaremos todas o las que deseemos eliminar:

Cómo consultar los metadatos de los ficheros PNG, DOC, PDF, XLS, JPEG

En el caso de ficheros PDF, para consultar los metadatos, tendremos que instalar Adobe Acrobat Reader.

Para el caso de Microsoft Windows XP:

Cómo consultar los metadatos de los ficheros PNG, DOC, PDF, XLS, JPEG

Consultar metadatos de ficheros en GNU Linux Ubuntu

Para el caso del sistema operativo GNU Linux, deberemos instalar alguna aplicación que nos permita consultar los metadatos de los ficheros. Por ejemplo, para consultar metadatos de ficheros de imagen, vídeo, audio, etc. podremos instalar hachoir-metadata. Para instalarlo, en el caso de GNU Linux Ubuntu 10, abriremos una ventana de terminal y ejecutaremos el comando Linux:

sudo apt-get install python-hachoir-metadata

Una vez instalado, para consultar los metadatos de un fichero, será suficiente con escribir el comando:

hachoir ruta_nombre_fichero

Por ejemplo:

hachoir /home/ajpdsoft/captura_ajpdsoft.png

Devolverá algo así:

Metadata:
– Image width: 448 pixels
– Image height: 336 pixels
– Bits/pixel: 24
– Pixel format: YCbCr
– Compression rate: 18.0x
– Compression: JPEG (Baseline)
– Comment: JPEG quality: 86% (approximate)
– Format version: JFIF 1.02
– MIME type: image/jpeg
– Endian: Big endian

AjpdSoft Leer metadatos PNG

AjpdSoft Leer metadatos PNG es una aplicación 100% open source, desarrollada en Borland Delphi 6, gratuita (freeware) que obtiene y muestra los metadatos almacenados en el fichero de imagen PNG (Portable Network Graphics) seleccionado. La aplicación obtiene todos los metadatos de tipo EXt y también permite obtener su valor.

AjpdSoft Leer metadatos PNG

AjpdSoft Modificar ID3 MP3

AjpdSoft Modificar ID3 MP3 es una aplicación 100% open source, desarrollada en Borland Delphi 6, gratuita (freeware) que permite modificar los ID3 Tag de los ficheros MP3 seleccionados. Admite selección de múltiples ficheros MP3. Permite modificar el album, artista, género, comentario, año y pista. Admite las versiones 1.0 y 1.1:

AjpdSoft Modificar ID3 MP3

AjpdSoft Extraer y eliminar miniatura JPG

AjpdSoft Extraer y eliminar miniatura JPG es una aplicación es una aplicación 100% open source, desarrollada en Borland Delphi 6, gratuita (freeware) que extrae la miniatura (thumbnail) de una imagen JPG ó JPEG, si la tiene. Permite guardar la miniatura (thumbnail) de una imagen JPG en un fichero. Por seguridad y por preservar la privacidad, también por ahorrar espacio, es recomendable eliminar la miniatura (thumbnail) que algunas aplicaciones incluyen en los metadatos EXIF de los ficheros JPG o JPEG. AjpdSoft Extraer y eliminar miniatura JPG también permite eliminar esta miniatura.

Seleccionando el fichero de imagen JPG en «Fichero de imagen JPEG», la aplicación mostrará la vista previa de la imagen (a la izquierda) y la vista previa de la miniatura de la imagen (si existe) a la derecha. Si existe miniatura en la imagen JPG, podremos eliminarla pulsando el botón «Eliminar miniatura»:

AjpdSoft Extraer y eliminar miniatura JPG

Antes de eliminarla, la aplicación nos indicará que se creará un nuevo fichero JPG sin la miniatura y se dejará el fichero JPG actual intacto para evitar pérdidas de información:

AjpdSoft Extraer y eliminar miniatura JPG

Seleccionaremos el destino de la imagen JPG sin miniatura (thumbnail):

AjpdSoft Extraer y eliminar miniatura JPG

Si abrimos el fichero guardado anteriormente sin la miniatura (thumbnail) veremos que ya no aparece:

La aplicación también permite guardar la miniatura o thumbnail del fichero JPG en un fichero también JPG, pulsando el botón «Guardar miniatura».

Los metadatos pueden ser peligrosos para la confidencialidad de los datos

Tras mostrar las posibilidades de los metadatos en los distintos tipos de ficheros que permiten albergarlos queda claro que pueden ser muy útiles para catalogar ficheros de forma automática y para una mejor y más rápida búsqueda de información. Pero también queda claro que los metadatos pueden ser peligrosos para la confidencialidad de los datos, imaginemos, por ejemplo, que hemos realizado una fotografía muy personal con una cámara digital, una vez descargada esta foto en el PC, la retocamos con algún software de retoque fotográfico para quitar la parte que no queremos mostrar, la subimos a algún sitio público o la enviamos a algunos amigos. Si el software de retoque no es muy bueno, habrá dejado la miniatura (thumbnail) de la imagen original sin retocar, con lo cual cualquiera, usando una software como AjpdSoft Extraer y eliminar miniatura JPG podrá ver la imagen original.

Siempre que vayamos a publicar o compartir ficheros que puedan contener metadatos (doc, xls, pdf, jpg, png, avi, mpeg, mp3, mp4, etc.) es muy recomendable verificar que los metadatos que contienen no son datos confidenciales. Para ello pueden usarse distintas aplicaciones, como las que hemos mostrado en este artículo:

Por supuesto, existen aplicaciones profesionales en el mercado que permiten consultar y eliminar o modificar los metadatos de los ficheros.

Hay que tener mucha precaución con las fotos obtenidas con cámaras digitales, pues estas suelen incluir metadatos en los ficheros de imagen JPG obtenidos tales como el modelo de la cámara, la fecha de realización de la foto, la miniatura de la imagen original, etc. También con los ficheros de tipo Word (doc, docx) o Excel (xls, xlsx) pues estas aplicaciones ofimáticas suelen guardar el autor del documento como un metadato sin que el usuario se percate de ello.

Por lo tanto, los metadatos bien usados pueden ser muy útiles para catalogar los ficheros pero con desconocimiento pueden ser muy peligrosos para nuestra confidencialidad.