Cómo ver toda la información oculta de un PDF (autor, fecha de creación, título, etc. Metadatos y propiedades)
Muchos archivos PDF contienen información oculta que no es visible al leer el texto principal, como el nombre real del autor, el software utilizado para editar el archivo y la fecha exacta de creación. Con esta herramienta, puede ver estos datos ocultos localmente en solo unos sencillos pasos:
- Importar archivos: Haga clic en el área de importación de la carpeta con gradiente rojo de arriba, o arrastre y suelte sus archivos PDF locales directamente en esa área.
- Análisis automático: Una vez importados, se mostrará una lista de archivos. El motor PDF analizará silenciosamente los metadatos localmente en su navegador. Al finalizar, los paneles "Metadatos de PDF Info" y "Metadatos XML XMP" de cada archivo se mostrarán automáticamente.
- Ver y copiar: En los paneles de información mostrados, puede inspeccionar claramente las claves y los valores de varias propiedades. Si lo necesita, haga clic en el botón "Copiar" en la esquina superior derecha de cada panel para copiar toda la información a su portapapeles con un solo clic.
Si desea borrar permanentemente estos datos privados, haga clic en el botón "Eliminar metadatos y descargar" en la esquina superior derecha de la tarjeta del archivo. Una vez procesado, se descargará automáticamente una versión limpia del archivo PDF (completamente libre de metadatos ocultos).
Ver por lotes la información oculta y las propiedades de metadatos de múltiples PDF
Esta herramienta es totalmente compatible con el procesamiento por lotes. Puede arrastrar y soltar o seleccionar varios archivos PDF a la vez:
- Una vez importados, se mostrará el recuento total y el índice de cada archivo. Los metadatos se analizan de forma asíncrona e independiente sin interferir entre sí.
- En escenarios de varios archivos, además de limpiar y descargar archivos individuales, también aparecerá un botón "Descargar todo" en la parte superior de la lista.
- Al hacer clic en este botón, se eliminan automáticamente los metadatos Info y los flujos XMP de todos los archivos importados con éxito, empaquetándolos en un solo archivo ZIP para su descarga.
¿Qué tipos de datos ocultos existen en los PDF?
En la especificación PDF, los metadatos se almacenan principalmente en dos sistemas coexistentes: el formato tradicional de diccionario PDF Info y el formato moderno de flujo XMP (Extensible Metadata Platform). Entender esto le ayuda a administrar mejor la privacidad de sus PDF.
Metadatos de PDF Info
Este es el método de almacenamiento de metadatos más antiguo y clásico en la especificación PDF. Se añade al final del archivo PDF en forma de pares clave-valor (diccionarios). Las claves estándar comunes incluyen:
| Clave estándar | Descripción | Contexto técnico |
|---|---|---|
Title | Título | El nombre del tema del archivo. |
Author | Autor | Normalmente el nombre de usuario del software de edición (por ejemplo, WPS) que creó el archivo. |
Subject | Asunto | Una breve explicación del contenido del archivo PDF. |
Keywords | Palabras clave | Palabras clave separadas por comas para la búsqueda y el archivado de documentos. |
Creator | Creador | El nombre del software que convirtió el documento original a PDF (por ejemplo, Microsoft Word). |
Producer | Productor PDF | El motor subyacente que generó los bytes de PDF finales (por ejemplo, Acrobat Distiller o Microsoft® Word). |
CreationDate | Fecha de creación | La hora exacta en que el archivo se convirtió a PDF, que generalmente contiene una compensación de zona horaria. |
ModDate | Fecha de modificación | La marca de tiempo de la última modificación o guardado del archivo PDF. |
Trapped | Indicador de reventado | Indica si el documento ha sido procesado con reventado (el valor es True, False, etc.). |
Los atributos personalizados no estándar también pueden aparecer en este diccionario. Por ejemplo, los PDF exportados desde sistemas empresariales a menudo registran pares clave-valor personalizados como Company o SourceID.
Metadatos XMP de PDF
XMP (Extensible Metadata Platform) es un sistema moderno de metadatos defendido por Adobe. En lugar de diccionarios simples, estructura los metadatos como un flujo de datos XML incrustado dentro del nodo Catalog del PDF.
XMP se basa en la especificación RDF de W3C, lo que permite estructuras de datos altamente complejas (como descripciones multilingües, parámetros ISO de cámara y declaraciones de derechos de autor). Sin embargo, esto significa que los PDF pueden contener una gran cantidad de datos de privacidad detallados. Al asegurar los archivos, simplemente borrar el diccionario Info es insuficiente; debe borrar el flujo XMP para lograr una protección completa de la privacidad física.