Como visualizar todas as informações ocultas do PDF (autor, data de criação, título, etc. Metadados e propriedades)
Muitos arquivos PDF contêm informações ocultas que não são visíveis ao ler o texto principal, como o nome real do autor, o software usado para editar o arquivo e a data exata de criação. Com esta ferramenta, você pode visualizar esses dados ocultos localmente em apenas alguns passos simples:
- Importar arquivos: Clique na área de importação da pasta com gradiente vermelho acima ou arraste e solte seus arquivos PDF locais diretamente nessa área.
- Análise automática: Uma vez importado, uma lista de arquivos será exibida. O motor PDF analisará silenciosamente os metadados localmente no seu navegador. Após a conclusão, os painéis "Metadados de PDF Info" e "Metadados XML XMP" para cada arquivo serão exibidos automaticamente.
- Visualizar e copiar: Nos painéis de informações exibidos, você pode inspecionar claramente as chaves e valores de várias propriedades. Se necessário, clique no botão "Copiar" no canto superior direito de cada painel para copiar todas as informações para a área de transferência com um clique.
Se você deseja apagar permanentemente esses dados privados, clique no botão "Remover metadados e baixar" no canto superior direito do cartão do arquivo. Depois de processado, uma versão limpa do arquivo PDF (totalmente livre de metadados ocultos) será baixada automaticamente.
Visualizar em lote informações ocultas e propriedades de metadados de múltiplos PDFs
Esta ferramenta suporta totalmente o processamento em lote. Você pode arrastar e soltar ou selecionar vários arquivos PDF de uma só vez:
- Uma vez importados, a contagem total e o índice de cada arquivo serão mostrados. Os metadatos são analisados de forma assíncrona e independente, sem interferir uns nos outros.
- Em cenários de vários arquivos, além de limpar e baixar arquivos individuais, um botão "Baixar tudo" também aparecerá no topo da lista.
- Clicar neste botão remove automaticamente os metadados do Info e as correntes XMP de todos os arquivos importados com sucesso, empacotando-os em um único arquivo ZIP para download.
Que tipos de dados ocultos existem nos PDFs?
Na especificação PDF, os metadatos são armazenados principalmente em dois sistemas coexistentes: o formato tradicional de dicionário PDF Info e o formato moderno de fluxo XMP (Extensible Metadata Platform). Compreender isso ajuda você a gerenciar melhor a privacidade de seus PDFs.
Metadatos de PDF Info
Este é o método de armazenamento de metadatos mais antigo e clássico na especificação PDF. Ele é anexado ao PDF Trailer na forma de pares chave-valor (dicionários). As chaves padrão comuns incluem:
| Chave padrão | Descrição | Contexto técnico |
|---|---|---|
Title | Título | O nome do assunto do arquivo. |
Author | Autor | Normalmente o nome de usuário do software de edição (por exemplo, WPS) que criou o arquivo. |
Subject | Assunto | Uma breve explicação do conteúdo do arquivo PDF. |
Keywords | Palavras-chave | Palavras-chave separadas por vírgulas para pesquisa e arquivamento de documentos. |
Creator | Criador | O nome do software que converteu o documento original em PDF (por exemplo, Microsoft Word). |
Producer | Produtor PDF | O motor subjacente que gerou os bytes finais do PDF (por exemplo, Acrobat Distiller ou Microsoft® Word). |
CreationDate | Data de criação | A hora exata em que o arquivo foi convertido em PDF, geralmente contendo um fuso horário. |
ModDate | Data de modificação | O carimbo de data/hora da última modificação ou salvamento do arquivo PDF. |
Trapped | Indicador de trapping | Indica se o documento foi processado por trapping (o valor é True, False, etc.). |
Atributos personalizados não padrão também podem aparecer neste dicionário. Por exemplo, PDFs exportados de sistemas corporativos geralmente registram pares chave-valor personalizados, como Company ou SourceID.
Metadatos XMP de PDF
XMP (Extensible Metadata Platform) é um sistema de metadatos moderno defendido pela Adobe. Em vez de dicionários simples, ele estrutura os metadatos como um fluxo de dados XML embutido no nó Catalog do PDF.
O XMP é baseado na especificação RDF do W3C, permitindo estruturas de dados altamente complexas (como descrições multilíngues, parâmetros ISO da câmera e declarações de direitos autorais). No entanto, isso significa que os PDFs podem conter uma grande quantidade de dados de privacidade detalados. Ao proteger os arquivos, apenas limpar o dicionário Info é insuficiente; você deve apagar o fluxo XMP para obter proteção total da privacidade física.