O que é PDF e PDF/A ?

O que é PDF?

 

Em 1991, um dos fundadores da Adobe, o doutor John Warnock, iniciou um projeto chamado de “O projeto Camelot”. A intenção era criar um formato de arquivo onde todo mundo pudesse visualizar em qualquer computador. Em 1992 o Camelot se tornou o formato PDF.

PDF(Formato de Documento Portável) É um formado de arquivo criado pela empresa Adobe Systems. Essa é a mesma empresa que criou o famoso programa Photoshop.

Esse formado de arquivo foi criado com a intensão de ser portátil e independente de dispositivo ou resolução de tela.

Um arquivo pdf pode conter textos, imagens ou gráficos.

Um arquivo pdf pode ser visualizado usando alguns programas, como o

  • adobe reader
  • o navegador Chrome
  • Foxit Reader

 

O que é PDF/A ?

 

PDF/A(Formato de Documento Portátil  Arquivável). É uma variação do PDF e foi desenvolvido para arquivamento a longo prazo.

PDF/A  é um dos poucos tipos de arquivos que garante ao usuário que será aberto e visualizado após muitos anos, da mesma forma como o deixou/viu no passado e sem perder a sua estrutura

O que Há de Diferente no Formato PDF/A?

O que faz um arquivo no formato PDF/A  se manter visível/legível por muito tempo são 3 características

  1. Completude:  O Arquivo PDF/A é completo; Tudo o que é necessário para vermos está dentro dele, como texto, imagens, gráficos, fontes e informações de cores. Assim, não é permitido anexos ao arquivo, e é proibido fontes externas.  Porém, é aceito o uso de anotações que aponte para  outro arquivo(exemplo, hiperlinks).
  2. Auto Documentado: Dentro dos arquivos em formato PDF/A existem informações descritivas, ou seja, informações sobre o arquivo. Informação sobre o autor do documento, a data de criação, o local etc.
    A essas informações que descrevem o arquivo chamamos de Metadados. temos em nosso site alguns artigos sobre metadados, veja aqui: https://gnulinuxbrasil.com.br/?s=metadado
    Graças aos metadados podemos fazer buscas usando palavras-chave nas pastas, buscando pelo autor ou a data de criação do documento. Podemos ainda ao baixar um arquivo da internet ver quem o criou e quando.
  3. Independência: O formato PDF/A é independente, não está vinculado ou obrigado a ser exibido em somente um certo dispositivo, computador, programa. Não é subordinado a versões ou empresas. PDF/A possui padrões de cores comuns a todos os programas e dispositivos, assim um pdf/a pode ser exibido ou impresso sem dificuldades.

Versões de PDF/A

Abbr. Subtítulo Publicado padrão/Standard Baseado em Ref.
PDF/A-1 Parte 1: Uso de PDF 1.4 2005-09-28 ISO 19005-1 PDF 1.4 (Adobe Systems, Referência PDF , 3ª edição) [2]
PDF/A-2 Parte 2: Uso de ISO 32000-1 2011-06-20 ISO 19005-2 PDF 1.7 (ISO 32000-1:2008) [3]
PDF/A-3 Parte 3: Uso de  ISO 32000-1 com suporte para arquivos incorporados 2012-10-15 ISO 19005-3 PDF 1.7 (ISO 32000-1:2008) [4]

Os Arquivos PDF/A possuem níveis de conformidade, o nível B e o Nível A.

  • B é a inicial da palavra Básico: Arquivos PDF/A nesse nível requerem apenas os padrões mínimos para que sejam exibidos de forma apropriada e a longo prazo.
  • A é a inicial da palavra Acessibilidade: esse nível A inclui os requisitos do nível B mais alguns outros de acessibilidade(para pessoas com algum grau de deficiência)

PDF/A-1

Essa parte 1 foi inicialmente publicada em 28 de setembro de 2005 e tem dois níveis de conformidades para arquivos pdf:

  • PDF/A-1b =  Nível básico de conformidade
  • PDF/A-1a = Nível A de Acessibilidade para conformidade

 

O nível B requer apenas os padrões necessários para o documento seja exibido futuramente com o mesmo visual adequado  de quando foi criado.

O nível A inclui todos os  requerimentos do nível B e mais:

  • Especificação de linguagem
  • Estrutura hierárquica do documento
  • Texto descritivos para imagens e símbolos. Por exemplo, uma imagem com descrições auxilia que programas leiam essas descrições para deficientes visuais.
  • Todos os caracteres(letras, números, símbolos) sejam mapeados para Unicode.

 

O nível A tem a intenção de aumentar a acessibilidade para pessoas com alguma deficiência física. Assim, os programas/software pode ler o arquivo e auxiliar às pessoas de modo eficiente. Como exemplo de programas temos os programas leitores de tela para deficiente visual.

PDF/A-2

O padrão PDF/A-2 foi publicado em 20 de junho de 2011.

É baseado em pdf 1.7 e assim traz para o PDF/A algumas das novas funções disponíveis nas versões 1.5, 1.6 e 1.7 de arquivos pdf.

Lembrando que PDF/A-1 é baseado em pdf versão 1.4.

Novas funções adicionas ao PDF/A-2 são:

  • compatibilidade com imagens compactadas com JPEG 2000
  • Suporte para efeitos transparentes e camadas
  • Incorpora fontes OpenType
  • Preparado para receber assinaturas digitais PAdES(Assinaturas eletrônicas PDFs avançadas)
  • Pode incorporar outros PDF/A. Lembrando que PDF/A não pode ficar dependente de arquivos ou itens externos, então incorporar tudo aquilo que seria externo é o aceito para o padrão.

Níveis para PDF/A-2

 

Nível B = o mesmo significado para PDF/A-1b
Nível A = o mesmo significado para PDF/A-1a
Nível U = além de ter o requisitado para o nível b o PDF/A-2u requer que todo o texto no documento tenha a referência(mapeamento) Unicode.

 

PDF/A-3

Padrão publicado em 15 de outubro de 2012.

Se difere de PDF/A-2 em apenas uma coisa: PDF/A-3 aceita incorporar uma quantidade muito maior de tipo de arquivos, como doc, xls, csv, xml etc.

 

Outros Pontos Importantes sobre PDF\A

  • Vídeo e Áudios são proibidos
  • JavaScript e inicialização de programas não são permitidos.
  • Todas as fontes devem estar incorporadas dentro do PDF/A . Isso também vale para as chamadas fontes PostScripts(exemplo, Times e Helvetiva)
  • Cores independentes de dispositivos
  • criptografia é proibida
  • Uso de padrões de metadados é um requisito
  • LZW (Compressão sem Perda de qualidade) devido a restrições de propriedade intelectual.
  • Imagens compactadas usando JPEG 2000 não são permitidas dentro de PDF\A-1. Isso poque PDF\A-1 é baseado em pdf 1.4 e JPEG 2000 foi introduzido apenas a partir do pdf 1.5.
    Existem 3 formatos de PDF/A:
    PDF/A-1 baseado em pdf 1.4,
    PDF/A-2 baseado em pdf 1.7
    PDF/A-3 baseado também em pdf 1.7Então, JPEG 2000 é permitido apenas em PDF/A-2 e PDF/A-3.
  • Objetos transparentes e camadas são permitidos apenas em  PDF/A-2.
  • Assinatura Digitais no padrão PAdES é suportada em PDF\A-2, mas não em PDF/A-1
  • PDF/A-2 aceita incorporar outros arquivos PDF/A
  • PDF/A-3 aceita que arquivos de qualquer formato sejam incorporados. Exemplo, arquivos xml, doc, pdf.
  • Não se pode criar senha de segurança em arquivos PDF/A como é comum em arquivos PDFs. É habitual encontrarmos arquivos PDFs que só abrem se digitarmos uma senha.  Mas PDF/A não pode ser dependente a uma fonte/intervenção externa. Isso nos dá a garantia de longo-prazo.

 

Como Criar um Arquivo no Formato PDF\A?

Diversos programas possibilitam a criação de PDF/A.

Não quero me aprofundar aqui, mas

  • no word, quando clicamos em salvar e nos é apresentado a caixa de diálogo, podemos definir o tipo de arquivo para PDF, clicar no botão opções e em seguida escolher PDF/A.
  • Temos também o pdfCreator, no qual podemos alterar o perfil de pdf para pdf/a.
  • Temos o GhostScript. Uma liguagem onde podemos converter via linha de comando arquivos pdf para pdf/a. segue exemplo de código que faria isso:

gs -dPDFA -dBATCH -dNOPAUSE -sColorConversionStrategy=UseDeviceIndependentColor -sDEVICE=pdfwrite -dPDFACompatibilityPolicy=2 -sOutputFile=novo_arquivoPDFA_gerado.pdf ./arquivoPDF_a_ser_convertido.pdf

Validar um Arquivo PDF\A

 

Ao criar ou converter um arquivo para PDF\A é recomendado validarmos o arquivo e vermos se realmente está de acordo com as normas  ou padrões.

Podemos validar o arquivo usando sites online como

 

Bastando enviar(upload) o arquivo para umas das páginas acima e clicar no botão validar correspondente. De acordo com o anunciando nessas páginas, o arquivo enviado é excluído assim que clicamos em validar. Não fica armazenado nos servidores.

Há outra opção que prefiro, que é usar um programa instalado em nosso computador para que a validação do PDF\A não possa depender de internet. O programa que recomendo aqui é o programa validador “verapdf“. Ele é multiplataforma, assim funcionando tanto no Linux, macOS e windows. O programa “verapdf” é feito em java e por isso precisaremos ter o java instalado.

Segue print de tela validando arquivo PDF/A com o programa verapdf

Conclusão

Quando houver uma conversão de arquivos para PDF/A é recomendado que se visualize o documento para verificar se há erros. Sim, erros na visualização é algo comum.  De acordo com o artigo publicado no seguinte link: emerald.com, de 213 arquivos convertidos para PDF/A-1b, 11% foram gerados com algum tipo de erro, como perda de links, perda de conteúdo(caracteres não legíveis, textos apagados, parte do documento faltando). Esse teste usou 3 programas para conversão em massa:  LuraTech PDF Compressor, Adobe Acrobat XI Pro e  3-HeightsTM Document Converter by PDF Tools.

Então tenção durante a criação/conversão de PDF/A!

Fontes: adobe, wikipedia

 

 

Leitor voraz e um dos administradores do GNU/Linux Brasil no Whatsapp, facebook, youtube e nesse dito site: www.gnulinuxbrasil.com.br

2 Comments to “O que é PDF e PDF/A ?”

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *