Relatório Técnico

Tarefas desenvolvidas no intuito de recuperar e disponibilizar as informações do CD-Rom Boletim da Filmoteca Ultramarina Portuguesa:

Recuperação do texto:

  • revisão e reestruturação dos conteúdos, efetuada, quando possível, com recurso a scripts automáticos programados em Python;
  • adaptação dos conteúdos a formatos web;
  • preparação para a codificação automática dos conteúdos.

Transformação em base de dados (em curso):

  • estudo do plano editorial;
  • identificação dos marcadores mais usuais na descrição de cada espécime documental;
  • desenvolvimento de scripts em Python (por vezes, mais de um por volume) para o reconhecimento dos vários componentes das entradas (cota, data, local, instituição arquivística...) e de maneira a grafá-los com maior uniformidade.

Revisão de conteúdos (em curso):

  • verificação e correção dos resultados obtidos através dos scripts automáticos;
  • introdução de três novos campos classificativos: "cidade", "entidade custodial" e "fundo/ tipo de unidade ou coleção".

Entre os CD-Roms já restaurados, este é certamente o mais complexo e o que demanda maior trabalho no tratamento de dados, por causa das próprias características editoriais do Boletim.

Ivo Santos

CIDEHUS
Compete2020
Portugal 2020
UE
FCT
CCBY