Cookies
O website necessita de alguns cookies e outros recursos semelhantes para funcionar. Caso o permita, o INESC TEC irá utilizar cookies para recolher dados sobre as suas visitas, contribuindo, assim, para estatísticas agregadas que permitem melhorar o nosso serviço. Ver mais
Aceitar Rejeitar
  • Menu
Descrição

Inferência de entidades e propriedades para arquivos semânticos

O Arquivo Nacional da Torre do Tombo, TT a seguir, é a espinha dorsal da memória nacional portuguesa, gerida pela DGLAB, o parceiro do EPISA na administração pública. O arquivo tem a coleção de património cultural mais relevante, largamente digitalizada e acedida tanto por investigadores de História como por leigos dos países de língua portuguesa e de outras. O vasto volume de metadados de descrição arquivística ajudam-nos a encontrar e contextualizar os documentos que procuram. Na dianteira do mundo dos arquivos, a TT definiu o seu próprio sistema de descrição online há 20 anos, seguindo as normas do Conselho Internacional de Arquivos (ICA). Os metadados na TT são na maior parte descrições textuais do contexto e conteúdo de documentos. Entretanto os objetos de arquivo evoluíram para incluir cada vez mais informação nascida digital e os requisitos de interoperabilidade em repositórios de património cresceram. É necessária uma nova geração de ferramentas de descrição que inclua bibliotecas, arquivos e museus, com um grão mais fino , mais flexível e especialmente mais facilmente processável por máquinas. Estas são as caraterísticas dos dados abertos ligados (LOD) nas redes semânticas e o trabalho preliminar da TT neste domínio levou a escolher o CIDOC Conceptual Reference Model (CRM)(ISO, 2014), uma norma desenvolvida pela comunidade dos museus. O modelo concetual do CIDOC CRM é um grafo onde os nós são entidades e as arestas são relações. O grande passo representado por esta mudança de paradigma levanta várias questões, algumas das quais este projeto se dedica a resolver. O primeiro problema é a migração efetiva entre as normas ICA e as do CIDOC CRM, que usa tanto os modelos de tradução existentes como a inferência das novas relações com métodos semi-automatizados. O segundo problema é o suporte à descrição, com ferramentas que automatizam parte da geração dos registos de metadados mais complexos do CIDOC CRM. O terceiro tem a ver com interfaces para utilizadores humanos e máquinas, melhorando o acesso dos utilizadores aos arquivos e promovendo a interoperabilidade tanto com arquivos como com redes semânticas globais. O papel da TT como grande instituição de arquivos (reúne a sede em Lisboa e a maioria dos arquivos distritais) e como regulador para arquivos do estado, municipais e privados, garante o impacto dos resultados do projeto se a mudança de paradigma se efetuar. O extenso registo de inovação da TT torna-a uma voz respeitada na discussão em curso sobre a evolução dos arquivos. Esperam-se três impactos principais do projeto. A alteração proposta nos metadados do património cultural dará aos utilizadores um maior conhecimento do repositório e melhores ferramentas para a pesquisa. O segundo impacto é a presença nos agregadores, especialmente a Europeana, que já usa uma abordagem semelhante na descrição. O terceiro é o potencial para lidar com metadados em diferentes plataformas, de ficheiros Excel a sistemas de descrição arquivística, assim contribuindo para a integração de recursos administrativos e de investigação no Arquivo Digital da Administração Pública.

Detalhes

Mais Informação

  • Acrónimo

    EPISA
  • Início

    01 janeiro 2019
  • Orçamento global

    299.237,50 €
  • Estado

    Completo
  • Data de encerramento

    31 dezembro 2022
  • Fim

    31 dezembro 2022
  • Responsável

    Carla Lopes
  • Financiamento

    251.175,00 €
    • Financiado por

    Equipa