Extração de narrativas jornalísticas a partir de textos e sua representação numa linguagem de modelos narrativos
Hoje em dia, o conteúdo jornalístico é distribuído em múltiplos formatos, principalmente através da web e de aplicações específicas baseadas na internet, executadas em smartphones e tablets. O texto é um formato muito conveniente, mas os leitores (ou, mais precisamente, os utilizadores ou consumidores de informações) muitas vezes preferem imagens, vídeos, apresentações de slides, gráficos e infografias. O conteúdo textual ainda é a principal representação da informação. Qualquer assunto jornalístico (por exemplo, Trump e a Rússia) é descrito em um ou mais textos produzidos por jornalistas e possivelmente comentados por leitores. Muitos desses assuntos são acompanhados durante dias, semanas ou meses. Para compreender um conjunto possivelmente vasto e possivelmente complexo de artigos noticiosos interligados, os leitores ganhariam enormemente em ter ferramentas que resumem esses artigos, mostram os principais atores, a sua interação e as suas trajetórias no tempo e no espaço, as suas motivações, os principais eventos, relações causais de eventos e resultados. No projeto Text2Story utilizamos Inteligência Artificial, Ciência da Computação e Linguística para extrair automaticamente esses elementos narrativos usando uma estrutura semântica bem definida e re-representá-los em formatos que transmitem o essencial da história, mas que são consumidos de forma mais eficiente pelos utilizadores. O projeto é liderado pelo INESC TEC em colaboração com investigadores do Centro de Linguística da U. Porto, da Agência Lusa e do Jornal Público.