Investigadores utilizam indicadores estatísticos e psicolinguísticos para detetar fake news de forma automática
25 maio 2020
No início de maio, a Comissão Europeia registou, diariamente, mais de 2.700 artigos com fake news relacionadas com a covid-19 nas redes sociais, entre publicações falsas ou enganosas. A desinformação foi mesmo considerada a “doença do século” por responsáveis daquele organismo europeu.
É com o objetivo de ajudar o utilizador comum, e sobretudo os jornalistas, a analisar e identificar informação com elevada probabilidade de ser falsa, e também a filtrar o conteúdo mais relevante nas redes sociais, que o Instituto de Engenharia de Sistemas e Computadores, Tecnologia e Ciência (INESC TEC) está a desenvolver o projeto “Detecting Fake News Automatically”.
“O sistema extrai várias informações do post, que considera relevantes. Os indicadores (mais de 100) podem ser psicolinguísticos (por exemplo tentar associar qual a emoção mais predominante no texto), ou estatísticos sobre o texto (por exemplo a frequência de verbos, adjetivos ou entidades) e vão ser posteriormente passados para um modelo de aprendizagem automática, que aprendeu a fazer a distinção com casos previamente conhecidos e que já tinham sido referenciados como fake news no passado. Com base nessa aprendizagem, o modelo classificará com uma certa probabilidade o novo post como sendo ou não fake news”, explica Álvaro Figueira, investigador INESC TEC e professor no Departamento de Ciência de Computadores da Faculdade de Ciências da Universidade do Porto (FCUP).
Recorrendo a técnicas de data mining, aprendizagem automática, processamento em linguagem natural, reconhecimento de entidades mencionadas, análise de sentimento, entre outras, os investigadores esperam que a solução desenvolvida ofereça um maior grau de segurança e garantia de veracidade sobre o conteúdo que se lê nas redes sociais.
“Pretendemos que o sistema utilize a mensagem escrita do post e toda a informação associada a esta, ou seja, os likes, partilhas, comentários, bem como a informação sobre o utilizador que publicou o post. A nossa convicção é que esta informação adicional, associada à mensagem propriamente veiculada, contribua para gerar uma confiança superior na classificação dada pelo sistema”, acrescenta do investigador.
Este projeto surgiu como output do projeto REMINDS, no qual se pretendeu construir um sistema capaz de detetar automaticamente quais os posts das redes sociais (Facebook e Twitter) mais relevantes para o público em geral, de acordo com critérios jornalísticos, após as eleições norte-americanas de 2016, numa altura em que o problema das fake news ganhou uma maior dimensão e em que empresas tecnológicas e a comunidade científica começaram a trabalhar numa solução. No contexto pandémico atual, há variáveis que mudam e é necessário adaptar o sistema a novos desafios.
“Um dos principais desafios que o projeto enfrenta é a mudança de domínio e contexto temporal em que uma fake news pode surgir. Por exemplo, uma fake news num contexto político tem algumas propriedades textuais e lexicais diferentes de uma fake news num contexto da saúde. Portanto, tentar desenvolver um sistema que seja capaz de capturar este tipo de diversidade tem sido uma tarefa desafiante. A pandemia por covid-19, tendo um domínio e contexto específicos, tem sido um caso de estudo muito interessante no universo das fake news. É a nossa opinião que o sistema será capaz de adaptar-se e detetar fake news em qualquer domínio, contribuindo para mitigação deste tipo de conteúdos nas redes sociais”, conclui Álvaro Figueira.
No âmbito deste projeto está ainda a ser desenvolvida pelo investigador do INESC TEC, Nuno Guimarães, a tese com o título "Analyzing and Developing Veracity Indicators for Building an Automatic Detector of Fake News Online". A tese, desenvolvida na FCUP, é supervisionada pelos investigadores do INESC TEC Álvaro Figueira e Luís Torgo.
__________________________________________________
Para mais informações:
Eunice Oliveira
Serviço de Comunicação
INESC TEC
Campus da FEUP
Rua Dr Roberto Frias
4200-465 Porto
Portugal
M +351 934 224 331
eunice.i.oliveira@inesctec.pt
Porto, 25 de maio de 2020