Cómo detectar noticias falsas sobre alimentación

Autores/as de la herramienta científica desarrollada en la Universidad Autónoma de Barcelona (UAB) y del presente artículo, escrito ex-profeso para «Adelantos»:

Cómo detectar noticias falsas sobre alimentación 2

                                  UN SUPUESTO PRÁCTICO

La metodología empleada intenta ver si una frase tiene sustento científico, o no; por ejemplo, si el usuario introduce la afirmación: «los batidos de proteínas son buenos para la salud”, la herramienta intenta ver si esta afirmación tiene soporte científico, extractando la información esencial (batidos proteínas SON buenos salud) y teniendo en cuenta que el usuario podría haber introducido: «los batidos de proteínas NO son buenos para la salud”.
     Con la frase resumida (“batidos proteínas SON buenos salud”) la herramienta intenta buscar si ésta, o similares, se encuentra en diferentes artículos científicos de la base de datos de EFSA. Si, por ejemplo el texto obtenido de la base de datos fuera: “Dado que esos batidos de proteínas aportarían una gran cantidad de ellas, se podría producir un exceso en su consumo; a partir de los 2 gr. por kilo, esta proteína es eliminada por el sistema renal de nuestro cuerpo, lo que conlleva una digestión mucho más lenta y pesada, lo cual, a largo plazo, podría provocar serias patologías, como una insuficiencia renal que afectaría seriamente a la salud. Por todo ello, y siguiendo las opiniones de muchos expertos en nutrición, no es en absoluto recomendable consumir batidos de proteína, ya que una dieta equilibrada aportará todas las proteínas que necesita“.
    
La herramienta buscará la ‘distancia’ (concepto que se emplea para indicar el grado de similitud entre dos textos; si es grande, los textos difieren mucho y, si es pequeña, los textos tienen una similitud alta: distancia = 0 indicaría que son iguales) entre el texto de la afirmación y el obtenido de la fuente científica. Considerando el texto del ejemplo anterior y la afirmación, la herramienta detectará que la distancia es grande indicando que difieren mucho, por lo cual le da una credibilidad baja. La herramienta realiza este procedimiento sobre un conjunto de artículos científicos (mínimo 10) por lo cual se obtiene finalmente una valoración conjunta para después obtener la valoración global.
    
Debe tenerse en cuenta que hay mucho aún por mejorar, y emplear otros algoritmos que permitan ‘entender’ mejor la pregunta/afirmación y los textos de las fuentes científicas; hay que recordar que el proyecto fue realizado en un fin de semana partiendo desde cero.


Por dónde empezamos

     Durante el fin de semana del 21/22 de febrero de 2021 tuvo lugar el “EFSA Hackathon- Fake news detection”, un concurso impulsado por la Autoridad Europea de Seguridad Alimentaria (EFSA), organismo superior en materia de seguridad alimentaria cuya función principal es ofrecer asesoramiento científico y comunicación independientes sobre los riesgos existentes y emergentes de los alimentos a lo largo de la cadena alimentaria, el cual se aplica en la legislación y políticas europeas, con el fin de contribuir a la protección de la salud del consumidor, y el Instituto Europeo de Innovación y Tecnología (EIT), organismo cuya función es fortalecer la capacidad de innovación a nivel de la UE. El concurso propuesto tenía como objetivo el desarrollo de un prototipo de solución de Inteligencia Artificial (IA) para detectar noticias falsas.

     La Universidad Autónoma de Barcelona (UAB) organizó un equipo multidisciplinario de doce investigadores en tecnologías de la información, periodismo y seguridad alimentaria, presentado una metodología y herramienta para detectar noticias falsas a través de Ciencia de Datos (CD); la cual resultó como la propuesta ganadora ante los prototipos presentados por el resto de participantes.
     Una vez más, se ha demostrado que los problemas en un determinado ámbito, como es el objeto de este concurso, la seguridad alimentaria, tratados mediante una visión multidisciplinar, desde perspectivas profesionales distintas, permiten construir un enfoque único y suficientemente robusto, para poder dar respuesta a un problema.

Las ‘noticias falsas’ en el ámbito de la alimentación

     Sin lugar a duda, la alimentación tiene una relación estrecha y directa con la salud humana: una buena alimentación se vincula con la salud, así como una mala alimentación, con la enfermedad. La salud está sujeta a una dimensión objetiva (resultados de pruebas analíticas) y una subjetiva (la percepción de las personas), y en múltiples ocasiones, los alimentos son objeto de esta paradoja. Ambas dimensiones pueden tener efectos positivos y negativos en los consumidores.
     La falta de estudios científicos y comunicación sobre los riesgos en materia de seguridad alimentaria, el exceso de información no contrastada, la diseminación instantánea de contenido a través de internet o, en muchas ocasiones, la falta de conocimiento sobre el tema, son factores que pueden contribuir a la construcción de percepciones erróneas sobre los alimentos y sus propiedades.

Los investigadores formularon deliberadamente seis noticias, tres falsas y tres verdaderas


     Desde su creación en el año 2002, EFSA evalúa los riesgos para la salud humana y animal derivados de los alimentos y piensos a lo largo de la cadena alimentaria, y publica sus conclusiones a través de opiniones científicas. Para este concurso, EFSA formuló ocho noticias sobre nutrición, contaminantes químicos y organismos genéticamente modificados, cuya veracidad debía ser analizada y contrastada con sus opiniones científicas a través de herramientas de IA diseñadas por cada grupo participante. Además, las noticias debían ser clasificadas, de acuerdo con la veracidad de su contenido, entre las siguientes cuatro categorías e intervalos de credibilidad: Verdadera (0,00 – 0,20), Mayoritariamente Cierta (0,21 – 0,59), Mezcla (noticias ciertas y falsas) (0,41 – 0,60) y Falsa (0,61 – 1,00).
     Los investigadores, en el ámbito de la seguridad alimentaria de la UAB, se concentraron en contrastar manualmente las noticias a través del estudio y comparación de sus contenidos con las opiniones científicas de la propia EFSA sobre los temas de cada noticia. La Figura 1 describe el proceso que los investigadores expertos en seguridad alimentaria siguieron para clasificar las ocho noticias formuladas por EFSA.

 

Fig 1. Proceso de contrastación manual de la veracidad de la ocho noticas presuntamente falsas y clasificación entre las categorías Verdadera, Mayoritariamente Cierta, Mezcla (noticias ciertas y falsas) y Falsa.
Fig 1. Proceso de contrastación manual de la veracidad de la ocho noticas presuntamente falsas y clasificación entre las categorías Verdadera, Mayoritariamente Cierta, Mezcla (noticias ciertas y falsas) y Falsa.

     En base a la clasificación manual obtenida, los investigadores en tecnologías de la información, junto con las ocho noticias y las respectivas opiniones científicas de EFSA que justificaban la clasificación obtenida, empezaron a desarrollar la herramienta para realizar esta misma actividad a través de IA, y no de forma manual.
     Adicionalmente, y una vez ya desarrollada la herramienta, los investigadores en el ámbito de la seguridad alimentaria formularon deliberadamente seis noticias, tres falsas y tres verdaderas, con el objetivo de ajustar y validar la metodología y la herramienta propuestas por los investigadores en tecnologías de la información.

Aspectos tecnológicos de la solución

     La solución escogida para abordar este reto (concurso de EFSA sobre detección de fake news 2021) ha sido a través del campo de la Ciencia de Datos (CD). La CD es un área de estudio que implica extraer conocimientos de grandes cantidades de datos utilizando diferentes métodos científicos, algoritmos y procesos, y está respaldado por tres áreas de conocimiento importantes como es el análisis de datos, la estadística y el aprendizaje automático, que ayudan a descubrir patrones dentro de los datos.

Se mide el número mínimo de modificaciones necesarias para cambiar una secuencia por otra y esto se utiliza para decidir si la información de la noticia tiene validez científica o no

   Teniendo en cuenta los desafíos del proyecto y los datos de entrada proporcionados por EFSA, se ha implementado una nueva metodología basada en técnicas de similitud de texto y coincidencia de patrones. La Figura 2 muestra los diferentes bloques y entradas de la solución implementada, donde las noticias de prueba de entrada se procesan utilizando diferentes algoritmos y se analizan con datos de la base de datos de las opiniones científicas de EFSA para generar una clasificación/puntuación. La validación del método se ha realizado considerando la información/opiniones de expertos de la UAB en el campo de la seguridad alimentaria y periodismo.

 

Fig 2. Esquema general de la solución implementada
Fig 2. Esquema general de la solución implementada

El algoritmo más importante para implementar esta solución se basa en la Distancia de Levenshtein y es una métrica para medir la distancia entre dos secuencias de palabras. Es decir, mide el número mínimo de modificaciones necesarias para cambiar una secuencia por la otra y esto se utiliza para decidir si la información de la noticia tiene validez científica o no.
     Para su desarrollo, se utilizó el lenguaje de programación Python y un conjunto de librerías que implementan diferentes métodos que permiten desarrollar, en un corto tiempo, una solución viable al problema tratado. Este lenguaje y sus librerías científicas proporcionan un método excelente para tratar con aplicaciones de ciencia de datos y también es más adecuado para la creación rápida de prototipos.
    
La Figura 3 muestra la aplicación en su formato web que permite la interacción con el usuario, donde se visualizan las métricas de la frase introducida y si la pregunta/afirmación realizada es verdadera o falsa, y su posible clasificación en clickbait (contenido sensacionalista/engañoso para inducir al lector que haga un clic o continúe leyendo; generalmente utilizado con fines de márqueting o para inducir un estado de opinión o publicitar una idea/pensamiento/producto). En este caso, la noticia analizada es “Excess salt is your deadly enemy” (“El exceso de sal es tu enemigo mortal”), y una vez contrastado su contenido con las opiniones científicas de EFSA sobre este tema a través de la aplicación, el resultado es que la noticia tiene una puntuación de credibilidad de 0,86, que se encuentra en el intervalo de 0,61-1,00. Teniendo en cuenta este valor, la noticia es Falsa. Además, la aplicación indica que se trata de un posible clickbait.
    
Esta herramienta es una prueba de concepto específicamente creada para este proyecto/competición; no obstante, hay mucho que mejorar antes que pueda llegar a ser utilizada por el público en general. Para ello, EFSA (Agencia Europea de Seguridad Alimentaria) constituirá  un grupo de trabajo con expertos e investigadores, entre ellos el grupo que ha desarrollado esta herramienta, con el fin de desarrollar una herramienta funcional y adaptada a todos los dispositivos, que permita a los ciudadanos resolver su preguntas sobre seguridad alimentaria de forma rápida y sencilla utilizando la base de datos científica de la propia EFSA.

 

Fig 3. Aplicación en su formato Web
Fig 3. Aplicación en su formato Web

Autor de contacto: Eduard.Grau@uab.cat
Autor de contacto: Remo.Suppi@uab.cat

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.

ACEPTAR
Aviso de cookies