Notícia

Programa InfoSalud (Argentina)

Inteligencia artificial rastrea noticias sobre Covid-19

Publicado em 07 abril 2020

Por José Tadeu Arantes | Agência FAPESP

Una herramienta desarrollada para extracción de datos y textos, llamada Websensors, se está utilizando en el análisis de la evolución de la pandemia de Covid-19. Capaz de extraer datos de textos de noticias, obteniendo informes sobre "lo que ocurrió", "cuándo ocurrió" y "dónde ocurrió", Websensors posibilita ajustar, día por día, los modelos de propagación de la enfermedad.

La herramienta fue desarrollada en el Instituto de Ciencias Matemáticas y de Computación de la Universidad de São Paulo (ICMC-USP), en São Carlos, por los investigadores Solange Rezende, Ricardo Marcacini y Rafael Rossi, y tuvo también la participación de Roberta Sinoara. Recibió el apoyo de FAPESP a través del proyecto "Aprendizaje automático para WebSensors: algoritmos y aplicaciones", y de subvenciones otorgadas a Marcacini, Rossi y Sinoara, todos los cuales fueron guiados por Rezende en ese momento.

La instancia de la herramienta Websensors dedicada a la epidemia COVID-19 está disponible en http://websensors.net.br/projects/covid19/, con la interfaz web desarrollada por Luan Martins, estudiante de maestría en ICMC-USP.

"Utilizamos la extracción de datos en textos de noticias como una forma de identificar los eventos que tienen lugar en cada país y, así, ajustar la proyección con las características de Brasil", dice Rezende a Agência FAPESP.

Según la investigadora, la pregunta principal investigada en la pesquisa de Websensors es la posibilidad de extraer información adicional sobre un problema a partir de las noticias y, en base a ellas, ajustar los modelos predictivos existentes.

“La herramienta utiliza una metodología de extracción de eventos estructurada en cinco etapas: identificación del problema; preprocesamiento; extracción de patrones; post-procesamiento; y uso del conocimiento ”, dice Ricardo Marcacini.

El primer paso, la identificación del problema, es definir el alcance de la aplicación y las fuentes de datos. “Johns Hopkins CSSE recopila los datos de difusión internacional diaria de COVID-19 en el Repositorio de datos. Y la noticia, publicada en más de 100 idiomas, se obtiene a través del Proyecto GDELT. Esta gran plataforma, altamente selectiva, nos protege contra las noticias falsas ", dice Rezende.

En la segunda etapa, la del preprocesamiento, se utilizan algoritmos que transforman las noticias en eventos. “Solo queremos noticias donde podamos identificar lo que sucedió, cuándo sucedió y dónde sucedió (georreferenciado). Cuando al menos estas tres piezas de información pueden extraerse de las noticias, entonces tenemos un evento, que un programa de computadora puede analizar ”, explica Marcacini.

En la tercera etapa, la de extracción de patrones, se utiliza una red neuronal que recibe, como entrada, las curvas de contagio de algunos países. Y las enriquece, agregando los eventos preprocesados en el paso anterior. "Como salida, configuramos la red neuronal para que retome la curva de contagio, considerando las características de Brasil", informa Marcacini.

En el post-procesamiento, que configura la cuarta etapa, los responsables de la herramienta realizan una evaluación del modelo utilizado. "Se pueden utilizar diferentes técnicas de evaluación", dice Rezende. "Una de ellas es utilizar el modelo para predecir algunos de los datos que ya conocemos y, por lo tanto, cuantificar el margen de aciertos".

La quinta y última etapa, finalmente, se refiere al uso del conocimiento. Esto significa ponerlo a disposición de los usuarios o incluso de otros sistemas. En este caso, se puede acceder abiertamente a todo el conocimiento obtenido sobre la pandemia en http://websensors.net.br/projects/covid19/.

Rezende dice que la plataforma Websensors ha publicado diariamente previsiones de los próximos siete días de la curva de contagio en Brasil, utilizando el modelo ajustado con los eventos. La información está disponible para cualquier interesadp. Pero advierte del hecho de que la herramienta todavía está recibiendo ajustes. “Es importante destacar que Websensors no se creó para este propósito. Sin embargo, creemos que, en este período difícil, podemos usar lo que tenemos disponible para colaborar ", dice.