Desde que surgió, a fines del 2022, el chat GPT ha generado preocupación entre los educadores. Ello porque la herramienta de inteligencia artificial, capaz de dialogar, escribir textos en diferentes estilos, hacer cálculos y responder preguntas de modo natural, puede ser indebidamente usada por estudiantes para elaborar redacciones y realizar lecciones y trabajos escolares, por ejemplo, burlando el proceso de aprendizaje.
Sin embargo, en lugar de ser utilizado simplemente como un oráculo o vidente, el robot virtual (chatbot) puede ser utilizado de otras formas más inteligentes y convertirse en un aliado en la enseñanza, evalúa Seiji Isotani, profesor del Instituto de Computación y Ciencias Matemáticas de la Universidad de São Paulo (ICMC-USP), campus São Carlos, y profesor invitado de la Facultad de Educación de la Universidad de Harvard, en Estados Unidos.
“El ChatGPT se ha utilizado como una especie de vidente, para proporcionar respuestas a preguntas. Esta aplicación es cuestionable en el proceso de enseñanza y aprendizaje porque destruye algo fundamental para la creatividad humana, que es tomar decisiones correctas y de forma consciente. Sin embargo, esa herramienta de inteligencia artificial puede ser utilizada como generadora de insights, o sea, nuevas formas de resolver un problema”, dijo Isotani durante una conferencia en un evento online promovido por el ICMC-USP en febrero.
En lugar de pedirle al ChatGPT que resuelva y dé la respuesta final a un problema matemático que no está consiguiendo entender, por ejemplo, un estudiante de secundaria puede pedirle al agente conversacional que le explique el paso a paso para resolverlo, lo cual es fundamental en el proceso de enseñanza-aprendizaje, señaló Isotani.
“El ChatGPT puede ser utilizado como un oráculo para intentar ayudar y proveer lo que llamaríamos un andamio, es decir, un apoyo para que el estudiante pueda aprender y avanzar”, explicó el investigador, que ha realizado, con el apoyo de la FAPESP, investigación dirigida al desarrollo y aplicación de técnicas informáticas para apoyar y transformar las actividades de enseñanza y aprendizaje.
“Si, aún con la ayuda de profesores y tutores, un estudiante no es capaz de comprender y resolver una ecuación matemática, por ejemplo, la herramienta se puede aplicar para ayudarlo a través de ejemplos resueltos”, dijo.
Otra posibilidad de aplicar ChatGPT en educación es como agregador de conocimiento, indicó el investigador. El agente conversacional puede permitir hacer conexiones y ayudar a los estudiantes a procesar la inmensa cantidad de información disponible en la actualidad, ayudando a construir significado.
“Podemos pensar el ChatGPT como un “learning companion”, es decir, un compañero de aprendizaje o un tutor del alumno que le ayudará a procesar información e intercambiar ideas con él. De esta forma, pasa a actuar ya no como oráculo o vidente, sino como colaborador en la construcción del conocimiento”, afirmó.
Estos agentes pedagógicos, que son pequeños avatares que interactúan con los estudiantes, han sido objeto de estudios en el área de los sistemas inteligentes durante más de tres décadas. Con la aparición de ChatGPT será posible elevarlos a un nuevo nivel, estimó Isotani.
El ChatGPT puede tomar la transcripción del habla de un niño con dificultades de aprendizaje y procesarla para un agente pedagógico. De esta manera, esta herramienta puede comenzar a interactuar de manera más eficiente, con el objeto de resolver problemas de niños con discalculia (dificultad con actividades relacionadas con las matemáticas) o necesidades especiales, por ejemplo, que necesitan ayuda en el proceso de aprendizaje y muchas veces no disponen de apoyo en el aula o en casa, defendió el investigador.
“Un niño con un deterioro cognitivo severo necesita ayuda en todo momento cuando está intentado aprender algo. Y no hay suficientes recursos humanos para ayudar a todos estos estudiantes en el tiempo que necesitan. ChatGPT puede actuar como un agente correctivo en este proceso”, dijo Isotani.
El investigador considera que esto no significa que el ChatGPT sustituirá al profesor y que los alumnos vayan a depender de la herramienta todo el tiempo, sino que podrán recurrir al agente conversacional siempre que necesiten que alguien les ayude.
“Necesitamos entender cuáles son los desafíos, problemas y potencialidades del ChatGPT para usarlo adecuadamente en el contexto de la educación para que podamos comenzar a crear servicios, procesar datos y trabajar con inteligencia artificial para apoyar a padres, maestros, estudiantes y gestores educacionales para poder vivir bien en la sociedad del conocimiento”, dijo.
Modelo generativo
Lanzada en noviembre de 2022 por la startup OpenIA, ChatGPT es una tecnología de modelado de lenguaje basada en algoritmos de redes neuronales artificiales profundas, modelos que intentan simular el comportamiento del cerebro humano, con unidades de procesamiento interconectadas en varias capas, al igual que las neuronas se conectan por sinapsis para aprender algo.
El aprendizaje a través de estas redes neuronales fue facilitado y potenciado en los últimos años con el surgimiento de una técnica de procesamiento del lenguaje natural llamada incrustaciones de palabras, que permite representar numéricamente las palabras, explica a Agência FAPESP T, Thiago Alexandre Salgueiro Pardo, profesor del ICMC- USP y uno de los investigadores principales del Centro de Inteligencia Artificial (C4AI).
C4AI es un Centro de Investigación en Ingeniería (CPE) constituido por FAPESP e IBM en la Universidad de San Pablo (USP).
“A las redes neuronales les gusta trabajar con números. Si les damos una palabra simbólica, escrita completa, no saben muy bien qué hacer con ella. Pero si la palabra se convierte en un número, pueden procesarla muy bien. Y al transformar las palabras en números, es posible realizar operaciones matemáticas sobre ellos”, dice Pardo.
“Eso causó una revolución. Todos los sistemas de procesamiento del lenguaje natural han mejorado gracias a la representación numérica del texto”, añade el investigador.
Otra revolución reciente en el campo del procesamiento del lenguaje natural fue el desarrollo de un nuevo tipo de red neuronal artificial, los llamados grandes modelos de lenguaje (LLM).
Entrenados en conjuntos de datos muy grandes, del orden de miles de millones de textos, estos modelos pueden deducir la palabra que falta para completar una oración determinada.
Uno de los grandes modelos lingüísticos que revolucionó el área fue el Bert, lanzado en 2018 por Google, basado en la representación numérica de un texto para predecir las próximas palabras que faltan en función del tramo anterior. A fines de 2020, OpenIA lanzó GPT-3, que genera texto a partir de representaciones numéricas, dando lugar a los llamados modelos generativos.
“Como modelo generativo, el ChatGPT, que es, de hecho, un sistema muy innovador, puede generar informaciones correctas o incorrectas, porque no tiene filtro”, pondera Fábio Cozman, profesor de la Escuela Politécnica de la USP y director de C4AI .
Además de producir información incorrecta y desactualizada, dado que la base de datos utilizada para entrenarla llega hasta 2021, ChatGPT también puede producir y contribuir a difundir contenido dañino e inapropiado, fomentando el plagio y otras violaciones éticas, señala Fernando Santos Osório, profesor del ICMC -USP y miembro del comité de gestión de C4AI.
“El ChatGPT es una gran herramienta desde el punto de vista lingüístico, pero le falta mucho en relación a los sistemas de representación del conocimiento y presenta algunos problemas muy serios que deben ser discutidos”, evalúa Osório.
“Google también puede proporcionar información incorrecta, peligrosa y desactualizada, pero señala las fuentes, su reputación y permite que el usuario las evalúe y verifique. El ChatGPT, no”, compara.
Procesamiento del lenguaje natural en portugués
Para permitir el entrenamiento de modelos de lenguaje similares a GPT-3 y elevar el nivel de rendimiento en el procesamiento computacional del lenguaje natural en portugués de Brasil, investigadores vinculados a C4AI han desarrollado y puesto a disposición grandes conjuntos de datos durante los últimos dos años.
Los conjuntos de datos contienen textos de diferentes fuentes, meticulosamente anotados por estudiantes de lingüística, así como grabaciones del idioma portugués de diferentes regiones de Brasil.
Uno de los conjuntos de datos, llamado CORAA, contiene más de 260 horas de grabaciones de voz transcritas en portugués, de diferentes regiones de Brasil, provenientes de cuatro conjuntos de datos preexistentes, ahora auditados por estudiantes universitarios. La multidiversidad de los contenidos que pone a disposición CORAA ofrece, por ejemplo, una mayor diversidad regional en la creación de futuras aplicaciones de conversación, respetando los acentos, culturas y costumbres locales. El objetivo es llegar a las 600 horas de grabación en la próxima versión.
Un segundo conjunto de datos, denominado Carolina, contiene información sobre más de 600 millones de palabras y términos portugueses, anotados por tipología y origen, lo que proporciona una amplia gama de detalles sobre etimología para entrenar grandes modelos de procesamiento del lenguaje natural.
“Estos conjuntos de datos en portugués son públicos y están disponibles para cualquier interesado, como universidades, empresas y nuevas empresas”, dijo Claudio Pinhanez, gerente de investigación en Inteligencia Conversacional de IBM Research Brasil y subdirector de C4AI, en un evento realizado en febrero en Inovabra, en São Paulo.
“Nadie va a invertir en el procesamiento del lenguaje natural en portugués si no es Brasil. Necesitamos tener el mismo tipo de infraestructura de inteligencia artificial que existe en países como Estados Unidos y China para poder procesar el habla, jurídica y de noticias en portugués, entre otras diversas aplicaciones”, dijo.
En 2022, los investigadores del Centro iniciaron un proyecto destinado a utilizar técnicas de inteligencia artificial ultramodernas para ayudar en el procesamiento de lenguas indígenas.
“Ahora estamos estableciendo alianzas con algunas comunidades indígenas de São Paulo, principalmente de la etnia guaraní, que es la lengua indígena más hablada en la región. Pero tenemos la intención de expandirnos a otras etnias amazónicas en el futuro”, dijo Pinhanez.
Elton Alisson. Foto Emiliano Vittoriosi. Traducción Programa INFOCIENCIA