Por Germán Baltazar
Artículo de Divulgación Científica

Para poder generar nuevos conocimientos, es necesario realizar un proceso cognitivo de aprendizaje, que consiste en encontrar la información más relevante de un tema en particular, organizarla de manera que sea fácil de comprender por el usuario, y darle una interpretación propia, relacionándola con conocimientos previos.

Actualmente, los avances tecnológicos han facilitado el acceso y la generación de información en todo el mundo. Lamentablemente, el hecho de que se tenga más información, en lugar de facilitar la creación de conocimiento, lo ha dificultado todavía más. Este problema se conoce como sobrecarga de información, y se puede separar en tres aspectos principales:

  1. La información es excesiva. Hay demasiados datos a los cuales se tiene acceso, sobre cualquier tema.
  2. La información está desorganizada. Es posible encontrar cualquier referencia, sin saber realmente si es útil para las necesidades de cada usuario.
  3. La información es estática. Una misma referencia puede ser comprendida fácilmente por una persona, y completamente confusa para alguien más.

Estos tres problemas limitan el uso de la información, provocando que sea más difícil generar nuevos conocimientos. Un ejemplo notable es el área educativa, donde la cantidad de nueva información que se le da a los alumnos es excesiva. Esto se ve reflejado en un bajo rendimiento escolar, así como la pérdida de interés en investigar y aplicar dichos conceptos en situaciones de la vida cotidiana.

Por estas razones, es necesaria la creación de una interfaz que pueda mostrar la información de forma dinámica, mostrando la información que cada usuario necesita, tomando en cuenta qué tanto comprende de éste. Nuestra propuesta de investigación busca utilizar algoritmos de inteligencia artificial y análisis de texto, con la finalidad de crear una interfaz tecnológica que pueda desarrollar resúmenes de información basados en las necesidades de cada usuario.

ANALIZANDO TEXTOS CON INTELIGENCIA ARTIFICIAL
El uso de algoritmos de procesamiento de lenguaje natural (NLP por sus siglas en inglés) permite analizar la estructura sintáctica, semántica y pragmática de documentos escritos, permitiendo determinar las partes más importantes de las oraciones, facilitando la extracción de información.

Dentro de los algoritmos de NLP, uno de los métodos más utilizados ha sido el uso de redes neuronales recurrentes (RNN), las cuales analizan secuencias de datos mediante el uso de “neuronas” o nodos. Estos métodos son capaces de encontrar la relación entre diferentes palabras según ciertas características. Por ejemplo, pueden encontrar que la relación entre “rey” y “reina” es bastante similar a la de “hombre” y “mujer”, pero no entre “naranja” y “manzana”.

Además, permiten evaluar la relevancia de la información escrita dadas ciertas condiciones de búsqueda. Igualmente, pueden utilizarse para poder generar oraciones que sigan el mismo estilo de redacción que las fuentes consultadas; uniendo estas dos cualidades, es posible que las plataformas tecnológicas puedan modificar y presentar la información de manera tal que diferentes usuarios utilicen las mismas fuentes de información, y las comprendan mediante la visualización personalizada de éstas.

Estos algoritmos se han utilizado para analizar los sentimientos que expresan las personas en opiniones escritas, y determinar si son positivas o negativas. De igual manera, se han aplicado para detectar palabras clave, y mejorar la búsqueda de información en línea. Sin embargo, estos algoritmos se basan únicamente en la información textual que ponen los usuarios, y no son capaces de realizar inferencias por su cuenta, o considerar las ambigüedades que utilizan las personas al comunicarse.

NUESTRA PROPUESTA
Para resolver el problema de la sobrecarga de información, se propone crear una interfaz tecnológica capaz de unir múltiples documentos en un solo resumen, abarcando toda la información que el lector necesite. En la Figura 1 se muestra un diagrama del funcionamiento general de dicha interfaz, la cual se describe a continuación:

Partiendo de una colección de documentos de algún tema en particular, la interfaz separará primero el texto en oraciones, para así clasificarlas por tema y tipo de oración. Una vez que la clasificación esté lista, se seleccionarán los temas principales para crear un resumen preliminar, el cual será entregado al usuario final. La finalidad de esto último es que el usuario le indique a la interfaz qué partes del resumen no comprende. Con esta nueva información, la interfaz será capaz de determinar qué le hace falta al resumen para que dichos puntos sean comprendidos; ya sea que el usuario requiera una explicación más amplia del tema, o la mención de diferentes ejemplos, o incluso la explicación de un tema relacionado que no estaba en el resumen original, la interfaz modificará la información para que pueda ser comprendida correctamente.

Figura 1. Diseño general de la interfaz de resumen.

En la Figura 2 se puede ver un ejemplo de cómo se aplicaría la interfaz en un ambiente educativo. Primero, el resumen general a un tema de clase se entrega a todos los usuarios (en este caso alumnos) para que lo lean y lo analicen. Después, de manera individual, cada alumno le dará la retroalimentación a la interfaz para indicarle qué partes no fueron comprendidas; con esta información, la interfaz modificará el resumen general para cubrir las dudas individuales de cada alumno. De esta manera, se repite el ciclo de interacción hasta que se haya comprendido completamente el tema, y se pueda continuar con la actividad siguiente.

Figura 2. Ejemplo de aplicación.

VENTAJAS DE ESTE MODELO
Al utilizar esta interfaz, se están atacando los tres problemas principales de la sobrecarga de información, ya que se organizan múltiples fuentes de información para generar un documento más sencillo que incluye la información más relevante sobre un tema en particular. De igual manera, en caso de que alguna parte del resumen no sea comprendido por el lector, la interfaz puede determinar qué información es necesaria para mejorar dicha comprensión, creando un resumen personalizado para cada lector que busque información respecto al mismo tema.

La principal ventaja de esta interfaz en el área educativa es que los estudiantes tendrían la información más relevante para sus clases, considerando sus necesidades y comprensión de temas pasados o similares. Esto permite que en el corto plazo puedan comprender de mejor manera los contenidos de sus clases, mientras que, al largo plazo, se impulsaría la creación de un modelo de clase más dinámico dentro de las aulas, permitiendo que el profesor pueda enfocarse en asuntos más prácticos que refuercen el contenido teórico mencionado por la interfaz. De esta manera, se impulsa a que las futuras generaciones se eduquen con el modelo de la Sociedad del Conocimiento.

————————-

Sobre el autor
Germán Eduardo Baltazar Reyes
es Ingeniero en Telecomunicaciones y Sistemas Electrónicos por el Tecnológico de Monterrey, Campus Ciudad de México. Actualmente se encuentra estudiando el Doctorado en Ciencias de la Ingeniería en esta Institución. Sus intereses de investigación son la Robótica Social, la Inteligencia Artificial, y la aplicación de tecnología para la mejora de la calidad educativa. Sus asesores son los doctores Pedro Ponce Cruz y Edgar López Caudana.

¿Quieres saber más?

1 COMMENT

DEJA UN COMENTARIO

Por favor agrega un comentario!
Favor de ingresar tu nombre