Implementación de algoritmos de Procesamiento de Lenguaje Natural y TF-IDF en Chatbots IA

El campo de la medicina no se escapa a los avances de la técnica, siendo muy frecuente que los encabece. El artículo «An intelligent chatbot using NLP and TF-IDF algorithm for text understanding applied to the medical field» de (Soufyane, A.; Abdelhakim, B.A.; Ahmed, M.B. 2021) presenta un ejemplo de implementación de Chatbots especializados en el campo médico para el diagnóstico de dolencias en pacientes. Estos Chatbots, alimentados por algoritmos de Procesamiento de Lenguaje Natural (NLP Natural Language Processing) y la técnica TF-IDF (de cálculo de pesos, empleada en RI Recuperación de Información), buscan proporcionar asistencia en materia de telemedicina y ofrecer orientación sobre cuestiones de salud.

El algoritmo TF-IDF se presenta como parte fundamental en esta implementación. Este algoritmo trabaja en dos fases: la primera calcula la frecuencia del término (TF) y la segunda, la frecuencia inversa del documento (IDF), permitiendo la aproximación de la medida o peso del término TF-IDF. Esta aproximación se utiliza para calcular los k elementos con los valores de TF-IDF más altos en el flujo de datos dado. Esto puede utilizarse para analizar las consultas de los usuarios y determinar qué tan relevante es cada palabra o término en esas consultas en relación con una base de conocimientos médicos. Esto ayuda al chatbot a comprender mejor las preguntas y proporcionar respuestas más precisas o sugerir diagnósticos adecuados basados en la relevancia de las palabras clave en las preguntas de los usuarios en comparación con los datos médicos almacenados.

Entre sus componentes, el chatbot presentado consta de la siguiente topología:

  1. Sistema de Servidor Backend: Este sistema es responsable de manejar las solicitudes de los usuarios y dirigirlas a los componentes correspondientes. También maneja las respuestas del sistema y las devuelve a los usuarios.
  2. Unidad de Generación de Lenguaje Natural: Esta unidad es responsable de generar respuestas apropiadas a las preguntas de los usuarios utilizando la base de conocimientos almacenada en la forma de datos de lenguaje natural. En otras palabras, convierte datos estructurados en contenido comprensible para los usuarios.
  3. Sistema de Preguntas y Respuestas Médicas (FAQs): Este componente almacena preguntas frecuentes y sus respuestas asociadas. Puede tener dos tipos de entrenamiento:
    • Entrenamiento Manual: Los expertos en el dominio mapean preguntas frecuentes con sus respuestas para que el chatbot pueda identificarlas y proporcionar respuestas rápidas.
    • Entrenamiento Automatizado: El chatbot analiza documentos de preguntas y respuestas y genera automáticamente preguntas frecuentes basadas en el material disponible.
  4. Contexto de Aprendizaje Automático: Aquí es donde se procesa y entiende la entrada del usuario utilizando algoritmos de procesamiento de lenguaje natural (NLP). Este componente se compone de:
    • Clasificador de Intenciones (Intent Classifier): Comprende el significado de la entrada del usuario y lo relaciona con las intenciones almacenadas en la base de datos del chatbot.
    • Extractor de Entidades (Entity Extractor): Extrae información crítica de la pregunta del usuario, como síntomas o términos médicos específicos.
  5. Unidad de Gestión de Diálogo: Este componente gestiona el flujo de la conversación. Si el usuario cambia de tema o contexto durante la conversación, este módulo interpreta la nueva solicitud y ajusta la respuesta en consecuencia. También incluye:
    • Mecanismo de Retroalimentación: Solicita retroalimentación al usuario para evaluar la satisfacción con las respuestas del chatbot.
    • Aprendizaje de Políticas: Permite al bot aprender de experiencias pasadas para mejorar las conversaciones futuras y adaptarlas a las necesidades del usuario.

El artículo demuestra, cómo es posible generar chatbots más sencillos, basados en tecnologías conocidas, del dominio de la Recuperación de Información, para lograr sistemas de Inteligencia Artificial conversacional que debidamente entrenados, pueden resolver necesidades concretas del campo de la medicina y el diagnóstico, haciendo relevante y claro, la importancia de disponer de datasets de calidad y métodos de entrenamiento efectivos.

Referencias

Soufyane, A.; Abdelhakim, B.A.; Ahmed, M.B. (2021). An intelligent chatbot using NLP and TF-IDF algorithm for text understanding applied to the medical field. In Emerging Trends in ICT for Sustainable Development: The Proceedings of NICE2020 International Conference (pp. 3-10). Cham: Springer International Publishing. https://doi.org/10.1007/978-3-030-53440-0_1

Soufyane, A.; Abdelhakim, B.A.; Ahmed, M.B. (2021)

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *