El sentido común, crucial para el éxito de los sistemas de inteligencia artificial

19 Jul 2021
Keith Darlington Consultor en IA y autor / www.bbvaopenmind.com
Inteligencia Artificial

Desde que comenzaran a desarrollarse, dotar a los sistemas de inteligencia artificial de conocimientos de sentido común se ha considerado un asunto clave. Es más, si algo ha quedado patente a lo largo de todos estos años de grandes esfuerzos es que desarrollar sistemas capaces de razonamiento por sentido común es una tarea muy costosa, tanto desde el punto de vista económico como del de dedicación. En este documento explicaré por qué es tan importante el razonamiento por sentido común y analizaremos alguna de las estrategias seguidas para desarrollar estos sistemas. Estas estrategias han permitido dotar a los programas de inteligencia artificial, como los chatbots, de capacidades de razonamiento por sentido común complementarias.

¿POR QUÉ ES EL SENTIDO COMÚN TAN IMPORTANTE PARA LOS SISTEMAS DE INTELIGENCIA ARTIFICIAL?

Uno de los padres fundadores de la inteligencia artificial, John McCarthy, fue de los primeros en darse cuenta de su importancia. En 1959 publicó el primer documento en proponer el un programa hipotético (Advice Taker) para implementar el razonamiento fundamentado en el sentido común. El documento consistía únicamente en una especificación detallando lo que debería ser capaz de hacer un programa de sentido común. Sin embargo, pronto quedó claro que existía la necesidad de trabajar en programas de conocimiento de sentido común para reforzar los procesos de toma de decisiones de los sistemas expertos de inteligencia artificial. La aparición de estos sistemas supuso el primer periodo de auge comercial de la inteligencia artificial, de manera que el sentido común comenzó a ser considerado un elemento fundamental en su éxito.

El motivo del consenso en torno a la importancia del sentido común es que a pesar de la gran capacidad de muchos de estos sistemas a la hora de resolver determinados problemas, también eran extremadamente frágiles, ofreciendo con frecuencia respuestas incoherentes cuando trataban de razonar a partir de datos de problemas inusuales. Por ejemplo, como veremos más adelante, durante un experimento, un sistema de diagnósticos médicos fue incapaz de detectar que se le habían proporcionado datos sobre un automóvil, y no dudó en determinar que el coche estaba infectado con sarampión. Se trata del tipo de respuestas absurdas que nunca se darían con un experto humano, porque su sentido común le permitiría identificar que los datos no eran válidos. Además, en el caso de los expertos humanos, en determinados procesos lógicos, el sentido común se impone a los conocimientos especializados. Así, a la hora de evaluar la necesidad de someter a un paciente de avanzada edad con una esperanza de vida limitada, a una intervención quirúrgica complicada y de resultados inciertos, aplicando el sentido común y teniendo en cuenta las circunstancias, el experto puede descartar la operación. Un sistema experto de inteligencia artificial, sin sentido común, no incorpora esta amplitud de miras a sus procesos de toma de decisiones.

¿POR QUÉ ESTÁN TENIENDO PROBLEMAS DETERMINADOS PROYECTOS DE DEEP-LEARNING PARA ADAPTARSE AL CAMBIO?

A pesar de su capacidad para detectar patrones, los sistemas de deep learning tiene bastantes dificultades para adaptarse ante pequeñas modificaciones, hasta el punto de que necesitan volver a ser entrenados desde cero, utilizando grandes volúmenes de datos. Por el contrario, los humanos somos capaces de adaptarnos con mayor facilidad, gracias a nuestra capacidad de razonamiento y de hacer inferencias lógicas a partir de nuestro sentido común. Esto quiere decir que cuando un experto humano se enfrenta a cambios en un determinado dominio o a un dominio nuevo pero relativamente familiar, por lo general, tendrá una capacidad de adaptación infinitamente superior a la de los modelos de razonamiento profundo.

ALGUNOS PROYECTOS DE RAZONAMIENTO POR SENTIDO COMÚN

En los últimos 30 años se han venido desarrollando diferentes proyectos de sentido común. El primero, CYC [1], data de 1984. Se trata de un proyecto muy ambicioso de inteligencia artificial cuyo objetivo es compilar una gran base de conocimiento ontológica con conceptos básicos de sentido común. Su nombre, derivado de ENCYCLOPAEDIA, hace referencia al volumen de conocimientos del mundo real se ha propuesto recopilar. El proyecto original estaba ubicado en la sede de Microelectronics and Computer Tecnology Corporation (MCC) en Austin Texas. Según Doug Lenat, líder y fundador del proyecto, “el motivo que ha inspirado CYC es que la primera generación de sistemas expertos carece de sentido común. Por eso son tan ‘frágiles’. Por eso, muchos de los sistemas expertos de primera generación sólo han sido capaces de cumplir su cometido a la perfección cuando se han mantenido dentro de los límites de conocimiento definidos para los mismos. Los sistemas expertos de primera generación no son capaces de aplicar coherentemente los conceptos de sentido común del mundo real que con frecuencia usan los expertos humanos por la sencilla razón de que carecen de ellos”. Para ilustrar esta carencia, Lenat utiliza el siguiente diálogo entre un sistema experto de diagnóstico de enfermedades cutáneas con un paciente que resulta ser un coche de la marca Chevrolet.

Programa: ¿Tienes manchas en el cuerpo?

Usuario: Sí.

Programa: ¿De qué color son?

Usuario: De marrón rojizo

Programa: ¿Tiene usted una mayor concentración de manchas en el maletero que en ninguna otra parte?

Usuario: No.

Programa: El paciente tiene sarampión.

Esta conversación pone de manifiesto cómo, al enfrentarse a situaciones inesperadas, los sistemas de IA pueden ofrecer resultados incoherentes. Lenat se refiere a esto como la hipótesis de la amplitud, que plantea que, “para comportarse de manera inteligente ante situaciones inesperadas, un agente debe ser capaz de recurrir a un conocimiento cada vez más general para establecer analogías con otros conocimientos específicos pero inconexos”. En CYC se han invertido muchos años de desarrollo en crear relaciones lógicas (a veces llamadas predicados) en base a millones de conceptos sobre el mundo real. El propósito de CYC es permitir a las aplicaciones de IA utilizar sus dominios específicos y llevar a cabo procesos deductivos complementados con razonamientos de sentido común, de manera similar a los humanos Es un proyecto que lleva muchos años en marcha y cuenta con una amplia base de clientes comerciales.

Según la página web del proyecto, “CYC ha construido la que es, con gran diferencia, la mayor base de conocimientos de sentido común del mundo. esta base de conocimientos no es una base de datos – sino que está compuesta por axiomas del mundo real que CYC utiliza para razonar sobre el mundo y entender sus datos. La base de conocimiento de CYC comprende más de 10.000 predicados, millones de colecciones y conceptos y más de 25 millones de aserciones”. Sin embargo, en el proyecto CYC se han identificado varias carencias – sobre todo relacionadas con la dificultada de conjugar las ambigüedades del lenguaje humano. También ha sido objeto de crítica. Según [2], aunque los objetivos del proyecto son encomiables, CYC está lejos de ser todo lo completa que debería ser para tener un impacto material. El desarrollo del proyecto ha exigido de una cantidad ingente de trabajo manual, con la colaboración de un amplio equipo de expertos, además de una inversión que, según algunos cálculos, supera los 200 millones de dólares.

Otras estrategias menos costosas han seguido un modelo open-source (código abierto) para capturar datos disponibles en internet. Por open-source se entiende que en su desarrollo ha participado una comunidad de usuarios que puede colaborar a través de su página web. Por ejemplo,ConceptNet es una base de conocimiento de sentido común y herramientas de procesamiento de lenguaje natural – diseñada para ayudar a los ordenadores a entender los significados de las palabras que utiliza la gente. Y para ello recurre a lo que denomina “redes semánticas”, un medio de representar el conocimiento. Estas redes utilizan métodos gráficos para describir relaciones entre conceptos y sucesos para describir actividades de sentido común. Esta base de conocimientos de redes semánticas consta de más de 1,6 millones de aserciones de sentido común, relativas a diferentes dimensiones físicas, espaciales, sociales y psicológicas de nuestro día a día. El lanzamiento de ConceptNet tuvo lugar en 1999, a iniciativa de MIT Media Lab, bajo el nombre Open Mind Common Sense. Esta base de conocimientos ha sido utilizada con éxito en Chatbots y en algunas aplicaciones de apoyo al uso de lenguaje natural.

Otra estrategia, la del llamado ‘Web Scraping’, consiste en enseñar a un ordenador a adquirir conocimientos de sentido común leyendo en internet. En 2011, Carnegie Mellon University lanzó su sistema de aprendizaje lingüístico continuo, una de las instancias más notables de este planteamiento, bautizada como NELL (Never Ending Language Learner). El sistema NELL ha sido programado para rastrear constantemente internet e identificar patrones lingüísticas que le ayuden a deducir significados. El sistema informa de los conceptos que va aprendiendo a través de su página web. Por ejemplo, recientemente ha aprendido que Oliver Stone contribuyó a que se filmara la película JFK y que las hojas del lirio de día son vegetales. Aunque no sean particularmente emocionantes, se trata de averiguaciones son indispensables para seguir incrementando la fiabilidad de los 50 millones de aserciones de la base de conocimientos del programa.

DARPA, la agencia de investigación del departamento de defensa de los EEUU, también ha identificado la falta de sentido común como un asunto importante. Por eso ha lanzado recientemente un proyecto llamado Machine Common Sense. Según la propia agencia,“la falta de sentido común impide a los sistemas inteligentes entender su mundo, comportarse de manera razonable ante situaciones inesperadas, comunicarse de manera natural con las personas y aprender de nuevas experiencias. Su ausencia se considera la barrera más importante que separa el enfoque limitado de las aplicaciones de IA actuales con los sistemas de inteligencia general, similares a los humanos, que se espera desarrollar en el futuro”. El proyecto de DARPA sigue una estrategia doble. Por un lado desarrollar modelos computacionales capaces de aprender de la experiencia. Y por otro desarrollar un servicio capaz de aprender a partir de la información disponible en internet, como un investigador de biblioteca, para construir un repositorio de conocimientos de sentido común.

Conclusiones

A pesar de muchos esfuerzos encomiables, existe una sensación generalizada de que no se ha avanzado suficiente en las aplicaciones de sentido común para la inteligencia artificial. Uno de los problemas es que resulta tremendamente complicado formalizar estos conocimientos porque se trata de un dominio muy desestructurado. También resulta difícil saber cuándo se podría considerar que se ha completado un sistema de este tipo, porque no existe una definición precisa de lo que es el sentido común. Sin embargo, avanzar es imprescindible para superar los problemas que se describen en este artículo.

Referencias

[1] Lenat, D. y Guha, R. Building Large Knowledge-Based Systems: Representation and Inference in the Cyc Project. Addison-Wesley 1990.

[2] Marcus, G. y Davis, E. Rebooting AI. Building Artificial Intelligence we can trust. Pantheon Books, 2019.

Soluciones

Productos

Servicios

Inteligencia artificial

Retail

Categorías de blog

Mensajes recientes

¿Cómo mejora la IA la eficiencia?

El Índice de Inteligencia de Amenazas de X-Force 2025 destaca que los atacantes roban y venden identidades de usuarios a gran escala.

¿Cómo se implementa la IA en toda una organización?

Se acabaron los clientes disgustados gracias a Watson NLU

De la imaginación a la realidad: cómo la IA Generativa está cambiando la forma en que diseñamos productos digitales

Transformando el futuro: un viaje a la ingeniería de sistemas basada en modelos en el Instituto Tecnológico de Singapur

Responsabilidad Social: apoyar al talento femenino y crear un futuro más equitativo para todos

IBM Consulting amplía sus capacidades para ayudar a las empresas a escalar la IA

ASTEX elige IBM Watson en IBM Cloud para personalizar la formación en idiomas con inteligencia artificial

IA generativa, la gran protagonista de la X edición del Revolution Banking

Operaciones de Fantasy Football: cómo los modelos base IBM Granite impulsan una explicabilidad personalizada para millones.

La IA llega a las finanzas: seis patrones de éxito para transformar la función del CFO

La ciencia de la consultoría: cómo la IA está cambiando para siempre el modelo de consultoría

Una nube más clara y eficiente

GO fit, Telefónica e IBM, ejemplo de cómo la transformación digital se traduce en eficiencia corporativa