1. INTRODUCCIÓN
El presente artículo es relativamente extenso y seguramente contenga algunos errores e imprecisiones de diverso calibre que sólo tal vez vaya corrigiendo en el futuro. Si adviertes alguno, o si sientes que conoces algún material complementario interesante en la red, no dudes en hacérmelo saber a través del correo electrónico. Hay, literalmente, miles de páginas sobre algoritmos y consideraciones matemáticas, lógicas y filosóficas sobre la inteligencia artificial. Páginas que obviamente no he leído, e ideas sobre las que no he reflexionado. El objetivo de este texto es sólo la de reunir e intentar relacionar y compartir algunas ideas que me parecen interesantes y que posteriormente pueden haber sido la puerta a algo más.
«Creía que las hormigas sabían lo que hacían. Las que paseaban por la encimera de mi cocina parecían tan decididas, que supuse que tendrían un plan. ¿De qué otra forma podrían si no organizar autopistas, construir nidos, protagonizar incursiones épicas y hacer todas las cosas que hacen las hormigas? Pero resulta que estaba equivocado. No son perspicaces ingenieras, ni arquitectas, ni militares en miniatura, o al menos no lo son como individuos. Cuando se trata de decidir qué hacer, la mayoría de las hormigas no tiene ni idea. «Si observas a una hormiga tratando de hacer algo, te impresionará su ineptitud», dice Deborah M. Gordon, bióloga de la Universidad Stanford. ¿Cómo es posible explicar, entonces, el éxito de las 12.000 especies conocidas? ¡Algo tienen que haber aprendido en 140 millones de años! «Las hormigas no son inteligentes, pero las colonias sí lo son». Una colonia puede resolver problemas inasequibles para una hormiga individual, como hallar el camino más corto a la mejor fuente de alimentos, asignar obreras a diferentes tareas o defender el territorio. Como individuos, puede que las hormigas sean tontas, pero como colonia responden con rapidez y eficacia a su entorno. Y lo hacen con algo denominado inteligencia de enjambre.»
Fragmento, Peter Miller para National Geographic.
2. DE LOS CÚMULOS FUNCIONALES A LA NEURONA INDIVIDUAL
«En primer lugar, observemos la terminología: los filósofos definen la hipótesis de la IA [Inteligencia Artificial] débil como la afirmación de que es posible que las máquinas actúen con inteligencia (o, quizá mejor dicho, que actúen como si fueran inteligentes); de la misma manera, la hipótesis de la IA fuerte consiste en la afirmación de que las máquinas sí piensan realmente (opuesto al pensamiento simulado) [En el caso de la IA fuerte, hablaremos de estados mentales].
La mayoría de los investigadores dan por sentado la hipótesis de la IA débil, y no se preocupa por la hipótesis de la IA fuerte: con tal de que funcione su programa no les interesa si se llama simulación de inteligencia o inteligencia real. Sin embargo, todos deberían preocuparse por las implicaciones éticas de su trabajo. [...]
Turing mantiene que la cuestión no está bien definida al decir "¿pueden pensar las máquinas?". Además, por qué deberíamos insistir en un estándar más alto para las máquinas que el usado para los humanos. Después de todo, en la vida ordinaria no tenemos nunca una evidencia directa sobre los estados mentales de otras personas. No obstante, Turing dice que "En vez de argumentar constantemente sobre este punto de vista, es usual mantener la convención educada de que todos pensamos". [...]
En 1848, Frederick Wöhler sintetizó urea artificial por primera vez. Este fue un hecho importante porque probó que la química orgánica y la inorgánica se podían unir, cuestión discutida muy fuertemente. Una vez que se consiguió la síntesis, los químicos reconocieron que la urea artificial era urea, porque tenía todas las propiedades físicas adecuadas. [...]
Aunque sea fácil reconocer que las simulaciones por computador de las tormentas no nos van a mojar, no está claro cómo aplicar esta analogía a las simulaciones por computador de los procesos mentales. Después de todo, la simulación de una tormenta en Hollywood utilizando aspersores y máquinas de viento sí que moja a los actores. La mayoría de las personas se sienten cómodas diciendo que la simulación por computador de la suma es la suma, y la de un juego de ajedrez es un juego de ajedrez. ¿Son los procesos mentales más parecidos a las tormentas, o son más parecidos a la suma o al ajedrez? Depende de la teoría de los estados y los procesos mentales.
La teoría del funcionalismo dice que un estado mental es cualquier condición causal entre la entrada y la salida de un sistema. Bajo la teoría funcionalista, dos sistemas con procesos causales isomórficos tendrían los mismos estados mentales. Por tanto, un programa informático podría tener los mismos estados mentales que una persona. Desde luego, todavía no hemos dicho qué significa realmente "isomórficos", pero la suposición es que existe algún nivel de abstracción por debajo del cual no importa una implementación específica; siempre que los procesos sean isomórficos hasta este nivel, tendrán lugar los mismos estados mentales.
En contraste, la teoría del naturalismo biológico dice que los estados mentales son características emergentes de alto nivel originadas por procesos neurológicos de bajo nivel en las neuronas, y lo que importa son las propiedades (no especificadas) de las neuronas.»
Fragmento, Inteligencia Artificial, un enfoque moderno. Capítulo 26: fundamentos filosóficos. Stuart Russell y Peter Norvig.
Por tanto, podemos entender que, según la teoría del funcionalismo, la simulación de un proceso mental es un proceso mental; lo único que cambia es el dominio de ejecución mediante cierta transformación isomórfica para todos los componentes implicados. Según la teoría del naturalismo biológico, la simulación de un proceso mental no es más que una una coreografía sin contenido, el despliegue en el tiempo de un algoritmo en base a cierta entrada y la historia de la máquina, pero sin que una entidad tenga la consciencia de ser la responsable de la tarea.
«El funcionalismo presupone que una misma función puede ser desempeñada por sistemas muy distintos, ya que la naturaleza de sus componentes no es esencial para el correcto desempeño de su función. Las creencias y deseos son estados físicos de sistemas físicos que pueden estar hechos de diferentes tipos de materiales. Algo es una creencia o un deseo en virtud de lo que hace y no en virtud de los materiales de los que su sistema está compuesto. No es analizando el sistema sino su función. De este modo, podemos atribuir estados mentales a seres con una estructura fisicoquímica muy diferente a la nuestra y las funciones mentales podrían muy bien ser desempeñadas por un soporte no orgánico, como un ordenador digital. Cualquier sistema puede tener mente a condición de que sea capaz de realizar la función adecuada. […]»
Fragmento: Materiales para la reflexión y el debate, Miguel Angel de la Cruz Vives.
Con anterioridad he comentado muy brevemente acerca de la posibilidad de que la consciencia sea algo más común de lo que creemos en el universo —y no voy a volver a tratarlo aquí—. En tal caso IA débil e IA fuerte podrían entenderse como constructos más o menos complicados pero con una raíz común. Véase los posts previos:
De la materia inerte a los pensamientos
No voy a entrar ahora a tratar de definir la consciencia. Prefiero exponer el caso general y, luego, con una definición precisa de los conceptos tal vez el lector encuentre que ciertas ideas podrían ser equivalentes o reducibles a otras. Pero el texto se volvería inabordable.
La teoría del naturalismo biológico expone que la única implementación específica posible para un sistema capaz de generar estados mentales (esto es, capaz de generar un sistema de clase IA fuerte) y transicionar entre ellos es una red de neuronas. Entonces, para entender los comportamientos o propiedades emergentes de la red, la única vía posible es entender el ladrillo fundamental de la arquitectura, la neurona... ¿necesariamente biológica?. Esto es confuso, porque este razonamiento no parece cerrar la puerta a que se hagan implementaciones alternativas de la misma neurona —en lugar de masivas agrupaciones funcionales suyas, como pudiera ser todo el conjunto de la corteza visual en el cerebro humano, etc...— mediante estructuras a priori «no biológicas» de las que puedan emerger las mismas propiedades, por lo que parece que regresaríamos a una teoría del funcionalismo en la que el nivel de abstracción por debajo del cual no importa una implementación específica, es la neurona. La unidad funcional sería la neurona en sí misma y no sus supraestructuras dentro del cerebro; dentro de la red, que es lo que al principio podríamos haber entendido por funcionalismo.
Pero tal vez, sólo tal vez, no hemos entendido nada y simplemente la neurona biológica no se puede replicar de ningún modo. Existe la posibilidad de que la neurona biológica sea la única solución válida al problema de generar una verdadera IA, una IA fuerte. ¿Y si puedes copiar parte de su comportamiento e implementarlo en máquinas, pero no puedes «captar la esencia que la hace única»?
Debemos recordar que, puesto que las inteligencias biológicas que conocemos están basadas en las neuronas, y siendo como son difíciles de entender teniéndolas delante, la cuestión de pensar si podría existir algún otro modelo que no haya tenido la suerte de evolucionar en nuestro planeta pero que sí sea una estructura con la misma capacidad para generar IA fuerte, es una pregunta para personas con mucha, mucha imaginación.
Habríamos pasado de preguntarnos:
1. si podemos duplicar el comportamiento de un cerebro biológico—sin especificar el nivel de inteligencia pero siendo ésta verdadera por estar constituido por neuronas biológicas, de las que la evidencia muestra que sí permiten la emergencia de seres realmente inteligentes—
basado en neuronas mediante hardware que emule directamente cada una de las funciones del cerebro —que son llevadas a cabo por cúmulos de neuronas—
, a preguntarnos2. si podemos implementar una neurona
—entendida entonces ésta no ya como la unidad biológica sino como modelo algorítmico—
mediante hardware no-biológico, que permitirá entonces la posterior emergencia de las propiedades propias de la IA fuerte.
Lo que parece, suponiendo que podamos deducir todas las caraceterísticas de una neurona en base al comportamiento de la red, en última instancia, la misma pregunta pero cambiando la escala de estudio y de integración de los componentes. Aún en el hipotético caso de que la respuesta a la primera pregunta fuese un no, porque entendiésemos que en esas condiciones sólo podríamos aspirar a la IA débil (simulación de la inteligencia) porque damos por cierto que la inteligencia es verdaderamente una propiedad emergente de las neuronas y no de otro tipo de circuitos —construídos con silicio o lo que sea— emuladores de más alto nivel —como afirma el naturalismo biológico—, aún así, no hemos respondido a la segunda pregunta, a si podría emerger la IA fuerte bajo esas condiciones de diseño.
Tal vez emular el comportamiento de seres inteligentes biológicos mediante hardware basado en descripciones de alto nivel (esto es, replicar las funciones de cúmulos de neuronas o fragmentos de la red neuronal por separado), es un callejón sin salida porque no puedes comprimir todos los comportamientos del sistema en un hardware que se pueda construir en el sentido de que ocupe un espacio finito, a ese nivel de estudio. No puedes copiar cada una de las funciones del cerebro bloque a bloque, y conectarlas para que se ejecute un sistema de IA fuerte porque éste sólo emergería de un sistema dinámico con capacidad para modificar la propia estructura de la red de la que emerge (algo que a priori parece imposible mediante la interconexión de bloques funcionales preensamblados que no sean idénticos y no compartan el protocolo de comunicación —porque, si no, estos bloques ya serían un proyecto de neurona—); sólo obtendrás una simulación más o menos potente pero distinta al proceso original. Lo que deberías de hacer es ir a la fuente, a la neurona, y tratar de replicarla de forma masiva —que es la forma en que resulta útil—. Por supuesto, replicarla correctamente lleva implícito replicar el esquema de decisión que permite la evolución de la red neuronal tras la interconexión. Así, no programamos las funciones del sujeto a simular directamente; programamos el patrón de evolución de las neuronas, de las que luego emergerá el sujeto a base de misteriosas interacciones. Nuevamente, estamos ante la misma cuestión pero en diferentes niveles de implementación: trasladamos la teoría del funcionalismo al nivel de la neurona individual en lugar de a sus supraestructuras.
La IA fuerte sería un proceso global, emergente de una red de una infinidad de pequeños componentes completamente conectados entre sí, en lugar de surgir de una interconexión de bloques funcionales. Y la verdad es que la diferencia es difícil de apreciar, no ya por la pregunta de cuántos elementos marcan la diferencia, si no además porque al final, una única neurona sólo puede dedicarse a una tarea en cada instante de tiempo y es de esperar que surja algún sistema de jerarquía o estructura de control en cualquier clase de red neuronal, por lo que en cualquier caso, en cada instante, siempre estaríamos en un escenario de bloques funcionales (pero dinámicos gracias a la sopa neuronal).
Pero ésa sería la clave: bloques funcionales dinámicos. Una explicación podría ser que la IA fuerte es (entre otras cosas, porque lleva implícita la presencia de un agente consciente) la envolvente de la idea de la conexión de bloques (IA débil): interconectar bloques funcionales equivaldría a hacer un muestreo del sistema, de la red, en un determinado instante de tiempo. Extrapolar ese comportamiento a escenarios diferentes sin duda debería dar resultados divergentes a los del sistema inteligente original puesto que éste sí es adaptativo. La IA débil es una solución a los problemas a corto plazo, y la IA fuerte, a largo plazo. ¡Pero, claro, alguien podría argumentar que, dado que en nuestro universo la estructura percibida de todos los subsistemas del mismo se degrada en el dominio del tiempo, el largo plazo es largo muy subjetivo y no debería utilizarse como elemento diferenciador! Pero no: soluciones a largo plazo, por breves que sean, salvo alguna singularidad, siempre deberían permitir soluciones en plazos más breves.
3. SOBRE LA CONSTRUCCIÓN DE NEURONAS ARTIFICIALES
Si trabajamos bajo la suposición no demostrada de que la IA fuerte sólo puede emerger de la interacción de una red neuronal de cierta dimensión aún por definir, estaremos de acuerdo en que el problema es duplicar la neurona biológica mediante algún tipo de hardware.
El primer problema: una neurona parece que podría considerarse como un modelo oculto de Markov. Y, reutilizando el título de un artículo en Francis (th)E mule Science's News: Es imposible reconocer la forma de un tambor escuchando sólo su sonido.
«Un modelo oculto de Markov o HMM (por sus siglas del inglés, Hidden Markov Model), es un proceso por el cual se observa el comportamiento del sistema de manera indirecta pues los estados del mismo permanecen ocultos para el observador.»
Lo que nosotros percibimos al observar una neurona es un sistema que genera una secuencia de salida cuando se sobrepasa un valor de tensión umbral a la entrada:
«Over long distances neurons communicate via electrical impulses. However, when these signals reach the inputs (called "dendrites") of another neuron, every input pulse causes a small puff of a specific chemical to be released into the gap (called a "synapse") between neurons. This substance briefly opens a number of ion channels in a nearby patch of the receiving neuron's cell membrane, and the resulting flow of charge carriers causes this area to act like a miniature battery. The same thing happens throughout the neuron's tree-like collection of inputs and the combined charges are funnelled back to the body of the cell (known as the "soma"). Thus, the neuron gradually becomes more and more electrically charged. When there is enough accumulated potential, the neuron spontaneously generates its own series of impulses which travel down the output fiber (the "axon"). Eventually this signal impinges on the inputs of succeeding neurons where a similar series of events then takes place.»
Fragmento, Neural Control of a Mobile Robot, by Jonathan Connell.
«AANN’s structure [Analog Artificial Neural Network] is a skeletal network of analog electronic components, drawing inspiration for its design from forms observed in early plant and marine life, and technological objects of modern telecommunications (satellites, antennas, transmitter towers, etc.). Though designed to approximate neural network behavior, AANN is not a tool for running calculations; the project is meant to give a physical and interactive form to otherwise abstract computational theories used by computer scientists in pattern recognition applications.»
Fragmento, Creative divergents.
«Part of the final crucial stage in developing AANN was figuring out how to put all the neurons together. The connections of a bunch of neurons was what made the network and how those connections are determined influence the final behavior of the entire system. Just how does the arrangement and connectedness of the network effect the behavior?»
Fragmento, Phil Stearns/AANN: a STEIM residency project report.
4. PARA FINALIZAR: PREGUNTAS Y MÁS PREGUNTAS
Si un sistema que puede cambiar entre estados fuese un sistema inteligente, entonces un sistema de Markov es un sistema inteligente. Un sistema de Markov puede ser utilizado para representar una gramática (las reglas de construcción de un lenguaje).
¿Convierte esto a cualquier gramática/cualquier lenguaje en una entidad inteligente? (En este punto recomiendo leer esto)
Pero si la mera manipulación de símbolos no tiene nada que ver con la consciencia, ¿qué tiene que ver la inteligencia con la consciencia?, ¿cuál es el papel real de la semántica en la inteligencia? ¿cómo definirías semántica de modo que fuese una idea no reducible a la mera manipulación de símbolos o relaciones?
¿Diremos entonces que cualquier conjunto de reglas coherentes entre sí y que permitan construir sentencias de longitud no acotada (como ocurre en cualquier idioma si obviamos los límites prácticos) constituye un universo inteligente?
¿Cuál es el lugar de los sentimientos, los deseos, la motivación, en todo esto? Y, si son independientes de la idea de inteligencia, ¿no está la inteligencia entonces sobrevalorada?
Imagen © Kat Burns.