Epistemología e informática, Claudio Gutiérrez, Costa Rica

La informática como ciencia empírica

Claudio Gutiérrez book


Propósitos:

Este capítulo busca familiarizar al estudiante con la perspectiva según la cual la informática es una ciencia empírica, de parecida naturaleza a la biología o la física. Para profundizar en esta perspectiva, se hace énfasis en el carácter hipotético de algunas importantes tesis informáticas. Se busca también dar a conocer en cierto detalle el paradigma funcionalista, dominante en la informática. Como visiones alternativas, se presenta a los lectores

  1. la crítica al funcionalismo inspirada por los intentos de reducción de la psicología a la neurobiología y

  2. el enfoque conexionista que busca trascender el funcionalismo mediante análisis y construcción de procesos paralelos distribuidos.


Introducción

Una ciencia teórica examina, como hemos visto, los constreñimientos a que está sometido necesariamente el pensamiento, sea desde el punto de vista de la lógica o de las matemáticas. Una ciencia empírica, en cambio, describe a la naturaleza según ciertas categorías de carácter experimental, que pueden ser mejor o peor adaptadas a esta tarea; la ciencia es corregible de conformidad con los resultados de nuestras observaciones y experimentos sobre el mundo que nos rodea. De acuerdo con esto, queremos explorar la posibilidad de que la informática sea más bien una ciencia empírica, y no una ciencia teórica como la teoría de la computabilidad. Sin embargo, a pesar de ese contraste con lo tratado en el capítulo segundo, creemos que habrá continuidad en el tratamiento de la cuestión sobre la naturaleza de la informática, dado que la tesis "distintivamente Turing" –explicada en dicho capítulo– puede ser considerada como el fundamento teórico del paradigma computacional de la informática que discutiremos aquí. Tal paradigma surge como idea abstracta en la obra de Turing, como la noción de máquina universal capaz de imitar a cualquier otra máquina, y logra ser elaborada en la forma de una "ley de estructura cualitativa", de carácter empírico, por Newell y Simon, en su conferencia del año 1980.

Cuando Newell y Simon, estudiosos de psicología e informática, se enfrentan con el tema de la inteligencia humana, se encuentran con que la obra de Turing les proporciona elementos suficientes con qué construir una hipótesis empírica sobre los fenómenos de la computación. Esta hipótesis va a ser definitivamente empírica y, por consecuencia, comprobable en la práctica, donde tendrá que demostrar su temple, en el sentido de Popper, proveyendo un marco conceptual adecuado para la articulación de las ciencias cognoscitivas. De acuerdo con la posición de estos autores, la informática es una ciencia "como las otras" (es decir, como las ciencias empíricas, sea la química, la física, la geología, la biología, las ciencias sociales) y, en cuanto tal, sus hipótesis pueden ser refutadas por la realidad, es decir, pueden ser falsadas por experimentos. En cambio, la máquina de Turing no puede ser falsa, pues como noción abstracta, en cuanto concepto de algoritmo, es solo una definición matemática, y no hay experiencia posible que pudiera refutarla; no está en su naturaleza ser refutable por su carácter analítico y a priori NOTA 1. Y la informática, según Newell y Simon, está constituida no por teorías analíticas, como las disciplinas matemáticas, sino por hipótesis empíricas, al igual que cualquier otra disciplina científica.

Básicamente, lo que estos autores nos dicen es que la computación es un fenómeno tan complicado, que hay que hacer hipótesis sobre él, como las que se hacen sobre el comportamiento de los sistemas físicos. Como los que estudian las otras ciencias empíricas, es también un fenómeno físico, al igual que la deriva de los continentes o la propagación de las enfermedades infecciosas. El estudio de un fenómeno tan complicado requiere, como la aclaración de cualquier otro fenómeno complicado, de experimentos, y de hipótesis que expliquen sus resultados. Si consideramos que el signo de las disciplinas empíricas, o ciencias experimentales, es el uso de experimentos, con ese criterio podemos sin duda decir que la informática es una ciencia empírica, puesto que cada programa de computación que corremos constituye un experimento, una pregunta que le lanzamos a la naturaleza.

Las disciplinas teóricas son una ayuda muy valiosa, sobre todo porque nos dicen qué cosas son imposibles y no debemos intentar, qué cosas son difíciles y debemos intentar solo con cautela, y en todo caso, qué previsiones debemos tomar para embarcarnos en distintos tipos de investigación. Pero nos dicen muy poco sobre qué cosas sean posibles; esto solo podemos averiguarlo haciendo experimentos. En este sentido, existe una clara complementariedad de la informática como ciencia teórica –la teoría de la computabilidad, que determina qué cosas son imposibles y explora los límites y posibilidades de la disciplina– y la informática como ciencia empírica –que trata de inventariar los fenómenos computacionales y formula toda suerte de hipótesis sobre su naturaleza y características–.

El método analítico de la teoría computacional determina los límites de la disciplina, de manera a priori, sin interrogar a la naturaleza. Pero, fijados esos límites, el fenómeno de esa complejidad que constituye la informática, deber ser aclarado por el mismo método que usan las ciencias experimentales, el método hipotético-deductivo que incluye la experimentación como etapa insoslayable. Esa es, en breve, la tesis de Newell y Simon. Otros autores que examinaremos en este capítulo refuerzan, amplían y profundizan esta tesis, conocida corrientemente por los nombres –intercambiables– de simbolismo o funcionalismo.


Explicación de textos

Ejercicio de lectura

Recomendamos leer el texto Alan Newell y Herbert Simon (NEWELL 81), o una selección traducida al español en el capítulo cuarto de nuestra Antología.


Comentario

En su artículo seminal de donde fue extraído este texto, versión publicada de una conferencia que impartieron precisamente cuando fueron galardonados con un premio que ostenta el nombre de Turing, Newell y Simon nos proponen como tesis que la informática es una ciencia empírica. Con ello quieren decir que la informática formula hipótesis sobre la realidad, abstraídas de datos empíricos, y después investiga si estas hipótesis son adecuadas, exactamente de la misma forma en que lo hacen la física o la biología. En el artículo original no se limitan a proponer la tesis de que la informática es una ciencia empírica; además, como prueba de este aserto, ofrecen dos ejemplos de hipótesis empíricas –que, por ser sustentadas en la experiencia, podrían eventualmente ser falsadas por esta– postuladas por la informática. Estos importantes ejemplos que proponen, en forma bastante detallada, son la hipótesis de los sistemas de símbolos físicos y la hipótesis de la búsqueda heurística. En el texto incluido en la Antología solamente se reproduce la primera de estas hipótesis. Dada esta omisión, permítasenos hacer aquí una síntesis de la segunda de ellas.

Newell y Simon estuvieron entre los primeros investigadores que trataron de reproducir en una máquina el ejercicio de la inteligencia, con un famoso programa llamado "Resolvedor general de Problemas" (más conocido por sus siglas en inglés, "GPS"). Este era un programa que emulaba la inteligencia humana por medio de una técnica que denominaron análisis de fines y medios. De acuerdo con esta técnica, se define un estado inicial y un estado final como forma de caracterizar la situación problemática; todo problema se plantea como un duplo: el estado que tenemos ahora y el estado que queremos obtener por medio del trabajo intelectual que intentamos emular. Estos estados tienen que estar representados en un formalismo común, porque de otro modo no habría manera de pasar de la representación del primer estado a la representación del segundo. Lo cual implica, por supuesto, que los problemas que se traten de resolver tienen que poder ser representados en algún formalismo (según una tesis implícita en el paradigma funcionalista de que no hay inteligencia sin representación).

Pues bien, dentro de ese contexto, la hipótesis de la búsqueda heurística nos dice que los problemas se representan como estructuras simbólicas y que un sistema de símbolos físicos ejerce su inteligencia generando y progresivamente modificando estructuras simbólicas hasta producir la estructura que corresponde a la solución. El término "búsqueda" se utiliza porque en vez de pensar en esta progresiva modificación de estructuras, resulta útil imaginar un mundo conceptual, también llamado "espacio lógico", donde preexistirían todas esas formas estructurales, y concebir el ejercicio de la inteligencia como un viaje por ese espacio que finalmente nos lleva a encontrar la estructura final que andamos buscando.

En la práctica, todas estas estructuras no existen desde el principio, pero podemos pretender que existen si poseemos un "generador" capaz de producirlas, en forma ordenada, una por una, para que la inteligencia las compare con la estructura meta o final. De ahí que este método se haya llamado también el método de la generación y la prueba, que puede concebirse como un ciclo en que sucesivamente generamos una estructura y la comparamos con el modelo de la meta buscada; si no hay todavía correspondencia, volvemos a generar, y así sucesivamente hasta encontrar la meta o agotar las capacidades del generador. La palabra "heurística" se agrega a la de "búsqueda" porque normalmente la búsqueda no se hace de modo exhaustivo sino en forma selectiva, de conformidad con reglas que tratan de predecir cuán promisoria sea cada estructura que queremos desarrollar (emplear como base para generar otras estructuras).

La hipótesis de la búsqueda heurística hace uso esencial en su formulación del término "sistema de símbolos físicos". Este término es tan fundamental en informática, nos aseguran los autores, como el término "célula" es fundamental en la biología contemporánea, o "placa tectónica" lo es hoy en geología. Así pues, la hipótesis de búsqueda heurística, como todas las otras hipótesis que podríamos formular en informática, supone una hipótesis básica y fundamental, que nuestros autores califican de ley de estructura cualitativa, a saber: la hipótesis de los sistemas de símbolos físicos. Esta es la hipótesis a que se refiere la selección incluida en la Antología, y que procederemos a comentar.

Newell y Simon nos recuerdan que las ciencias tienen, además de leyes cuantitativas, que son las más elaboradas, leyes de estructura cualitativa, que son más generales y describen la naturaleza desde un punto de vista particular correspondiente a la respectiva disciplina. Mencionan como tales leyes, la doctrina celular de la biología, la doctrina de las placas tectónicas en la geología, la de los gérmenes en la medicina y la del atomismo en la física. Debemos hacer notar que esta caracterización tiene mucho que ver con el concepto de paradigma que hemos estudiado en el capítulo primero, especialmente en relación con el texto de Thomas Kuhn. Recomendamos al lector tomarlas aproximadamente como el mismo concepto –aunque en detalle puedan tener sus diferencias– pues para los efectos que aquí interesan "ley de estructura cualitativa" y "paradigma" funcionan de manera muy semejante.

La hipótesis de los sistemas de símbolos físicos es un ejemplo de ley de estructura cualitativa. Como tal, provee un paradigma para la ciencia cognoscitiva y, en este sentido, complementa la obra de Turing, dándoles un tono empírico y explícito a las anticipaciones teóricas e implícitas de ese gran matemático y filósofo. En el fondo, no es nada diferente de lo que hemos llamado la tesis "distintivamente Turing" en el capítulo segundo. Veamos cómo formulan la hipótesis estos autores.

Los sistemas de símbolos que les interesan a nuestros autores son sistemas de símbolos físicos. ¿Por qué físicos? Porque están hechos en último término de altos y bajos en una corriente eléctrica. ¿Por qué sistemas? Porque aparecen siempre integrados en conjuntos con relaciones muy complejas entre sí y que, además, tienen límites muy claros en relación con su entorno. Un sistema es una configuración de componentes que mantienen entre sí relaciones mucho más fuertes que las que mantienen con el entorno; además, estas últimas están localizadas en sus llamados canales de entradas y de salidas.

Y finalmente, ¿por qué símbolos? Esto se conecta con la noción de representación, mencionada antes; en el fondo, cuando decimos "sistemas representativos" estamos diciendo lo mismo que cuando decimos "sistemas de símbolos". El símbolo y la representación son conceptos muy cercanos; los dos conceptos nos remiten más allá de sí mismos: el símbolo simboliza otra cosa; la representación, la representa. Un símbolo físico es un ente físico muy especial que apunta hacia otra cosa. La palabra "apunta" es más clara que las palabras "simboliza" o "representa", está menos cargada de contenido filosófico y emocional, y por ello nos permite hacer una transición suave hacia un concepto completamente informático del simbolismo, más fácil de explicar y de entender, asociado con el mecanismo del puntero.

En programación, un puntero es una variable cuyo contenido constituye el nombre de otra variable; una dirección de la memoria que contiene otra dirección. El símbolo en sentido puramente físico no es nada más ni nada menos que un puntero en la memoria de una máquina. En su intento de aclarar la inteligencia, nuestros autores se deciden a usarlo como concepto clave para definir el término de símbolo físico. Pero debemos notar que este concepto de simbolismo es minimalista: no contiene nada más elaborado que la idea informática de puntero, o sea, una dirección de memoria que aloja el nombre de otra dirección de la misma clase.

Creemos haber aclarado los conceptos de "sistema", "físico" y "símbolo" empleados por nuestros autores en el título de su teoría favorita. Antes de entrar directamente a su formulación, debemos todavía desglosar un poco el concepto de "expresión simbólica". Una expresión es una cadena de símbolos, que ella misma participa de la calidad representativa de otra realidad, computacional o externa a la máquina. Estas cadenas de símbolos son jerarquizadas, es decir, una expresión mayor es descomponible en expresiones menores, que a su vez pueden tener componentes que son también expresiones simbólicas, hasta llegar a componentes que son símbolos no descomponibles, o sea, punteros atómicos.

Otra manera de decir lo mismo es comenzar con los símbolos atómicos y decir que pueden combinarse entre ellos para formar expresiones simbólicas moleculares, que a su vez pueden asociarse con otras expresiones simbólicas, moleculares o atómicas, para formar expresiones simbólicas mayores, y así sucesivamente. Este carácter recursivo de las expresiones simbólicas resultará tener una importancia trascendental en la polémica del simbolismo con el conexionismo que veremos más adelante en este capítulo: en efecto, solo los sistemas de símbolos, pero no las redes conexionistas, son recursivas en este sentido.

Una vez introducida la idea de expresión simbólica, los autores atribuyen al sistema dos capacidades centrales relativas a la estructura de expresiones, símbolos y objetos: son ellas las capacidades de designación e interpretación.

Los objetos a que se refiere la definición de designación son otras estructuras simbólicas, o sea objetos computacionales. Lo más importante del concepto de designación es proveer una vía de acceso al objeto, en lo que consiste esencialmente la designación. El caso más simple es el del nombre de una variable, a la cual se le ha asignado un valor, por ejemplo, una expresión simbólica. Digamos el caso de que en Logo atribuyamos valor a una variable mediante la expresión:

De ahora en adelante, la lista que constituye el valor de la variable será accesible por el simple uso del símbolo "VARIABLE", por ejemplo, para imprimirlo, hacerlo parte de otra expresión simbólica más grande, etcétera.

La interpretación, por su parte, es la capacidad de desencadenar un proceso computacional que está asociado a una expresión. Dada la expresión, el sistema es puesto en movimiento para realizar el proceso que le está asociado, lo cual significa que el sistema puede invocar sus propios procesos para ser ejecutados, por el simple acceso a las expresiones que los designan. Por ejemplo, cualquiera de las primitivas de Logo es un símbolo que el sistema interpreta como una acción determinada: la expresión simbólica

desencadenará un proceso que producirá el correspondiente desplazamiento de la tortuga en la pantalla. Pero también, la expresión simbólica

producirá un dibujo en la pantalla, si previamente se ha asociado el símbolo "CUADRADO" con un procedimiento, mediante la expresión

Estas capacidades de designación e interpretación son de gran generalidad y poder. Así, un símbolo puede ser usado para designar absolutamente cualquier otra expresión. Por otra parte, existen expresiones para designar cada uno de los procesos originales de los que la máquina es capaz, como imprimir, hacer aparecer caracteres en la pantalla, etcétera. Además existen procesos para crear cualquier expresión, o para modificarla de manera arbitraria. Todas estas expresiones están dotadas de estabilidad: una vez creadas, permanecen como tales mientras no sean explícitamente modificadas o borradas. Finalmente, el número de expresiones que el sistema puede contener está limitado solamente por el tamaño de la memoria de la máquina.

Tomando en cuenta todas esas características de los símbolos y de las expresiones simbólicas que podemos construir a partir de ellos, nos es posible enunciar la hipótesis de estructura cualitativa para los sistemas de símbolos, a saber, la

hipótesis de los sistemas de símbolos físicos

Esta hipótesis hace uso de los conceptos de condición suficiente y necesaria estudiados en el capítulo anterior en relación con el concepto de definición lógica. Sin embargo, los autores no han querido usar los términos exactos, sino una versión debilitada de los mismos: no "condiciones necesarias (o suficientes)", sino simplemente "medios necesarios (o suficientes)". La razón de esta decisión tiene que ver con las limitaciones de la definición por condiciones suficientes y necesarias que analizamos en el capítulo anterior, en relación con la vida práctica. Tales definiciones son demasiado rigurosas como para ser útiles en las situaciones reales. La versión debilitada es más realista. Si empleáramos la definición estricta, sin debilitamiento, a saber,

esto equivaldría a afirmar que una computadora, como encarnación más próxima de la máquina universal de Turing, y por lo tanto de un sistema de símbolos físicos, está dotada de hecho y ahora mismo de inteligencia. En cambio, en la versión debilitada solo enunciamos, más prudentemente, que una computadora es programable para adquirir esa inteligencia.

Igualmente, la tesis fuerte nos diría que todo sistema inteligente exhibiría ya, sin necesidad de mucho análisis, su condición de sistema de símbolos físicos, sin que restara nada por hacer a los científicos para demostrar esta conformidad. En cambio, la tesis debilitada solo nos promete que, después de duras investigaciones, podremos algún día encontrar, por ejemplo, que el cerebro humano es un tal sistema de símbolos físicos.

Dicho de otra manera y en resumen, la hipótesis como está enunciada por Newell y Simon es la expresión de sendos programas de investigación, a largo plazo, para las disciplinas gemelas de la inteligencia artificial y la ciencia cognoscitiva: para la primera, en cuanto le toca elaborar las condiciones suficientes a partir de los medios suficientes que ofrecen los sistemas de símbolos físicos, a fin de producir la inteligencia de manera artificial; para la segunda, en cuanto le toca descubrir las condiciones necesarias a partir de los medios necesarios, a fin de comprender plenamente el funcionamiento del cerebro humano. Así lo expresan los autores mismos:

Y en cuanto a "acción inteligente general", se trata de la capacidad para que en situaciones reales se produzca un comportamiento del sistema apropiado a sus fines, adaptativo en relación con las demandas del ambiente.

Los autores insisten en que la hipótesis de sistemas de símbolos físicos es claramente una ley de estructura cualitativa. Tal ley especifica una clase muy general de sistemas dentro de los cuales se podrán y deberán encontrar aquellos capaces de acción inteligente. En cuanto ley de estructura cualitativa, es una hipótesis empírica, tanto como la hipótesis de placas tectónicas de la geología o la hipótesis celular de la biología, para citar a algunas de las otras leyes de estructura cualitativa, de carácter indudablemente empírico. La acción inteligente existe por doquier en el mundo biológico, especialmente en el comportamiento de los seres humanos. Pero además, es una forma de conducta tan característica, que podríamos reconocer por sus efectos, incluso en el caso de que fuera ejecutada por seres ni humanos ni biológicos.

La hipótesis es además muy ambiciosa; nos dice que la acción inteligente correspondería a sistemas de símbolos físicos incluso en esos casos de inteligencia no biológica. Como tal, bien podría ser falsa; podría ser por ejemplo que nunca resultara posible producir una inteligencia artificial. O que llegáramos a descubrir que el cerebro, después de todo, no es realmente un sistema de símbolos físicos NOTA 2. Esta característica de poder ser falsa es lo que concede a la hipótesis su carácter eminentemente empírico: en la medida en que la consideremos verdadera será porque la experiencia tienda a confirmarnos en la convicción de que es verdadera.

Para los autores, una de las más importantes confirmaciones de la hipótesis de los sistemas de símbolos físicos estriba en el hecho de que la búsqueda de explicaciones del comportamiento inteligente del hombre en términos de sistemas de símbolos ha tenido un éxito considerable durante los veinte años anteriores al artículo (décadas de los sesenta y setenta); hasta tal punto que la teoría del proceso de información ha llegado a ser el punto de vista dominante en psicología cognoscitiva. Especialmente en las áreas de resolución de problemas, adquisición de conceptos y memoria de largo plazo, los modelos de manipulación de símbolos dominan la escena, como lo hacen notar nuestros autores. Así, el carácter empírico de la informática queda confirmado por esta alianza de la informática con la psicología, ciencia que nadie podría tildar de simplemente teórica. Esa alianza es de doble dirección: no solo se usan experimentos psicológicos para comprobar la veracidad de los modelos de simulación que tratan de explicar la conducta humana, sino que de los experimentos surgen nuevas ideas para el diseño y construcción de nuevos sistemas de símbolos físicos.

Es importante notar que de acuerdo con este planteamiento y en consonancia con la perspectiva general del funcionalismo NOTA 3, las condiciones de la acción inteligente no tienen nada que ver con el material de que esté hecho el agente respectivo. Lo importante es que dicho agente encarne en su organismo o mecanismo un sistema de símbolos físicos. Es la función que realizan las partes de ese sistema y no la materia de que están construidas, lo que explica la acción inteligente. Una de las ventajas de este planteamiento es que logra una considerable unificación de las disciplinas científicas involucradas, ya que no necesitamos teorías diferentes para explicar inteligencias diferentes. Todas ellas resultan ejemplos de sistemas de símbolos físicos.

La hipótesis ofrece una explicación totalmente general al problema de la inteligencia, con completa abstracción de su forma de implantación, de su encarnación, por así decirlo. Dicho de otra manera, si la inteligencia es explicable como el comportamiento de un sistema de símbolos físicos, este sistema puede quedar encarnado en un hombre, en una computadora, en un animal no humano, o en un ser pensante cualquiera extraterrestre; es suficientemente general para cubrir cualquier sistema capaz de pensar, esté construido de neuronas, de conmutadores eléctricos, o de cualquier otra cosa. Esta osada teoría no se queda sin objetantes, como veremos más adelante en este mismo capítulo: contra ella van a reaccionar enérgicamente, entre otros, los practicantes o apóstoles de la neurociencia.


Ejercicios de aprendizaje

1) Haga un extracto de las principales ideas discutidas en el texto a que se refiere el comentario precedente.

2) Identifique dos sistemas de símbolos físicos cualesquiera que usted encuentre rutinariamente en su vida ordinaria.


Respuesta a los ejercicios de aprendizaje

1) Si su resumen incluye las siguientes ideas puede considerarlo correcto.

2) Por ejemplo, los signos de circulación en la ciudad (signos de ALTO, flechas de dirección sobre las calles, luces de distintos colores, etcétera); el sistema monetario (billetes de distintas denominaciones que se pueden cambiar por monedas fraccionarias de distintos valores, o por las mercancías, bienes y servicios que ellas representan).


Ejercicio de lectura

Recomendamos leer el texto Marr y Poggio, difícil de conseguir (MARR 76), o una selección traducida en el capítulo cuarto de nuestra Antología.


Comentario

El texto de Marr y Poggio nos pone en relación con uno de los estudios informáticos que reviste carácter más empírico. Se trata aquí de la obra de dos investigadores que contribuyen a esclarecer los aspectos epistemológicos de la percepción visual con un enfoque eminentemente empírico y tecnológico, a saber: mediante la construcción de una vista artificial. Para proceder de esta manera, han tenido que elaborar una metodología especial, que ha resultado ser de considerable trascendencia para la ciencia cognoscitiva contemporánea. Esa metodología, demasiado técnica para explorarla en detalle aquí, descansa en una ontología, es decir, en una caracterización fundamental sobre lo que hay, sobre los tipos o niveles de seres con que tenemos que lidiar en el estudio de la percepción visual.

En un libro que publica en 1982, seis años después de la publicación del artículo suyo que comentamos, David Marr propone un esquema de división de niveles en ciencia cognoscitiva que ha resultado muy influyente, basado en lo fundamental en la categorización de 1976. Propone ahí tres niveles ontológicos distinguibles: el computacional, el algorítmico y el de la implantación. Cada uno de estos niveles de descripción se diferencia claramente de los demás, y todos están relacionados entre sí lógica y causalmente. Sin embargo, ningún nivel particular de descripción es independiente de los otros. En realidad corresponden a diferentes focos de atención para concebir una realidad que es fundamentalmente la misma. Algoritmos diferentes se implantan más naturalmente en ciertas arquitecturas físicas, de modo que la información sobre la implantación puede determinar la configuración de nuestro nivel algorítmico. La categorización propuesta puede resumirse en la siguiente tabla:

Los tres niveles de una máquina que procesa información

Teoría computacional Representación y algoritmo Implantación en hardware
Cuál es la meta de la computación, por qué es apropiada y cuál es la lógica de la estrategia por medio de la cual se lleva a cabo. Cómo puede esta teoría computacional ser implantada. En particular, cuál es la representación para las entradas y salidas y cuál es el algoritmo para la transformación. Cómo pueden la representación y el algoritmo ser realizados físicamente.

NOTA 4

La teoría computacional enfoca el análisis del problema que el sistema soluciona, no los métodos por medio de los cuales lo soluciona. En el nivel computacional no es importante si la teoría se ofrece en la forma de una máquina Turing, de un conjunto de axiomas o de cualquier otra manera. No importa aquí tampoco cuánto dura la computación o si es afectada por la carga de la memoria o la complejidad del problema. Ni siquiera importa cómo se representa la información, con tal de que el lenguaje representativo sea suficientemente rico. Lo importante es cuál función se computa y no cómo se computa. En el nivel de descripción del algoritmo, en cambio, nos preocupamos de cuestiones de eficiencia, degradación del rendimiento por condiciones adversas, de la facilidad o dificultad del problema, del tiempo que toma la solución, de cómo representamos la información, etcétera. Este nivel pareciera ser, por ejemplo, el de la investigación psicológica en general; en relación con él es que parecen atinentes los datos psicológicos.

Marr recomienda como una buena estrategia para el desarrollo de teorías, comenzar por un análisis exhaustivo del propósito de la computación y un intento de formalización NOTA 5 del problema que el sistema debe resolver. Considera que el análisis del problema de arriba para abajo es un mejor enfoque para sugerir algoritmos que el análisis de abajo para arriba, y por ello le da la máxima importancia a este primer nivel de descripción. En la ciencia cognoscitiva, especialmente en psicología, pareciera predominar el nivel del algoritmo, pues la mayor parte de las investigaciones se concentran en ese nivel, y solo ocasionalmente llegan a formular teorías computacionales suficientemente compendiosas.

Toda esta cuestión ontológica se presenta en el artículo de Marr y Poggio bajo la forma de la pregunta por el nivel de abstracción en que deben ser observados los fenómenos. Con esta motivación es que recomiendan distinguir cuatro niveles: el más bajo, de componentes básicos (transistores, neuronas, diodos, sinapsis); el segundo, de mecanismos particulares (sumadores, memorias, etc.); el tercero, de algoritmos; y el superior, que corresponde a una teoría computacional que describe la tarea perceptiva de que se trata (por ejemplo, percibir un objeto). Como se ve, en el libro posterior de Marr se realiza una refundición de los primeros dos niveles, posiblemente por la razón de que no existe suficiente diferencia de naturaleza entre los componentes básicos y sus inmediatos ensambles. En cambio, es bastante claro que existe un contraste entre todos estos elementos de carácter fundamental y la noción misma de representación y de algoritmo.

El propósito principal del artículo es subrayar la importancia individual de cada uno de los niveles en la comprensión de un proceso informático y la importancia de distinguirlos y mantenerlos separados. Por ejemplo, en intentos de relacionar problemas psicofísicos con la fisiología, es útil determinar con claridad el nivel en que surge el problema. En particular, los autores consideran que el nivel máximo o computacional es usualmente descuidado, y en realidad, para el esclarecimiento de los problemas de la percepción, pareciera ser el más importante. Esto es así porque la estructura de las computaciones que subyacen a la percepción dependen más de los problemas que hay que resolver que de la arquitectura particular en que se realizan las soluciones. Los autores comparan la situación con el desarrollo de la física, donde las descripciones globales de la termodinámica constituyeron históricamente la primera etapa en el estudio de la materia, mientras que la descripción en términos de mecanismos o componentes elementales apareció solo mucho más tarde.

Los autores resumen en el artículo algunos ejemplos de teorías en diferentes niveles, ilustrando los tipos de predicciones que pueden emerger de cada uno de ellos. El número de niveles no es lo más importante. Lo importante es más bien el concepto epistemológico de que la realidad no puede ser entendida sino a partir de puntos de vista particulares, unos más globales que otros, todos los cuales se conjugan para integrar la función del respectivo conocimiento. Esta concepción, que –como hemos visto en el capítulo anterior– no es ajena a la tradición filosófica, logra en la obra de estos autores concretarse de una manera tecnológica con estipulaciones muy específicas. Es una confirmación de la tesis general, que muchos autores contemporáneos mantienen, de que la epistemología se ha ido transformando en nuestro tiempo en una disciplina con contenido cada vez más experimental y tecnológico.


Ejercicios de aprendizaje

1) Haga un extracto de las principales ideas discutidas en el texto a que se refiere el comentario precedente.

2) Usted desea resolver un problema práctico de la vida cotidiana de su casa, y quiere adoptar una metodología científica para ello; así, decide usar la teoría de los niveles de Marr y Poggio. Elija un problema particular y formule un esbozo de los mecanismos y/o algoritmos necesarios para resolverlo, así como su implantación física.


Respuesta a los ejercicios de aprendizaje

1) Si su resumen incluye las siguientes ideas puede considerarlo correcto.

2) Por ejemplo: hay un visitante nocturno de su cocina (un ratón) que debe ser eliminado por razones higiénicas y de economía doméstica. Este es el problema, que se plantea en el nivel más alto o de la computación. Un posible algoritmo/mecanismo para resolverlo es el envenenamiento; otro es la persecución y muerte del visitante, a garrotazos; otra posibilidad es la captura por arrinconamiento o trampa; otra es ahuyentar al visitante y sellar después las entradas a la pieza, etcétera. En el nivel físico, y dependiendo del tipo de algoritmo/mecanismo elegido, será necesario obtener veneno, garrote o ratonera, o bien disponer los muebles y otros elementos de la pieza para el arrinconamiento o sellamiento, etcétera.


Ejercicio de lectura

Recomendamos leer el texto de Daniel Dennett (DENNET 81), o una selección traducida al español en el capítulo cuarto de nuestra Antología.


Comentario

Teoría de niveles

Daniel Dennett, en la selección que presentamos en este capítulo, desarrolla sistemáticamente la misma idea de niveles que hemos visto en Marr y Poggio, aunque con un sentido epistemológico más acentuado: aunque los niveles sean algo que se da en la realidad (ontología), son también puntos de vistas que podemos escoger en distintas circunstancias para tratar de comprender esa realidad NOTA 6.

El autor distingue en particular tres de estas perspectivas:

  1. la física,

  2. la del diseño y

  3. la intensional. NOTA 7

La perspectiva física es la que se impone, por ejemplo, al ingeniero que construye una computadora; la del diseño, es la perspectiva que adopta su programador; la intensional, finalmente, es la que corresponde al usuario de un programa concreto. Cabe notar que la palabra "intensional" en este contexto no quiere decir "con intención"; se refiere más bien a la significación escolástica reintroducida en la filosofía contemporánea por Franz Brentano, de referencia esencial a un objeto, contenida en todos los conceptos que expresan actitud de un sujeto hacia un objeto (tales como "creer","desear", "temer", "querer", "conocer", "creer", etcétera). Para lo que sigue, vamos a llamar intensional a todo aquello que tiene la naturaleza de un deseo (positivo o negativo) o de una creencia. El conocimiento, como creencia justificada, será también considerado como un estado intensional del sujeto.

Dennett insiste en la conveniencia y legitimidad de usar el punto de vista superior (nivel intensional) para tratar de entender el comportamiento de un programa inteligente (por ejemplo, un programa que juegue ajedrez). Basa su recomendación en el supuesto de diseño óptimo del programa. Considera que este supuesto es semejante a la suposición de racionalidad que todos hacemos cuando interactuamos con otras personas (en este caso lo que suponemos es que el organismo de la persona con quien actuamos ha sido óptimamente diseñado por la evolución y la selección natural). Todo esto lleva al autor a postular, en conjunto con otros filósofos funcionalistas, la autonomía de la psicología como ciencia, por corresponder a un nivel de discurso e interpretación enteramente distinto de aquel en que se desenvuelve la ciencia neurofisiológica.

Todos conocen o han oído hablar de programas de computación que juegan ajedrez. No son todavía campeones del mundo, pero sí pueden vencernos a casi todos los otros jugadores. Imaginemos que presenciamos una partida entre uno de estos programas y un experto jugador humano. Si ahora nos preguntamos, cuál irá a ser la próxima jugada del humano o de la computadora –según sea el caso– nos encontramos con la siguiente situación.

  1. Es igualmente difícil o fácil predecir la jugada de cualquiera de los dos contrincantes.

  2. La predicción se basará en los mismos principios y circunstancias (básicamente, intenciones de los jugadores y significados, para cualquiera que conozca el juego, de las posiciones del tablero).

  3. Ninguna combinación de observaciones sobre estímulos y respuestas (de los que interesan a los psicólogos conductistas) sería suficiente para predecir ninguna jugada interesante.

  4. La predicción deberá basarse en la definición del juego, en la suposición de que el jugador tiene el propósito de ganar y en la suposición igualmente importante de que el jugador es racional (sabe escoger los medios adecuados para tratar de obtener los fines que persigue).

En relación con el supuesto de racionalidad, es interesante notar que no implica suponer que la computadora sea persona: basta suponerla "sistema intensional", tal como lo define Dennett en este texto (un sistema capaz de actuar como si tuviera creencias, propósitos, planes, etc.). No tenemos completamente claro en qué consista para un humano tener creencias, propósitos, etc. No obstante, cuando decimos –hablando de una computadora– que está tratando de fortalecer el flanco del rey, simplemente afirmamos que tiene en su "mente" algo semejante a lo que tendría un humano que se encontrara en esas circunstancias. Con una importante diferencia: en el caso de la computadora sabemos cómo funciona esa "mente", puesto que nosotros (o algún humano al que podemos interrogar) la hemos diseñado, construido y programado.

Imaginemos, por ejemplo, que la computadora acaba de adelantar un caballo. Pensemos en las maneras posibles de contestar esta pregunta: "¿Por qué hizo la computadora esa jugada?" Veamos. Si nos colocáramos en la perspectiva del ingeniero electrónico, sería complicadísimo contestarla: habría que mencionar innumerables transiciones en los estados físicos de complejos dispositivos eléctricos. En cambio, si la computadora no hubiera hecho ninguna jugada después de largo rato, la respuesta a la pregunta "¿por qué no ha jugado la computadora?" podría tal vez ser contestada por el ingeniero (o por cualquier otra persona con conocimientos rudimentarios de electricidad) de manera muy fácil; por ejemplo: "La corriente no puede pasar por este cable roto". Esta es una contestación en el nivel físico, un nivel al que recurrimos solamente cuando se descompone (enferma) el aparato.

El programador de la computadora, por su parte, podría quizá, con mucho esfuerzo, darnos su propia contestación sobre por qué la computadora adelantó el caballo, desde su propia perspectiva funcional o de diseño: para ello tendría que seguir el programa paso a paso (labor eminentemente tediosa, pero posible). Sin embargo, no podría decirnos nada sobre el caso del cable roto, en cuanto programador; podría hacerlo, en cambio, en cuanto electricista de sentido común. Ello porque en el caso de predicciones o explicaciones que se basen en el estado físico particular de un objeto determinado, tenemos que aplicar no nuestro conocimiento de un programa –ni del arte de la programación– sino nuestro conocimiento de las leyes de la naturaleza. El punto de vista del diseño implica que tratamos al objeto como un artefacto. Tiene aplicabilidad en la medida en que el objeto funcione de acuerdo con su diseño, pues si falla, no tendremos más remedio que asumir el punto de vista físico.

Los objetos naturales también pueden ser considerados desde el punto de vista del diseño. Esto implica suponer que fueron diseñados. ¿Diseñado por quién o qué? No necesitamos invocar una intervención sobrenatural. Podemos aceptar como diseñador a la evolución, a la selección natural. A la perspectiva del diseño, perspectiva eminentemente funcionalista (solo la función es importante) no le interesa distinguir entre objetos naturales y objetos artificiales; si un órgano cumple una función, puede ser explicado por exploración de su diseño, cualesquiera que fueren las fuerzas que lo hayan originado. Igualmente, esta perspectiva es neutral con respecto a la constitución física o la naturaleza de las vísceras del objeto cuyo comportamiento estamos tratando de explicar o predecir: le da igual que sea hecho de carne, de silicio, o de cualquier otro material, basado en la química del carbono o en cualquier otra química.

Si uno sabe exactamente cómo fue diseñado el programa, es posible predecir cuál jugada va a hacer, simplemente siguiendo sus instrucciones. La palabra "simplemente" en este caso puede disimular enormes dificultades prácticas. Pero, en principio, es posible. Estas predicciones se cumplirán siempre que la computadora o el programa trabajen sin interrupción física. Es normal adoptar este punto de vista del diseño para hacer predicciones sobre el comportamiento de objetos mecánicos, por ejemplo cuando la máquina de escribir se acerca al margen, decimos que va a sonar una campana. Lo fundamental de este enfoque es que hacemos las predicciones con base únicamente en el conocimiento del diseño del objeto, independiente de su constitución física. No nos interesa, por ejemplo, de qué material está hecha la máquina de escribir, y por supuesto, en el caso de la computadora, no nos importa si se trata de una Macintosh o una IBM.

La manera más natural, sin embargo, de contestar preguntas sobre aparatos que procesan información, como nuestro ejemplo del jugador electrónico de ajedrez, es desde el tercer nivel, el nivel intensional: "La computadora" –diremos– "adelantó el caballo porque cree que el flanco del rey está débil y desea fortalecerlo". Es de notar que en el nivel intensional es posible hacer predicciones (o explicaciones) en distintos subniveles, todos ellos intensionales. Se puede decir: "La computadora está tratando de ganar la partida", o "La computadora está tratando de hacer una buena apertura", o "La computadora trata ahora de dominar el centro".

El usar el nivel intensional de explicación no implica que los otros no sean también posibles; es más, siempre debemos bajar a ellos si las circunstancias así lo exigen. Estas predicciones o explicaciones en el nivel superior son válidas solo bajo el supuesto de un diseño óptimo. En el caso de los seres humanos, rara vez cuestionamos ese postulado: creemos que nuestros semejantes están bien diseñados, sea porque tenemos suprema confianza en la evolución y la selección natural, o porque hemos sido aculturados para actuar así. Necesitamos muchísimas muestras de comportamiento aberrante para aceptar la idea de que nuestro interlocutor humano no sea racional, es decir, que no esté en sus cabales. A veces lo hacemos, sin embargo; y en ese caso descendemos al nivel de diseño para preguntarnos por el problema psicológico que lo aqueja (tuvo un desengaño amoroso) o –si el caso es aún más grave (no nos contesta cuando le hablamos, por ejemplo)– recurrimos al nivel físico (presumiblemente habrá perdido el oído).

El nivel intensional en relación con el juego de ajedrez consiste en tratar a la computadora como si fuera un jugador humano. Pero esto no significa que la consideremos una persona, simplemente la tratamos como un sistema intensional. El concepto de un sistema intensional es una noción no metafísica que no tiene nada que ver con posición social, constitución biológica, conciencia moral, etcétera, de los entes que caen dentro de él. Es mucho más fácil decidir si una máquina puede ser un sistema intensional, que decidir si una máquina realmente piensa o es consciente o es moralmente responsable. Pero, además, es interesante anotar que esa simplicidad hace ideal al concepto de sistema intensional como fuente de orden y organización en el análisis filosófico de los hechos mentales. De ahí que el autor pueda hacer esta afirmación sumamente importante: cualquier cosa que la persona sea –por ejemplo una mente, un alma, un agente moral autoconsciente– esa persona es también y por supuesto un sistema intensional. Y cualquier cosa que se siga de ser un sistema intensional será obviamente verdadera de una persona.


Sistemas intensionales

Un sistema intensional es un sistema cuyo comportamiento, por lo menos algunas veces, puede ser explicado y predicho, basándose en adscripciones al sistema de creencias y deseos. "intensional" no debe confundirse con el concepto del lenguaje ordinario de intencional, en el sentido –por ejemplo– de que uno no debe dañar intencionalmente a otra persona. El concepto filosófico de intensionalidad corresponde a la relación "acerca de". Es decir, aquel aspecto de cualquier cosa que sea una dimensión hacia otra cosa; puede ser, en el caso más rico, el conocimiento que un sujeto tiene de un objeto, o en el menos rico, la función de apuntar de un puntero que hemos usado para explicar el concepto de simbolismo NOTA 8. Lo más fácil para aclarar este concepto es dar ejemplos. Lo intensional es básicamente lo que en una cosa nos refiere a otra cosa, siendo las creencias y los deseos el caso más conspicuo. En "yo creo que", "yo deseo que", ese "que" es profundamente intensional NOTA 9.

Dennett caracteriza de manera más precisa a los sistemas intensionales diciendo que solo podemos hablar de tales en relación con las estrategias de alguien que esté tratando de explicar o predecir un comportamiento. Por ejemplo, podríamos atribuir intensionalidad, considerar como un sistema intensional, incluso a algo tan simple como un termostato, cuando tratamos de explicar que haya puesto a funcionar la nevera "porque sabe que ha subido la temperatura interna".

Veamos con cuidado en qué consiste la dialéctica de Dennett. Primero se tiene un sistema, como por ejemplo una computadora que juega ajedrez, cuyo comportamiento es complejo y difícil de interpretar desde los puntos de vista físico o de diseño; entonces decide proyectarle dos categorías que pertenecen originalmente al lenguaje de la vida personal: deseos y creencias. Esto no quiere decir, sin embargo, que lo esté considerando como una persona, sino nada más que se ha adoptado una perspectiva analógica del mundo personal, pero sin ninguna suposición metafísica o ética, solamente como un artilugio para explicar un comportamiento. Lo que se postula como "sistema intensional" es un mínimo de significado, puramente epistemológico, dejando fuera toda implicación metafísica o ética.

Ahora bien, si la estrategia da buen resultado para explicar el comportamiento de una máquina, ¿por qué no aplicarla también a los seres humanos, para entender su comportamiento en forma minimalista, sin movilizar postulados metafísicos y éticos sobre lo que sea una persona como pura máquina epistémica? ¿Qué se seguirá de considerar a las personas como sistemas intensionales, sin ninguna suposición adicional? Lo interesante es que lo que se sigue es sumamente rico; que la estrategia produce muchísima información importante. Lo sorprendente del caso es que, simplemente considerando a las personas como sistemas intensionales, podemos explicar (por lo menos) la mayor parte de su comportamiento. Y con esto hemos hecho un ingreso por la puerta grande a la ciencia cognoscitiva. Eso es precisamente lo que ofrece el paradigma informático a la ciencia cognoscitiva: la posibilidad de explicar el comportamiento humano sin suposiciones morales o metafísicas.


La saga del conductismo

Probablemente todos nuestros lectores estarán de acuerdo en que comprender el funcionamiento de la mente humana es un problema muy difícil. En realidad, es reconocido por muchos autores como el problema más difícil que haya enfrentado nunca la ciencia. Frente a esa dificultad, no puede uno menos que, inspirándose en un consejo de Francis Bacon, procurar comprender los fenómenos complicados de la naturaleza estudiando fenómenos parecidos en casos más simples: lo que la Naturaleza oculta en lo complejo, lo revela con prodigalidad en lo simple. Esta inspiración motivó a varios investigadores de comienzos de siglo a tratar de entender los fenómenos de la inteligencia estudiándolos primero en los animales. Así fue como nació la corriente psicológica que llamamos conductismo NOTA 10. También contribuyó como motivación de esos investigadores el deseo de dar al conocimiento psicológico un fundamento positivo: hacerlo tan experimental y firme como la física, en concordancia con el ideal epistemológico contemporáneo de la unidad de la ciencia. En efecto, este ideal exige que, en último término y en algún sentido fundamental, todas las ciencias puedan ser entendidas como conocimiento físico.

Así pues, este intento de dar base experimental a la psicología, el conductismo, tomó como modelo para toda la investigación psicológica los experimentos realizados con animales. Podemos considerar que la psicología animal se constituyó de hecho en el paradigma de las ciencias cognoscitivas, mucho antes del desarrollo del paradigma informático ahora vigente. Ese paradigma, en resumen, pretendía extender a todos los fenómenos psicológicos las categorías de estímulo y respuesta, originalmente inventadas solamente para lidiar con objetos de investigación que carecen de lenguaje y no nos pueden informar sobre sus propios estados internos. El caso más característico es el del perro del investigador ruso Pavlov, al cual se le puede crear un "reflejo condicionado" para que produzca saliva al sonar no más la campana que anuncia su comida.

El precio que el conductismo tuvo que pagar por ese intento de darle control empírico a la investigación psicológica fue, sin embargo, demasiado alto. Equivalió a negar validez al uso de vocablos intensionales en las explicaciones psicológicas. ¡Imagínense a lo que queda reducida la psicología si le negamos la posibilidad de mencionar en sus leyes cosas como deseos, propósitos, temores, aspiraciones o creencias! Contrástese esta privación con el hecho de que ahora nos atrevamos, estimulados por Dennett, incluso a usar esos vocablos para explicar las actuaciones de las máquinas. Pero, por supuesto, la gran diferencia es que sabemos que las acciones de las computadoras admiten explicaciones alternativas, aunque sean menos cómodas, que usan solamente términos funcionales o físicos. Esta posibilidad de producir, si se necesita, una explicación más básica, descansa en el hecho de que la computadora fue construida por ingenieros y programada por programadores, e ingenieros y programadores tienen sus propias maneras de explicar esos fenómenos que, para los simples usuarios de –por ejemplo– un programa de jugar ajedrez, parecen verdaderos actos de inteligencia.

Volviendo al tema de Bacon, nos encontramos que los animales no son los únicos casos en que los fenómenos intelectuales nos hablan un lenguaje sencillo; las máquinas pueden hacer otro tanto. Si los conductistas se inspiraron en los animales para entender la mente humana, los funcionalistas se inspiran hoy en las computadoras para hacer lo mismo. Pero, por lo demás, ¡qué gran diferencia! La misma que hay entre la opacidad y la transparencia. Donde en el caso de la psicología animal solo podemos considerar al animal como una caja negra, a la cual introducirle estímulos y de la cual recoger respuestas, en el caso de la computadora, podemos desarmarla, probar cada uno de sus circuitos, o estudiar detalladamente cada uno de los detalles de los programas ejecutados en ella.

¿Cómo pudimos escaparnos del dilema en que estaba el conductismo? ¿Cómo ha sido posible este milagro metodológico? Muy simple: el concepto de diseño óptimo forma un puente entre los conceptos intensionales o la idea de racionalidad y el terreno firme de las leyes de la física. La informática estudia estos diseños óptimos, también llamados programas. El paradigma de esta nueva ciencia – fundamentalmente la idea de la máquina universal– es lo que ha permitido en nuestros días considerar a cosas tan dispares como la teoría del cerebro, la psicología del aprendizaje o la inteligencia artificial, como aspectos diversos de una sola gran ciencia nueva: la ciencia cognoscitiva o moderna ciencia del conocimiento.


El estatus de los términos intensionales

Vale la pena resaltar un aspecto muy importante de la posición de Dennett con respecto al estatus epistemológico de los términos intensionales. De acuerdo con su perspectiva, es siempre en principio posible reducir el lenguaje intensional a un lenguaje no intensional, propio de los enfoques de diseño o físico. En sus propias palabras:

Estos préstamos de inteligencia se parecen mucho a un recurso a que recurren a menudo los programadores para simplificar su tarea y que recibe el nombre de 'programación estructurada'. En el capítulo II hicimos uso de ese recurso cuando escribimos en pseudo Logo lo siguiente:

La razón por la cual este trozo de código no es Logo sino pseudo Logo estriba en que en la segunda línea del procedimiento escribimos "(el :PROGRAMA, activado con :DATOS, llega a detenerse)" que es una descripción en lenguaje natural de una programación posible pero todavía no realizada. Cuando decimos: "aquí se ejecuta un procedimiento para tal cosa", o cuando invocamos el nombre de una subrutina todavía no definida, estamos tomando un "préstamo de programación". Más tarde tendremos que darle fundamento programático al procedimiento que por el momento es solo un nombre o una descripción en lenguaje ordinario. Este estilo de programar también se conoce como "programación de arriba hacia abajo", y es muy eficiente (por ejemplo, ayuda a mantener los errores lógicos en un mínimo, porque en todo momento el programador sabe lo que está haciendo, y en qué dirección desea dirigirse).

Dennett compara el discurso intensional con un medio de intercambio (una moneda) que permite la evaluación de teorías del comportamiento. En efecto, equivale a una abstracción que representa, suprimidos detalles no esenciales, las formas distintas que pueden revestir los préstamos de inteligencia y, en esa forma, es un medio confiable para detectar qué partes de una teoría están en deuda con respecto a la tarea de explicar los fenómenos cognoscitivos. Donde la teoría usa términos intensionales, ahí mismo se halla escondido un homúnculo (hombrecillo) que está ejerciendo una función intelectual que debe todavía ser explicada; o que, ha sido ya explicada en otro tiempo o lugar, pero que es engorroso llevarla a rastras en el curso del presente discurso. Cualquier mistificación queda exorcizada por adelantado, siempre que los hablantes sepan el uso a que están poniendo sus términos. Confusiones ocasionales no justifican negar a profesionales un arsenal de recursos heurísticos, útiles y seguros a personas que conocen su disciplina.


Ejercicios de aprendizaje

1) Haga un extracto de las principales ideas discutidas en el texto a que se refiere el comentario precedente.

2) Construya una explicación en tres niveles de descripción diferentes para cada uno de los siguientes sucesos:

a) María digita febrilmente sobre el teclado.
b) Los músculos faciales de Víctor se contraen, su cuerpo sufre movimientos de sacudida violentos y su aparato fonador exhala sonidos repetitivos aspirados con preponderancia de la vocal "a".
c) Alberto desea intensamente triunfar en el examen.

Respuesta a los ejercicios de aprendizaje

1) Si su resumen incluye las siguientes ideas puede considerarlo correcto.

2) Hay, por supuesto, varias explicaciones posibles, por ejemplo las siguientes:

a) nivel físico: Los huesos y músculos de los dedos [de María] se desplazan aceleradamente [sobre el teclado] mientras el sujeto produce abundante transpiración.
a) nivel de diseño: María digita febrilmente sobre el teclado.
a) nivel intensional: María escribe su carta de renuncia.

b) nivel físico: Los músculos faciales de Víctor se contraen, su cuerpo sufre movimientos de sacudida violentos y su aparato fonador exhala sonidos repetitivos aspirados con preponderancia de la vocal "a".
b) nivel de diseño: Víctor ríe a carcajadas.
b) nivel intensional: Víctor se divierte con los chistes que le cuenta su amigo Pablo.

c) nivel físico: El flujo sanguíneo [de Alberto] contiene una alta concentración de adrenalina.
c) nivel de diseño: Alberto repite en voz alta una y otra vez las palabras [del Código Penal].
c) nivel intensional: Alberto desea intensamente triunfar en el examen.


Ejercicio de lectura

Recomendamos leer el texto de Patricia Smith Churchland (CHURCHLAND 86), o la selección traducida al español en el capítulo cuarto de nuestra Antología.


Comentario

Patricia Smith coincide con los autores anteriores en considerar a la informática como una ciencia empírica; sin embargo, toma una posición fuertemente discrepante de la perspectiva funcionalista, es decir, de la posición de autores como Dennett, Newell o Minsky. Su criterio básico es que no es indiferente, como querrían los autores de la hipótesis de los sistemas de símbolos físicos, cuál sea el material de que están hechos los seres pensantes (protoplasma o silicio, por ejemplo) y que, por el contrario, no tenemos seguridad de hasta cuál nivel podemos descender sin encontrar que la constitución de los materiales comienza a ser importante.

Es interesante relatar que para la confección del libro del cual está tomado este texto, la autora – filósofa de profesión– dedicó muchos meses a convivir en varios laboratorios de fisiología del sistema nervioso con investigadores que estaban tratando de aclarar los misterios de la percepción, la motricidad y el pensamiento, con métodos estrictamente biológicos. El resultado de este notable proyecto, una reflexión filosófica sobre la investigación en neurociencia, ha sido calificado por ella misma con el sugerente término de "neurofilosofía".

Los argumentos que la autora esgrime contra el funcionalismo son principalmente que la división en tres (o cuatro) niveles de abstracción en el análisis de la cognición (por Marr y Dennett, por ejemplo) es artificial. Un fisiólogo podría distinguir muchísimos más en el funcionamiento del cerebro. Por otra parte, que es inconveniente para la psicología que sea declarada irreductible a la neurología; más bien conviene considerar a ambas disciplinas como ciencias que coevolucionan y continuarán haciéndolo todavía por cierto tiempo. También insiste la autora en que el hecho de que podamos usar categorías de sentido común para describir fenómenos psicológicos no es obstáculo para que intentemos reducir esas categorías a otras más básicas de carácter neurológico. De manera parecida, la categoría de sentido común temperatura pudo ser reducida a los conceptos más rigurosos de la termodinámica. Finalmente, la autora cuestiona la identificación de la cognición con el razonamiento, y de éste con la simple computación sobre representaciones formales. Con base en todos estos argumentos, hace un llamado al trabajo cooperativo entre los investigadores de la mente y los investigadores del sistema nervioso.

Smith ofrece una excelente, y bastante objetiva caracterización del funcionalismo, antes de criticarlo. La afirmación fundamental es que, para los funcionalistas, es posible especificar clases funcionales por referencia a los papeles o perfiles relacionales que los objetos desempeñan, sin parar mientes en la estructura material en la cual dichas funciones quedan ejemplificadas. Por un ejemplo, lo que hace que una cierta parte de una máquina sea un levantador de válvulas es que dado cierto input aplicado a la máquina se producirá un cierto output de levantamiento de válvulas; no es parte de la caracterización que este levantador de válvulas esté construido con cierto material, pues la función puede estar ejemplificada en muchos distintos materiales físicos. Igualmente, una y la misma organización cognoscitiva puede ser encarnada en distintas estructuras y materiales, lo cual lleva a la conclusión de que no puede haber una correlación de 1 a 1 entre los tipos funcionales y los tipos estructurales (llamamos tipos estructurales a la forma material o física en que están constituidas las piezas de la máquina). En sus propias palabras:

La idea central del funcionalismo es la tesis de que los estados mentales se definen en términos de sus papeles causales abstractos dentro de un sistema más amplio de procesamiento de información. Un estado mental dado se caracteriza en términos de sus relaciones causales abstractas con referencia a las entradas del medio ambiente, a otros estados internos y a las salidas.

Es de advertir que, a pesar de su asimilación de los estados y procesos mentales a clases funcionales, los teóricos de la cognición de la escuela funcionalista tienen algo que decir –aunque mínimo– sobre la constitución de los aparatos cognoscitivos. En efecto, los funcionalistas se alían con el fisicalismo positivista al afirmar que nuestros estados mentales se ejemplifican en un material neuronal y no, como los dualistas –herederos de la posición de Descartes– sostienen, en un material espiritual. Pero su aceptación básica del materialismo no les impide afirmar que el hecho de que las neuronas estén orquestadas de la forma en que lo están, es lo que permite al sistema asumir la organización funcional que presenta, donde el substrato físico está subordinado al nivel superior de carácter funcional.

Comentemos ahora, con cierto detenimiento, algunas de las principales líneas de la maciza argumentación de la autora.

Los niveles psicológicos

Uno de los aspectos fundamentales de la descripción que la autora hace del funcionalismo corresponde a lo que podríamos llamar la teoría de los niveles de descripción, que corresponde a lo que antes hemos estudiado como la ontología de la informática y las ciencias cognoscitivas NOTA 11. Para la autora, lo más importante que debe ser percibido en esta conexión es que el caso de las computadoras ofrece la posibilidad de dar un sentido claro a la noción de niveles. Así, hay consenso en que la máquina tiene tres niveles básicos de descripción: el nivel semántico, el nivel sintáctico y el nivel de mecanismo, aunque tal vez distintos autores los reconocen con distintos nombres.

En el nivel semántico podemos describir ciertas metas de la máquina, como computar una raíz cuadrada, sacrificar una torre (en el juego de ajedrez), o inferir una conclusión a partir de algunas premisas. En el nivel sintáctico, podemos comentar los detalles del programa, el lenguaje de programación usado, si los símbolos están orientados a ser operados automáticamente por la máquina o ser interpretados por el usuario, etcétera. El nivel de mecanismo, finalmente, tiene que ver con la arquitectura material de la máquina, sus capacidades y constreñimientos físicos. Es dentro de este marco de referencia que los funcionalistas postulan su teoría del procesamiento de información aplicable a la comprensión de los fenómenos cognoscitivos humanos, como una teoría de la dinámica del nivel semántico, sujeta a las reglas lógicas y los principios de control del nivel sintáctico subyacente (operación sobre símbolos). Por el contrario, conceden a la neurobiología la atención del nivel inferior –es decir, en el nivel del mecanismo–, negándole toda competencia para estudiar ninguno de los niveles superiores.

La autora cuestiona firmemente este supuesto funcionalista de que el modelo de tres niveles, aceptable para las computadoras con memoria de silicio, sea también aceptable como interpretación de la actividad de los cerebros orgánicos. El principal problema que encuentra en la metáfora computacional es que con base en la complejidad que hemos encontrado en el cerebro, es evidente que se dan muchos niveles de organización entre el más alto y el más bajo, desde el nivel de sistema nervioso hasta el de la dinámica intercelular. Cuántos niveles haya y cómo deban ser descritos no es algo que se pueda decidir a priori, antes de la experimentación.

Por otra parte, la diferencia entre estructura y función, aunque es útil, es también un término relativo, porque a veces, lo que es estructura cuando se ve desde un punto de vista, se transforma en función si se contempla desde otro.

Pero sobre todo, simplemente no tenemos manera de saber, antes de una investigación exhaustiva, en qué nivel de organización uno está autorizado a suponer que el tipo de implantación física puede variar mientras que las capacidades siguen siendo iguales. Esto solo puede decidirse empíricamente. En la posición funcionalista hay una especie de dogma que dice que cualquier función puede implantarse con materiales diversos. Para la autora, es precisamente al revés: sencillamente no sabemos en qué nivel la función deja de ser independiente de sus materiales, puede ser que al llegar a cierto nivel hacia abajo – no sabemos a cuál– no haya opción para escoger materiales, si lo que se quiere implantar es una determinada función.

Un ejemplo tal vez venga al caso: hay ciertas funciones que solo se pueden realizar mecánicamente con materiales rígidos, por ejemplo la función de eje. Si construimos un eje de hule, no podrá cumplir su función (en realidad no podemos construirlo, ya que un eje de hule es una contradicción en términos). Lo mismo vale para un empaque que pretendamos construir de un material rígido, como el metal. Si esto es así en casos tan familiares, ¿qué tendría entonces de extraordinario que ciertas funciones del pensamiento (por ejemplo, las que hasta ahora han resultado muy difícil incorporar a la inteligencia artificial) solo pudieran programarse en materiales orgánicos, pero no en la memoria de una computadora? Son cosas que no se han investigado suficientemente. La autora sostiene que puede ser que cuando lleguemos a saber suficiente sobre las capacidades del cerebro humano, nos encontremos con que los únicos elementos estructurales que pueden producir ese comportamiento tendrán que tener una estructura muy parecida a la estructura de las neuronas.

Por lo demás, la autora encuentra que no todo es discutible en la afirmación de que tiene que haber niveles en la organización: Una teoría sobre los cambios celulares y sinápticos que ocurren durante el aprendizaje resulta más fina que una teoría sobre cómo aprende una red interactiva, que a su vez será más fina que una teoría sobre cuáles estructuras anatómicas promueven el aprendizaje, que será todavía más fina que una teoría que postule mecanismos de codificación, mecanismos de recuperación, etc. Lo discutible es la afirmación de que el modelo de tres niveles, adecuado a las computadoras de von Neumann sirve también para los cerebros orgánicos.

Su conclusión general es, entonces, "que es supremamente ingenuo asumir que... las neuronas pueden ser pasadas por alto mientras avanzamos en la especificación funcional de la mente-cerebro...".


El programa antirreduccionista

La palabra "reduccionismo" se emplea en filosofía de la ciencia para referirse al intento de demostrar que una ciencia particular puede derivarse deductivamente de otra ciencia más general. En ese sentido, la astronomía de Kepler fue reducida a la física terrestre gracias a la obra de Isaac Newton. En el texto que sigue, al igual que en la selección de Smith, la palabra "reducir" aplicada a una disciplina científica (la psicología, por ejemplo) no significa "hacer de menor tamaño" sino demostrar que sus leyes son casos particulares de una ciencia fundante más amplia (por ejemplo, la neurobiología).

El programa antirreduccionista a que la autora se refiere, consiste en la colección de argumentos de los funcionalistas contrarios a la posibilidad de que sea posible llegar a demostrar que los fenómenos mentales son, en último análisis, fenómenos neurológicos. Para entender las implicaciones de este programa, y de su contrario, que podríamos denominar "el programa reduccionista", es importante detenernos aquí y recordar casos famosos de reducción de una ciencia a otra. Uno de los casos más famosos es el de la astronomía de Kepler y la mecánica de Galileo que quedaron ambas reducidas a la física de Newton. Es un caso bastante dramático, porque se trataba de dos disciplinas referidas a objetos, en cierta forma, opuestos, por lo menos según la tradición medieval; a saber: los cuerpos celestes y los cuerpos terrestres.

Galileo había elaborado su mecánica especialmente con base en experimentos sobre la caída de los cuerpos en un plano inclinado, y su teoría consistía en una serie de hipótesis, bastante precisas, sobre la cinemática NOTA 12 terrestre. No obstante, incluía algunas ideas equivocadas, por ejemplo el principio de inercia, que concebía como la tendencia de los cuerpos a seguir la curvatura de la Tierra NOTA 13. En todo caso, las leyes de Galileo tenían gran contenido matemático y apoyo experimental, y se referían a cuerpos eminentemente terrestres y de pequeñas dimensiones. Por otro lado, el astrónomo Kepler había formulado leyes sobre el movimiento de los astros (concretamente, del sistema solar en la interpretación copernicana, con el Sol en el centro) que explicaban un voluminoso cuerpo de observaciones compiladas por Tycho Brahe. Kepler encontró que todas esas observaciones podían explicarse razonablemente bien si suponíamos que los planetas se movían en órbitas elípticas, que el Sol estaba situado en uno de los focos de la elipse, y que los radios de la elipse barrían áreas iguales en tiempos iguales NOTA 14.

Lo sorprendente de esta historia es que cuando viene Newton y formula sus leyes de movimiento y la ley de la gravitación universal, todo esto –tanto la cinemática de Galileo como la astronomía de Kepler– cae en su lugar como casos particulares de la teoría general. En ambos casos, con ciertas correcciones: como lo mencionamos antes, el concepto de movimiento inercial de Galileo queda enmendado, y la ley de barrido de Kepler representa solamente una aproximación a lo que realmente sucede según la teoría de Newton. Este es el caso más famoso de reducción, el más asombroso por abarcador (puso, por así decirlo, el cielo y la tierra en la misma canasta). Además, es el más antiguo, pues se produjo apenas comenzando a nacer la tradición científica moderna. Pero no es el único. El que cita Patricia Smith es uno que los autores suelen citar, por lo que lo llamaremos canónico: consiste en la reducción de la termodinámica de los gases a la cinemática (teoría del movimiento) del mismo Newton. Repasémoslo un poquito.

Ante todo, y a diferencia del caso explicado antes, aquí la reducción se da con la ayuda de una hipótesis adicional de carácter estadístico. Se trata de una ley de correspondencia para poder deshacerse del término "temperatura", que no es un término de la cinemática pero sí de la termodinámica. Al tratar de exponer el contenido de la termodinámica dentro del contexto cinemático, había que preguntarse sobre ese término extraño, la temperatura: ¿y esto qué es? Bueno, contestaron los autores de este trascendental acto de reducción, pues considerémoslo como el valor promedio del estado de movimiento de las moléculas, la agitación promedio de las moléculas en un gas. En el caso de la astronomía, al realizar la reducción dejamos de hablar de áreas barridas por los radios de la elipse que conectan el planeta y el Sol; paralelamente, en el caso de la termodinámica, dejamos de hablar de temperatura, excepto entendiéndola de nueva manera como término definido, equivalente al valor cinético promedio de un gas. Esto es importante: significa que estamos reformando el lenguaje, hasta el punto de que hacemos desaparecer ciertos términos. Se trata en realidad de algo más: estamos cambiando de ontología; nuestro mundo queda poblado por entes diferentes.

¿Qué es, entonces, lo que tendríamos que reducir ahora para realizar el programa reduccionista con que sueñan unos y que rechazan otros, en el mundo de las ciencias cognoscitivas? Se trata de la psicología, que deberíamos ver reducida a la ciencia más general y fundamental de la neurofisiología. Pero, ¿qué es la psicología actualmente? Pensemos en la ontología de la psicología. ¿Qué términos usa, qué objetos se reconocen como existentes, en psicología? Si hiciéramos una lista larga de términos psicológicos, quizá encontraríamos que con muy pocas excepciones, como "ego", "superego", "libido", o "inconsciente", los términos del lenguaje psicológico han sido extraídos del lenguaje ordinario; son parte del sentido común y corresponden a objetos que normalmente reconocen los seres humanos no especialistas como parte del mobiliario social: "creencia", "deseo", "temor", "conocimiento", "voluntad", "esperanza", etcétera. Son solo una "cientificación" de términos de la psicología popular, de la sabiduría ancestral plasmada en refranes y proverbios, y de la que está llena la charla de las matronas de las sociedades tradicionales o el oído de los confesores o sacerdotes de las distintas grandes religiones.

Si más allá de la ontología nos vamos a la teoría propiamente dicha y hacemos un inventario de las teorías psicológicas más importantes, nos encontramos que –con la posible excepción de la teoría del inconsciente de Freud– todas las demás serían teorías preexistentes en el folclore, por medio de las cuales el pueblo se expresa –a menudo con connotaciones morales– sobre la conducta de las gentes.

A este propósito, cabe mencionar que varios filósofos de la ciencia contemporánea han caricaturizado el proceso de desarrollo de las ciencias sociales, especialmente la sociología y la psicología, como un intento de poner en palabras difíciles lo que todo el mundo siempre ha sabido por tradición. Dentro de ese mismo espíritu, Ernest Nagel (NAGEL 61) insiste en que todas estas disciplinas no llegan a ser todavía científicas y establece como prueba que deben pasar para que se las reconozca, el que su vocabulario –su ontología– se haga distinto del usado por el sentido común. El argumento dado para exigir ese requisito consiste en la evidencia de que, tanto las ciencias físicas como las biológicas han desarrollado una serie de conceptos (cromosoma, gen, electrón, etcétera) que no tienen ningún parangón, ninguna similitud, con los términos del lenguaje ordinario. Entonces, mientras las ciencias sociales no encuentren esos términos, mucho más abstractos que los del lenguaje ordinario, y no acuñen leyes y teorías que usen esos términos, estas disciplinas no podrán considerarse como realmente científicas.

La autora asocia el programa antirreduccionista con los teóricos del funcionalismo. Señala que su tema dominante tiene tres movimientos:

  1. Existen categorías de la psicología popular que son fundamentalmente correctas para caracterizar los estados mentales.

  2. Estas categorías delimitan los estados intensionales y los procesos lógicos y deben continuar figurando de manera esencial, tanto en la investigación como en las teorías que se desarrollen en las ciencias cognoscitivas.

  3. estas categorías, esenciales para el nivel de descripción psicológico, no son reductibles al nivel de descripción neurobiológico; estas categorías definen lo que es intensional, es decir, definen un mundo característico, distinto de otros mundos, y tienen que mantener su existencia autónoma.

Examinemos estos tres puntos. Si entendemos por categorías las formas en que fragmentamos el mundo para conocerlo, resulta que para los funcionalistas la fragmentación del mundo dada por la psicología popular es adecuada. ¿Qué quiere decir que es adecuada? Pylyshyn en particular es muy riguroso al dar un criterio para la adecuación de categorías. Nos dice que si las categorías nos sirven para formular leyes que explican las regularidades que encontramos en la realidad, entonces son adecuadas. Las categorías son adecuadas si salvan una regularidad que existe en la experiencia, si son útiles para expresar regularidades que encontramos en los fenómenos. ¿Cómo podrían resultar inadecuadas? Pueden fallar de dos maneras distintas: si son demasiado fragmentarias, entonces perderemos la visión de conjunto, y dejaremos de poder formular alguna regularidad general importante. Si son demasiado globales, perderemos entonces la visión de detalle, y no podremos expresar regularidades más finas.

Las categorías deben ser ni muy amplias ni muy estrechas pero, en todo caso, deben coincidir con la manera en que la naturaleza se parte a sí misma en clases dentro del campo de estudio de que se trate. Otra manera de decir esto es que esas categorías deben separarse entre sí siguiendo las fisuras de la realidad misma. Si, por ejemplo, en psicología popular hablamos de propósitos, es porque en la realidad existen regularidades que necesitan ese término para poder formularse, y que se perderían si el término no estuviese disponible.

Naturalmente, todo esto es de nuevo el tema de la ontología científica. En psicología hablamos de propósitos, de hábitos, de resentimiento, de depresión, de muchas cosas por el estilo que suponemos existen en la vida intensional, en esa dimensión que define la realidad humana. Para los funcionalistas, contrariamente a los teóricos mencionados antes, estas categorías son fundamentalmente adecuadas, y el alejamiento del sentido común solo lograría, en este campo, la pérdida de la sabiduría psicológica acumulada por innumerables generaciones. Si la adecuación de un sistema de categorías se mide por la conservación de regularidades, no ha de haber una palabra que agrupe cosas que solo por casualidad quedan juntas. La psicología tradicional, según los funcionalistas, fragmenta la realidad en sus junturas naturales, según la experiencia tradicional de la humanidad.

La autora argumenta sobre las ciencias humanas en el sentido de que no tienen por qué ser autónomas, de que son reductibles en principio a otras ciencias que se ocupan de niveles más básicos. Cualquiera que sea la justificación de esta pretensión, parecería, sin embargo, que es legítimo establecer un criterio de adecuación para la reducción de la psicología: cualquiera que sea su futuro como disciplina científica, debería ser posible conservar un nivel de abstracción en que continúen siendo formulables muchas de las leyes de comportamiento identificadas por el folclore psicológico. Sean o no estas leyes reductibles al nivel de abstracción estudiado por la neurología, debería, sin embargo, perdurar el vocabulario en que fueron escritas las obras literarias que profundizaron en el conocimiento del hombre, mucho antes que la ciencia psicológica positiva, como se entiende hoy, hubiera hecho su entrada en la arena intelectual. Hay sin duda un cierto sentido en que lo que los funcionalistas tratan de hacer es claramente encomiable; a saber, tratar de salvar de la embestida de las ciencias empíricas un nivel semántico que nos permita continuar hablando de intensionalidad, de conocimiento, de deseos y temores, todo lo cual se perdería si bajáramos, sin transición adecuada, al nivel ínfimo de los mecanismos, que serían las neuronas en este caso.


El argumento de las ejemplificaciones múltiples

Un argumento que suelen esgrimir los funcionalistas contra la posibilidad de reducir la psicología a la neurología consiste en la imposibilidad de realizar un mapeo de uno a uno entre los términos de la psicología y algunas expresiones de la neurología NOTA 15. Es útil considerar primero una analogía informática. Dos computadoras pueden estar en el mismo estado funcional a pesar de estar en estados estructurales muy diferentes. Las dos pueden estar corriendo el procesador de palabras Smart pero una lo hace en una McIntosh y otra es una PC compatible con IBM; las dos son estructuras (hardware) muy diferentes entre sí desde el punto de vista físico. Veamos ahora una situación equivalente en psicología. Una persona puede decir "voy a cocinar" y se va a trabajar con un horno microondas, mientras que otra dice lo mismo y se va a trabajar en una cocina de leña. Por más diferentes que estas dos cosas sean desde el punto de vista estructural, no hay duda que en realidad las dos hacen lo mismo desde el punto de vista funcional, a saber, cocinar.

Otro ejemplo es el que presenta Pylyshyn: estalla un incendio y varias personas van a pedir ayuda, es decir, salen corriendo con la intención de pedir ayuda. Un análisis psicológico de la intención de estas personas sería coincidente en decir que todas ellas desean (planean, quieren, etcétera) pedir ayuda. Sin embargo, lo que realmente van a hacer, para satisfacer ese deseo o intención, es muy diferente en cada caso, pues el estado psicológico aludido puede materializarse con muy diversos procedimientos: uno se dirige al teléfono, otro se apodera del extinguidor más cercano, otro corre hacia la estación de bomberos a la vuelta de la esquina, etc. Todos, sin embargo, están haciendo lo mismo, es decir, pidiendo ayuda (PYLYSHYN 84). "Pedir ayuda", como será probablemente obvio para el lector, es parte de la ontología de comportamientos posibles de la psicología folclórica o tradicional.

Este argumento contra el programa reduccionista se conoce como el argumento de la ejemplificación múltiple o de la "realizabilidad" múltiple, lo cual quiere decir que los estados intensionales se pueden realizar de muy distintas maneras. Los estados funcionales son ejemplificables de manera múltiple y el rango de estas implantaciones físicas puede ser tan diverso, que no hay manera posible de forzarlos a acomodarse en una "clase natural". Por ejemplo, en el mismo caso de un incendio, una persona desesperada que grita "¡fuego!", y otra, reposada y más inteligente, que procede pausadamente a llamar a los bomberos, no pueden concebirse como ejemplos de una misma descripción neurológica. Entonces, ¿qué pasaría si quisiéramos reducir un lenguaje intensional con la expresión "pedir ayuda"? ¿A cuál de las diversas formas de actuar vamos a traducir esta expresión? El problema aquí es mucho más complicado que cómo lo hemos presentado, porque en el nivel básico debe haber –por dar alguna cifra– algo así como quinientas maneras distintas de pedir ayuda.

Smith argumenta que este razonamiento antirreduccionista es un ejemplo de una mala interpretación en que frecuentemente incurren los filósofos funcionalistas en relación con lo que implica reducir una teoría a otra. El funcionalista parece suponer que la reducción interteórica no puede realizarse a menos que las propiedades de la teoría reducida tengan una única realización a nivel de la teoría reductora. Sin embargo, en el ejemplo canónico de reducción que hemos comentado –la reducción de la termodinámica a la cinemática–, "temperatura de un gas" es un predicado de la termodinámica y conforme esta ciencia y la teoría molecular evolucionaron juntas, la temperatura de un gas pasó a ser entendida como la energía cinética media de las moléculas del respectivo volumen gaseoso. Ahora bien, dos volúmenes de un gas pueden tener la misma temperatura pero las distribuciones de la energía cinética –velocidad– de sus correspondientes moléculas ser muy diferentes. Ello por la sencilla razón de que una energía media se calcula como el promedio de las energías de cada una de las moléculas consideradas, y se puede tener el mismo promedio con muy distintos conjuntos de números.

Este argumento es contundente así como viene. Sin embargo, no parece ser suficientemente general para dar cuenta de todos los casos que pueden interesarnos, ya que depende esencialmente de que en este caso el término "temperatura" se reduce por medio de una premisa estadística que incluye la idea de promedio. No queda claro, sin embargo, que un mapeo semejante de uno a muchos deba siempre producirse, aun en casos donde no trabajemos con promedios u otras intermediaciones reductoras de tipo estadístico.

Pero incluso aceptando el argumento de las ejemplificaciones múltiples, que "cocinar" es siempre cocinar, sea que cocinemos en cocina de leña o en horno de microondas, la posibilidad de reducir la psicología a una ciencia más básica, sin que por ello se pierda la posibilidad de distinguir entre las categorías superiores, es completamente aceptable. Puede llegarse a determinar que es necesario para que uno esté haciendo una u otra de esas cosas (cocinar o pedir ayuda, por ejemplo) que un cierto conjunto de neuronas en alguna parte de la jerarquía del sistema nervioso, se encuentre en una determinada configuración. O que es necesario que se dé la misma configuración de estados neuronales en un área determinada del cerebro. Solo la investigación empírica podrá llegar a aclarar estas cosas. Puede ser que todo esto llegue a establecerse por investigación empírica, lo cual, sin embargo, no impedirá que sigamos considerando a todos los casos de cocinar o de pedir ayuda como estados psicológicos únicos, precisamente en virtud de esa organización neuronal común.


La coevolución de las disciplinas científicas

Un punto fuerte de la crítica de la autora al argumento antirreduccionista consiste en que el precio de reclamar autonomía para una teoría inmadura, es blindarla contra fuerzas de revisión esenciales para que pueda llegar a la madurez. Según Pylyshyn, debe aplicarse una ley de división del trabajo entre los psicólogos y los neurólogos. A los primeros corresponde descubrir la teoría cognoscitiva y a los segundos determinar los diseños físicos subyacentes que ejemplifican el "programa" cognoscitivo. Smith discrepa de esta posición con mucha vehemencia porque piensa que el argumento antirreduccionista y la correspondiente ideología de la investigación son no solo teóricamente injustificables sino también pragmáticamente imprudentes. En su lugar propone una actitud de mutua colaboración entre las dos ciencias, a fin de asegurar que las dos coevolucionen hacia un estado superior de comprensión de los fenómenos correspondientes.


Computación, representación y razonamiento

La hipótesis empírica central de funcionalismo es que la cognición es una especie de computación. Hemos visto desarrollada esta posición, por ejemplo, en el texto de Newell y Simon. Pylyshyn la expresa directamente, incluso en el título del libro citado. Esta tesis implica que la cognición es, fundamentalmente, manipulación de símbolos y que las relaciones importantes en el proceso de información cognoscitiva son las relaciones lógicas de los símbolos. La mente se entiende, en su esencia, una máquina serial gobernada por las leyes de la lógica, las cuales operan en representaciones proposicionales. La autora rechaza contundentemente esta posición: "Dudo enfáticamente que la cognición en general sea nada parecido a razonar y que los símbolos proposicionales sean en general el modo de representación".

El término "representación" viene fundamentalmente de representación teatral, en que se remeda una situación real por medio de una situación fingida. "Representación", tal y como lo entendemos hoy en día en ciencia cognoscitiva, es un concepto que arranca con Locke y Hume. Son ellos quienes empiezan a hablar de las ideas como término medio entre el sujeto y el mundo externo. Esto es una novedad en la teoría del conocimiento, porque para el pensamiento medieval conocer era una suerte de asimilación: conocer un caballo, por ejemplo, era acaballarse un poco, como conocer a Dios –en la medida en que ello se consideraba posible– era divinizarse hasta cierto punto. Esto tiene desde luego raíces muy primitivas. La teoría del conocimiento antiguo era directa, un acto de comercio entre el sujeto y el objeto, sin intermediaciones, una especie de acto digestivo. Lo cual no deja de ser sorprendente, por coincidental, ya que la biología nos enseña actualmente que el sistema nervioso está ligado en su evolución al sistema digestivo. Filogenéticamente es así: el sistema nervioso surge alrededor de la abertura por la cual entra la comida. En un sentido general, entonces, el conocimiento comienza por el sentido del gusto. En el principio del conocimiento no hay ideas, no hay intermediación, sino contacto físico. No deja de ser notable que la teoría del conocimiento haya sufrido una evolución parecida a la del sistema que sirve de base al conocimiento.


Ejercicios de aprendizaje

1) Haga un extracto de las principales ideas discutidas en el texto a que se refiere el comentario precedente.

2) Ofrezca tres ejemplos de funciones que no son independientes de los materiales usados para encarnarlas, distintos del que aparece en el texto.

3) Escriba tres refranes que usted conozca que representen conocimientos psicológicos populares. Trate de formular, con alguna apariencia de carácter científico, el conocimiento encerrado en ellos.


Respuesta a los ejercicios de aprendizaje

1) Si su resumen incluye las siguientes ideas puede considerarlo correcto.

2) Una "suiza" (para saltar los niños) no puede ser de metal; ni las monedas de aceite; ni los alambres eléctricos de madera.

3) Por ejemplo:

"Perro que come huevos, ni aunque le quemen el hocico": Existe una tendencia muy fuerte a repetir un comportamiento gratificante, a pesar de la actitud adversa del conglomerado social con respecto a dicho comportamiento.

"Del agua mansa me libre Dios, que de la brava me libro yo": Una situación que implica peligro para el sujeto es más fácilmente perceptible por este si su grado de agresividad es elevado que si no lo es.

"Genio y figura hasta la sepultura": La fuerza de los hábitos, especialmente si están internalizados en el carácter, es muy grande, lo que los hace muy difíciles de modificar.


Ejercicio de lectura

Recomendamos leer el artículo sobre modelos de la cognición (RUMELHART 86b), o en su defecto la selección traducida al español en el capítulo cuarto de nuestra Antología.


Comentario

Rumelhart y su grupo de investigadores tratan de aclarar en su artículo la cognición sobre la premisa de que se basa fundamentalmente en procesos paralelos distribuidos en todo el sistema nervioso. No son ellos investigadores del cerebro, sino más bien informáticos de un nuevo cuño, que tratan de simular los fenómenos cognoscitivos por medio de computadoras (tradicionales o especialmente diseñadas). La disciplina que ellos cultivan, identificada como "redes neuronales" o "conexionismo" consiste en la construcción y uso de configuraciones informáticas inspiradas en la idea de un gran número de neuronas conectadas extensamente por medio de sinapsis. Oponen a la computación tradicional, que es de naturaleza básicamente secuencial, una computación en paralelo, en que muchos procesos ocurren simultáneamente. Además, esos procesos están distribuidos en varias partes de la red, en vez de concentrados en un solo mecanismo central como el centro lógico de las computadoras von Neumann.

Una de las características más importantes de los sistemas conexionistas es que no son programables en el mismo sentido en que lo son las computadoras clásicas, a saber, mediante el almacenamiento en la memoria del texto de un algoritmo cuyos pasos debe la máquina seguir sucesivamente. En cambio, una red neuronal se adiestra por medio de pruebas con casos especialmente seleccionados. Por ejemplo, se le muestra la figura de la letra "A", con el propósito de que más tarde sea capaz de reconocerla. La red neuronal aprende más que es programada. Tal aprendizaje lo realiza modificando ella misma los valores de las conexiones (sinapsis) entre sus distintas celdas (de donde surge el calificativo de "conexionismo" para esta metodología de investigación).

El artículo que comentamos presenta los aspectos más fundamentales de este enfoque, muy diferente –como el lector podrá apreciarlo– al enfoque simbolista o funcionalista. Nos relata algunos incidentes históricos importantes, como la crítica de Minsky y Papert a los primeros modelos conexionistas y la superación de esas críticas por desarrollos contemporáneos. Finalmente, trata de rebatir los principales argumentos esgrimidos por los funcionalistas contra esta metodología.


La historia del perceptrón

La historia del conexionismo comienza al final de la década de los cincuenta y al inicio de la década de los sesenta, cuando se produjo un gran interés investigativo en el desarrollo de redes autoorganizantes y otros artificios inspirados en el funcionamiento de las neuronas. El más conocido fue el perceptrón de Frank Rosenblatt. Consistían en un arreglo de entradas binarias, la retina, ordenadas en un espacio bidimensional; un conjunto de unidades binarias, predicados, con conexiones fijas a un subconjunto de las unidades de la retina, tales que cada predicado computaba alguna función local sobre el subconjunto de unidades al cual estaba conectado; y una o más unidades de decisión, con conexiones modificables a los predicados. Rosenblatt esperaba que el perceptrón pudiera servir tanto de base para la inteligencia artificial como para el modelado del cerebro. Minsky y Papert, que favorecían el enfoque de procesamiento serial de símbolos, hicieron entonces un análisis matemático muy cuidadoso de este mecanismo, y llegaron a la conclusión de que tenía limitaciones muy críticas para lograr las pretensiones de su autor (MINSKY 69). Demostraron, en particular, que el perceptrón es incapaz de calcular con simplicidad funciones matemáticas bastante sencillas, como la que determina si un número par o impar de puntos están en la retina, o la que determina si todos los puntos encendidos están conectados a todos los otros puntos encendidos, bien directamente o por medio de otros puntos encendidos.

El análisis de Minsky y Papert se refiere únicamente al perceptrón de un estrato, no al que tuviera unidades ocultas entre las entradas y las salidas. La razón para limitar su estudio a este mecanismo especialmente simple fue la existencia de un poderoso procedimiento de aprendizaje para el perceptrón de un solo estrato, el procedimiento de convergencia de Rosenblatt. En el tiempo de Minsky y Papert no había tal procedimiento poderoso para los sistemas más complejos de múltiples estratos. Esta crítica contundente de dos de los fundadores de la disciplina de la inteligencia artificial, así como algunos éxitos tempranos del enfoque simbólico, fueron suficientes para sugerir a la comunidad científica que no había futuro para esta clase de artificio en inteligencia artificial y psicología cognoscitiva.

Como muy bien lo hacen notar los autores del texto que comentamos, aunque Minsky y Papert estaban en lo correcto en sus análisis, sus conclusiones se aplicaban solamente a los perceptrones más simples y no a otros tipos más complejos que aparecieron bastante más tarde. En particular (como Minsky y Papert lo han reconocido) es posible mostrar que un perceptrón de estratos múltiples (es decir, que incluya varias capas de predicados entre la retina y la salida) puede computar las funciones señaladas antes, usando un número razonablemente pequeño de unidades. Por otra parte, existe ya hoy una generalización directa del procedimiento de aprendizaje del perceptrón aplicable a redes con estratos múltiples y retroalimentación entre estratos. Esto ha hecho posible un renovado interés en la investigación de las llamadas redes neuronales, que cuentan hoy con un grupo creciente de entusiastas entre los practicantes de las disciplinas gemelas de la inteligencia artificial y la ciencia cognoscitiva.


Las objeciones contra el conexionismo

Los autores tratan de contestar a la crítica más común contra los modelos de actividades cognoscitivas basados en procesos paralelos y distribuidos (PPD), a saber: la frecuente sugerencia de que estos mecanismos carecen de la capacidad de realizar computaciones recursivas y que, en consecuencia, no pueden procesar frases y otras estructuras definidas recursivamente. Consideran estas sugerencias como simplemente incorrectas, y afirman que es posible construir una máquina computacional arbitraria a partir de unidades con umbrales, incluyendo por ejemplo una máquina Turing (con la limitación, por supuesto, que se aplica también a los sistemas biológicos, de que los sistemas reales no pueden propiamente ser máquinas Turing porque poseen un hardware finito). A pesar de esta posibilidad en principio de imitar máquinas recursivas, los practicantes del conexionismo no las imitan en la práctica, porque no están de acuerdo "con quienes arguyen que tales capacidades son de la esencia de la computación humana". Como cualquiera que ha intentado procesar frases como "el hombre que el niño que la muchacha golpeó besó se movió" NOTA 16 puede atestiguar, nuestra habilidad para procesar estructuras anidadas no puede compararse con la de un analizador formal o mecánico. No obstante, "la habilidad humana para usar información contextual semántica y pragmática que facilita la comprensión excede enormemente la de cualquier máquina procesadora de frases que conozcamos". Lo que se necesita, según los autores, no es un mecanismo para procesamiento de construcciones anidadas. Los compiladores de los lenguajes de computación que proveen tales capacidades carecen, sin embargo, de suficiencia para procesar el lenguaje natural. Lo que se necesita, en cambio, es un analizador capaz de dar consideración simultánea a un gran número de constreñimientos mutuos e interdependientes.

Por otra parte, los críticos funcionalistas han alegado que los modelos conexionistas se dirigen a un nivel de descripción fundamentalmente diferente que los modelos psicológicos. A esta objeción los autores contestan que sus modelos deben considerarse más bien competidores de otros modelos en el nivel de los algoritmos (para usar la clasificación de niveles de Marr), como medios de explicar la misma clase de datos psicológicos. Los autores proceden a hacer un análisis muy interesante sobre la cuestión de los niveles de abstracción en las ciencias cognoscitivas. Aceptan sin discusión que a distintos niveles corresponden distintos conceptos y que cada nivel tiene conceptos propios que solamente emergen cuando se asciende a ese nivel. Más aún, la misma cognición puede entenderse como un tal concepto que emergería en el nivel más elevado posible. Pero para ellos la verdadera cuestión es entender la cognición, o en realidad, cualquier otro de los conceptos emergentes NOTA 17 . Y para comprender debemos descender a los niveles inferiores; en el fondo, no hay ninguna otra manera de comprender, excepto por referencia a componentes o partes de la cosa que tratamos de comprender. Esto es lo que llamamos precisamente analizar una cosa o situación. Así pues, el conexionismo trata de entender la cognición como una propiedad emergente de las interacciones de unidades conectadas entre sí en forma de red. Los autores nos ofrecen muchos ejemplos de esta forma de comprensión:

No podemos conocer sobre diamantes por el estudio de átomos aislados; no podemos entender la naturaleza de sistemas sociales por el estudio de individuos aislados; y no podemos entender el comportamiento de redes de neuronas por el estudio de neuronas aisladas. Aspectos como la dureza del diamante se entienden por la interacción de los átomos de carbono y la manera en que están alineados. El todo es diferente de la suma de las partes.

Ejercicios de aprendizaje

1) Haga un extracto de las principales ideas discutidas en el texto a que se refiere el comentario precedente.

2) Construya un árbol sintáctico, o alguna otra forma de representación similar, que clarifique el sentido de la proposición siguiente: "el hombre que el niño que la muchacha golpeó besó se movió".

Respuesta a los ejercicios de aprendizaje

1) Si su resumen incluye las siguientes ideas puede considerarlo correcto.

2) [la muchacha golpeó a [el niño –el cual– besó a [el hombre –el cual– se movió]]].


Ejercicio de lectura

Recomendamos leer el artículo de Fodor y Pylyshyn en que se crítica al conexionismo (FODOR 88) o en su defecto, la selección traducida al español que aparece en el capítulo cuarto de nuestra Antología,.


Comentario

El artículo de Fodor y Pylyshyn es una embestida frontal contra las pretensiones del conexionismo. Estos autores hacen radicar la diferencia fundamental entre el enfoque simbólico y el conexionista en la presencia o ausencia, respectivamente, de contenido semántico en los componentes NOTA 18 de los respectivos tipos de sistemas. Como una consecuencia de esta diferencia se sigue que las expresiones de los sistemas simbólicos son generativas; es decir, pueden producir innumerables formas con base en la aplicación de sus reglas, con vocabulario y alfabeto limitados. Esto las hace tener una gran fuerza expresiva, precisamente la que asociamos con el lenguaje. En contraste, los sistemas conexionistas tienen valor semántico solo en su nivel más alto, y carecen en consecuencia, de poder generativo. Esto los hace ser útiles solamente en tareas muy específicas, como el reconocimiento de imágenes, pero totalmente inadecuados para representar fenómenos tan complejos como el lenguaje. En particular, los sistemas conexionistas son incapaces de procesos recursivos (en que un procedimiento se llama repetidamente a sí mismo, por ejemplo), para los que los sistemas simbólicos, en cambio, son eminentemente idóneos.

Los autores caracterizan a los sistemas conexionistas como redes de gran número de unidades simples sumamente conectadas entre sí. Cada unidad recibe por sus líneas de entrada una activación con valores que son números reales, activación que puede ser excitatoria, inhibitoria, o una combinación de ambas NOTA 19. Estas unidades suman algebraicamente esta activación y cambian su estado interno como una función (usualmente tipo umbral NOTA 20 ) de esa suma. Cada conexión puede modular la activación que trasmite como una función de una propiedad intrínseca (pero modificable por acción de la misma red) llamada "peso". La activación en una línea de entrada es típicamente una cierta función no lineal del estado de activación de sus fuentes. "El comportamiento de la red como un todo es una función del estado inicial de activación de las unidades y de los pesos de sus conexiones, los cuales sirven como de una especie de memoria". Concluyen que el estudio de los sistemas conexionistas ha llevada a notables y no anticipados hallazgos, como que es posible realizar una gran cantidad de computación con una red uniforme de elementos simples interconectados. Igualmente reconocen que estos modelos tienen una plausibilidad neuronal de la que carecen las arquitecturas clásicas.

Enseguida, los autores proceden a hacer una aclaración conceptual sumamente importante para situar adecuadamente el desacuerdo entre informáticos conexionistas y simbolistas. Se refiere a la cuestión de la representación, con la que hemos ya tropezado repetidamente en esta obra. Nos advierten que existen dos tradiciones opuestas en la teorización moderna sobre la mente, la representacionalista y la eliminacionista. El segundo calificativo no parece muy feliz, por razones que veremos de inmediato. Los representacionistas mantienen que la vida mental se basa en estados representacionales (también llamados intensionales o semánticos) que codifican estados del mundo. Los eliminacionistas, por su parte, piensan que las teorías psicológicas pueden prescindir de nociones semánticas y conformarse con un vocabulario neurológico o conductista o sintáctico; "en todo caso, no un vocabulario que caracterice los estados mentales en términos de lo que representan". No se trata tanto pues de "eliminar" algo que se dé en la teoría, sino de no aceptarlo del todo en ella como una cuestión de postulación ontológica NOTA 21. Ahora bien, en esta polémica, nos instruyen los autores, los conexionistas están definitivamente del lado de los representacionistas, y en consecuencia están conformes con las posiciones de los investigadores simbolistas o funcionalistas (como Dennett, Pylyshyn, Newell, etc.). En efecto, tanto los simbolistas como los conexionistas asignan contenido semántico a algo, a saber: los conexionistas, a los nodos o unidades o agregados de unidades de sus redes; en tanto que los simbolistas se lo asignan a las expresiones simbólicas. En lo que las teorías simbolistas no están de acuerdo con las teorías conexionistas es en el tipo de relaciones primitivas que existen entre las entidades que soportan estos contenidos.

El desacuerdo, entonces, no se refiere al tema de la representación sino más bien a la concepción de la arquitectura NOTA 22. Los autores concretan este desacuerdo arquitectural en las siguientes tesis básicas:

Los autores toman (1) y (2) literalmente como las tesis que definen el enfoque simbólico. Tal enfoque supone que las estructuras simbólicas se encuentran en correspondencia con una estructura física del cerebro, y su estructura combinatoria tiene alguna contrapartida en relaciones estructurales entre propiedades físicas del cerebro. De ahí que sistemas computacionales como el cerebro y las computadoras clásicas se hayan calificado como sistemas de símbolos físicos. La teoría clásica (el funcionalismo) está comprometida no solamente con que haya un sistema de símbolos realizados físicamente, sino también con la tesis de que las propiedades físicas sobre las cuales la estructura de los símbolos se puede mapear "son las propiedades mismas que causan que el sistema se comporte como lo hace". En cambio, la arquitectura clásica es neutral sobre la cuestión de si las operaciones sobre los símbolos deben ocurrir secuencialmente en el tiempo o están constreñidas para ocurrir en paralelo.

En resumen: las teorías simbólica y conexionista no se oponen en cuanto al tema del carácter representativo de la cognición; ambas aceptan ese carácter. Tampoco se oponen en cuanto al carácter serial o paralelo de los procesos; los conexionistas favorecen el paralelismo y los simbolistas son básicamente neutrales sobre esta materia NOTA 23. "Para la primera, pero no para la segunda, las representaciones mentales exhiben característicamente una estructura constitutiva combinatoria y una semántica combinatoria". Concomitantemente, las teorías simbólica y conexionista discrepan sobre la naturaleza de los procesos mentales: "para la primera, pero no para la segunda, los procesos mentales son característicamente sensibles a la estructura combinatoria de las representaciones sobre las cuales operan".

Los autores se concentran luego en el asunto de la composicionalidad de los elementos básicos de la teoría cognoscitiva. Recalcan que, en los sistemas clásicos o simbólicos, la existencia de una estructura interna en las representaciones dota a estas de capacidades esencialmente ilimitadas. "En particular, existen indefinidamente muchas proposiciones que el sistema puede codificar. Sin embargo, este ilimitado poder expresivo debe ser alcanzado por medios finitos. La manera de hacer esto es tratar el sistema de representaciones como expresiones que pertenecen a un conjunto generado". Podemos definir, de manera intuitiva, un conjunto generado como una colección de ítemes que se establece no por enumeración, sino por medio de una regla cuya aplicación puede generar miembros del conjunto, uno por uno, tantas veces como se quiera. Con base en esos poderes generadores, "la correspondencia entre una representación y la proposición que expresa se construye recursivamente con base en correspondencias entre partes de la expresión y partes de la proposición. Pero, desde luego, esta estrategia solo puede operar cuando un ilimitado número de expresiones son no atómicas. Por ello las representaciones lingüísticas (y mentales) deben constituir sistemas de símbolos". La conclusión inevitable es que, dada la existencia de los lenguajes naturales, incluido un hipotético "lenguaje del pensamiento", y sus características más sobresalientes (su infinitud potencialmente generable y la limitación de sus medios), "la mente no puede ser un sistema conexionista".

Los autores hacen referencia al trabajo de Chomsky (CHOMSKY 68), quien ha establecido convincentemente que el conocimiento que subyace en la competencia lingüística es generativo –es decir, permite en principio generar (o entender) un número ilimitado de oraciones, de la misma manera que nuestro conocimiento aritmético apoya la producción de un número ilimitado de sumas o restas–. Las teorías simbólicas pueden acomodar estos requisitos porque suponen arquitecturas en las cuales existe una distinción funcional entre memoria y programa, ya que son congruentes con la definición de una máquina Turing, y esto permite agregar más memoria conforme la generación de oraciones lo requiera, sin tener que afectar el programa. En cambio, en un autómata de estado finito o una máquina conexionista, agregar memoria (por ejemplo, añadiendo unidades a la red) alteraría esencialmente las relaciones de conectividad entre los nodos y afectaría radicalmente la estructura computacional de la máquina. Las arquitecturas cognoscitivas conexionistas, entonces, no apoyan una memoria expandible, y en consecuencia no pueden ofrecer base para capacidades cognoscitivas productivas. "De ahí que, definitivamente, la arquitectura de la mente no puede ser conexionista".

De estos principios, los autores pasan a sacar algunas conclusiones radicales contra el conexionismo:

Finalmente, todo esto los lleva a rechazar los sistemas conexionistas como modelos adecuados de la vida mental:

Ejercicios de aprendizaje

1) Haga un extracto de las principales ideas discutidas en el texto a que se refiere el comentario precedente.

2) Suponiendo las reglas sintácticas generadoras

Grupo nominal –> grupo nominal, adjetivo
Grupo nominal –> sustantivo

estime el número de grupos nominales que pueden producirse con el sustantivo "mujer" y el adjetivo "bella". Tome en cuenta que la primera regla dice que un grupo nominal seguido de un adjetivo es un grupo nominal, y que la segunda regla dice que cualquier sustantivo es un grupo nominal.


Respuesta a los ejercicios de aprendizaje

1) Si su resumen incluye las siguientes ideas puede considerarlo correcto.

2) El número es, en efecto, infinito:
"mujer"
"bella mujer"
"bella bella mujer"
"bella bella bella mujer"
..............................
"bella ..... bella mujer"


Ejercicio de lectura

Recomendamos leer el texto de Minsky sobre conexionismo (MINSKY 91), o una selección traducida al español del capítulo cuarto de nuestra Antología.


Comentario

Uno de los patriarcas del modelo funcionalista, y de los fundadores de la disciplina de la inteligencia artificial basada en el paradigma simbólico, Marvin Minsky, adopta en este artículo una actitud a primera vista conciliadora. Acepta la posibilidad de que los modelos conexionistas (que trabajan "de abajo para arriba") complementen la labor de los métodos tradicionales o simbólicos (que trabajan sobre todo "de arriba para abajo"). Nos dice:

Ante ese contraste de los dos enfoques, el autor considera inconveniente hacer una elección entre ellos; más bien recomienda usar ambos para maximizar las posibilidades de resolver problemas que de suyo son enormemente difíciles. Aunque cada uno tiene deficiencias serias, esas deficiencias son diferentes a las del otro enfoque y el uso de cada metodología puede paliar los defectos de la otra. Por otro lado, ninguno de los dos sistemas parece apto para apoyar clases de comportamiento intelectual que son normales en niños pequeños. Todavía se necesita mucha investigación sobre cómo combinar ambos tipos de ideas para lograr superar los formidables problemas que plantea la emulación de la inteligencia.

El autor se pregunta enseguida por qué se ha dado tan poca integración entre estos dos métodos de trabajo, a pesar de las obvias ventajas que presenta su carácter complementario. Su hipótesis explicatoria consiste en suponer que las dos comunidades científicas que respectivamente los usan padecen de un prejuicio común: la idea de que vale la pena tratar de explicar la inteligencia con base en unos pocos principios, siguiendo el modelo de las explicaciones de las ciencias físicas. Minsky considera que este es un ideal incorrecto. Nos corresponde

El tono conciliador del autor no debe dejarnos pasar inadvertido el carácter fundamental de las críticas que el artículo contiene contra el conexionismo. En primer lugar, Minsky critica a fondo la idea de que el paralelismo de los procesos sea la solución para los problemas de la inteligencia artificial o del modelado de los fenómenos cognoscitivos. Siempre será difícil que una red pueda llevar a cabo en paralelo computaciones de alto nivel, a menos que podamos dividirla en partes eficazmente desconectadas –lo que podemos hacer muy limitadamente–. Al fin y al cabo, por más paralelismo que exista en los fenómenos inconscientes, la cognición humana siempre desembocará en la integración consciente, donde la atención debe intervenir como un regulador secuencial insoslayable.

Pero además, Minsky cuestiona la conveniencia de la conectividad misma. Por el contrario, insiste en que muchas cosas funcionan en el pensamiento humano precisamente porque nuestros "agentes" interiores son capaces de realizar en forma independiente, sin intromisiones de otros agentes, las labores especializadas que les corresponde realizar. Una conectividad homogénea destruiría la "privacidad" requerida por estos agentes autónomos o semiautónomos para funcionar con eficacia. Nos dice:

Como se ve, el autor opone la necesidad de estar conectado con la necesidad de tener "vida privada" para realizar confortablemente lo que a cada cual le corresponde hacer según su especialidad. Esto que así expresado suena como un análisis de una situación social, se refiere realmente a lo que acontece interiormente al sistema mental; lo cual no es de extrañar, porque precisamente una de las tesis fundamentales de Minsky es que el cerebro trabaja como una sociedad (de ahí el título de su libro, "La sociedad de la mente"). En ese sentido, podríamos decir que hay dos enfoques para explicar la organización de la mente: o bien bajo el modelo de una sociedad monolítica, en que lo importante es una gran conectividad entre todas sus partes, o bien bajo el modelo de una sociedad de agentes independientes, los cuales, más que colaborar unos con otros se explotan unos a otros (es decir, se benefician de servicios que los otros realizan en su favor, a cambio de los servicios que uno mismo les presta). Minsky se pronuncia decididamente en favor de este último modelo, que considera el más eficiente, tanto en la vida social como en la vida mental.

Esta tesis se basa en la consideración de que, en una situación de recursos limitados, es mucho más beneficioso que cada agente oculte a los otros lo que estos no necesitan saber, en vez de abrumarlos con los detalles de cómo se producen las cosas. Basta que cada uno entregue al otro el servicio que se le reclama, sin necesidad de darle a conocer los pequeños detalles de sus mecanismos productivos. La conclusión a que llega es que los sistemas de razonamiento de sentido común no necesitarían estar totalmente conectados; podrían más bien ser masas localizadas de experticia especializada.

Este hilo de pensamiento lleva a Minsky a sospechar que el arte de programar la inteligencia artificial va a cambiar radicalmente en el futuro cercano:

Con su acostumbrado tono escandalizador, el filósofo de la inteligencia artificial procede a recordarnos las innumerables deficiencias del comportamiento humano, que él atribuye a una insuficiente evolución del sistema nervioso de nuestra especie:

Afirma, para concluir, que es precisamente porque nuestro cerebro es todavía fundamentalmente conexionista (y no simbólico) por lo que tenemos todavía tan poca conciencia y tan limitado conocimiento de nosotros mismos:

Ejercicios de aprendizaje

1) Haga un extracto de las principales ideas discutidas en el texto a que se refiere el comentario precedente.

2) Imagine la organización interior de la mente como una especie de sociedad en que haya distintos organismos encargados de realizar encargos particulares de otros organismos, que intercambien todos servicios unos con otros, pero sin inmiscuirse en la forma en que cada uno presta los que le son propios. Si lo desea, puede hacer un "organigrama de la mente" como ilustración.


Respuesta a los ejercicios de aprendizaje

1) Si su resumen incluye las siguientes ideas puede considerarlo correcto.

2) Uno de los módulos internos de la mente tendrá que ser el encargado de recoger información del mundo exterior; en realidad hay varios de estos: uno para la vista, otro para el tacto, etc. Pero necesitamos también un módulo de la percepción, encargado de integrar las imágenes producidas por esos otros agentes. El módulo de la percepción necesitará recurrir a una biblioteca de formas de objetos, para reconocer las que le presenten los módulos de los sentidos como algunos de esos objetos. Pero la biblioteca a su vez tendrá que recibir servicios de muchos módulos para poder obtener y almacenar todas esas descripciones de objetos. También deberá haber un módulo de interpretación del lenguaje, que reciba servicios de los módulos del oído (para recibir insumos de lengua hablada) y de la vista (para la lectura); y otro módulo para la producción del lenguaje, por supuesto conectado al aparato fonador (para producir expresión oral) y a las manos (para producir expresión escrita). Estos dos módulos de lenguaje (el intérprete y el productor) tienen que estar en estrecha relación con un módulo de razonamiento, el cual se compondrá de muchos módulos más pequeños para distintos tipos de razonamiento: deductivo, "inductivo", analógico, por ejemplo. Todos estos harán uso de un inmenso archivo, la memoria, el cual probablemente estará dividido en módulos separados para distintos propósitos; por ejemplo, uno para las caras de todas las personas que hemos conocido en nuestra vida, con un acceso especialmente rápido (y probablemente de tipo conexionista, a diferencia de los otros módulos, probablemente simbólicos). Tendrá que haber módulos efectores para todas las funciones de locomoción del cuerpo, un módulo –o conjunto de tales– para las funciones afectivas, como compadecer al desdichado, conmoverse ante la sonrisa de un niño, o hacer el amor.... Y así sucesivamente con todas las funciones imaginables de la mente.


Conclusión

Una definición simbolista de la inteligencia

¿Qué pasa cuando queremos usar sistemas de símbolos como explicación de la inteligencia? Tradicionalmente los filósofos han dado cuenta del simbolismo aludiendo a la idea de conocimiento e inteligencia. El símbolo representa algo para alguien, para un lector de símbolos; los símbolos por sí mismos no se dan: necesitan de un lector que los interprete.

Si queremos explicar la inteligencia con base en el simbolismo caemos en una especie de trampa lógica, porque el simbolismo exige el lector de los símbolos y el lector ha de contener inteligencia. El problema es que la filosofía tradicional usa un concepto de simbolismo muy cargado de significado; tan cargado, que implica probablemente un alma inmortal para la cual los símbolos poseen algún sentido. Por lo menos, supone una mente capaz de entender por lo menos uno de los lenguajes naturales. Cuando Newell y Simon salen a buscar una explicación de la inteligencia en términos de símbolos, entonces esos símbolos no pueden ser los mismos símbolos de que hablan los analistas literarios o los teólogos: los sacramentos cristianos, por ejemplo, se dice que son "símbolos visibles de una gracia invisible"; no son estos símbolos los que andamos buscando. Necesitamos un concepto de símbolo mucho más pobre que el concepto teológico o literario. No podemos usar ese tipo de simbolismo para explicar la inteligencia, porque supone lo que queremos explicar. Para poder usar el concepto de símbolo en la explicación de la inteligencia, tenemos que degradar el significado de símbolo a una interpretación minimalista, de simple puntero que nos remite a otro símbolo.

Sin embargo, ni siquiera una definición de contenido mínimo parece suficiente para librarnos de la necesidad de un intérprete: incluso un puntero requiere ser leído o interpretado. Ahora bien, ¿necesitaremos que ese lector sea inteligente? Nada nos obliga a ello: el simple concepto de interpretación como proceso desencadenable por la presencia de una cierta configuración en un cierto lugar de una computadora, será suficiente para dar base a un sistema de símbolos físicos. Esta idea es la que los autores citados tienen en mente cuando explican los conceptos de designación e interpretación: una expresión designa un objeto si, dada la expresión, el sistema puede afectar el objeto mismo o comportarse de maneras dependientes del objeto; y el sistema puede interpretar una expresión si la expresión designa un proceso y si, dada la expresión, el sistema puede llevar a cabo el proceso.

El concepto de designación se refiere a tomar el nombre de una variable y con ayuda de ese nombre poder tener acceso al valor de ese nombre. Es de notar que el concepto informático de variable difiere del concepto matemático de variable. En matemáticas la variable es un recurso para asegurar la congruencia en un proceso de sustitución; al sustituir, aseguro la congruencia si siempre sustituyo la misma variable por el mismo valor. El concepto informático de variable se refiere más bien a una posición de memoria que nos permite usar su contenido sea para modificarlo o simplemente para copiarlo; la variable como nombre de la dirección del dato en la memoria.

Podemos, de acuerdo con una definición minimalista, entender "símbolo" como simple puntero. Tenemos el ejemplo de direcciones indirectas en el lenguaje de máquina de ciertas computadoras, por ejemplo, la IBM-1620 que fue la primera computadora de la Universidad de Costa Rica (la vieja "Matilde"), sobre la cual el que esto escribe tuvo el privilegio de aprender a programar: el centro de control lee un número contenido en una cierta posición de memoria, pero si tiene una bandera levantada no lo interpreta como un número sino como una dirección y va a ella a buscar otro número, que es tal vez el que necesita para realizar su operación (aunque bien puede también ser el nombre de una nueva dirección, en cuyo caso, la máquina debe continuar buscando, siguiendo el hilo de banderas de direcciones indirectas).

Pero por supuesto, todo esto depende de la manera en que se comporta el centro de control, o sea, esa parte de la computadora que tiene la responsabilidad de buscar, y realizar, cada instrucción del programa; lo que nos lleva a un aspecto de los sistemas de símbolos físicos de extraordinaria importancia. En todo sistema de símbolos físicos, aunque tenga básicamente una gran homogeneidad en sus componentes, hay sin embargo ciertas piezas que tienen una función especial que les es conferida por la forma misma en que están alambradas. Esto es parte de lo que nuestros autores quieren decir cuando hablan de que el sistema puede interpretar una expresión si la expresión designa un proceso y si, dada la expresión, el sistema puede llevar a cabo el proceso. Por lo menos unos de esos procesos deben haber sido alambrados originalmente, ser parte de la máquina física y no simplemente de la máquina virtual, ser parte del hardware y no del programa.

Todo esto puede entenderse en términos mecánicos (o electromecánicos), sin que en ningún momento deba intervenir en la explicación ningún elemento consciente o por sí mismo inteligente. Si entendemos nuestros símbolos como punteros en el sentido del mecanismo físico de direccionamiento, o –en último término– como nombres de procesos interpretables alambrados en la máquina, entonces la hipótesis de los sistemas de símbolos físicos puede servir de explicación de la inteligencia, ya que no habríamos permitido la presencia ilícita de homúnculos; no hallaríamos en ella, escondidos en ningún nivel, procesos inteligentes no explicados de manera física.


La teoría representacionista de la mente

La hipótesis de los sistemas de símbolos físicos es inseparable de la concepción representacional de la mente, a saber, la tesis epistemológica que afirma que la mente es un sistema de representaciones. Estas representaciones son esquemas radicados en la memoria de la mente-cerebro, cuya naturaleza es un mecanismo físico de un cierto tipo que en algún sentido sirve para representar la realidad externa que concierne a la inteligencia y que constituye su conocimiento posible. La actividad mental, entonces, debe interpretarse como una actividad representativa y como una actividad de operación sobre representaciones. ¿Cómo conocemos? Conocemos representando. ¿Cómo razonamos? Razonamos manejando representaciones.

Esta es una tesis epistemológica profunda que dice que lo intelectual ocurre dentro de la mente por manipulación de ciertas fichas o configuraciones físicas. En el acto de conocer, una mente crea una representación, que podríamos, en primera aproximación, considerar como una especie de fotografía de lo conocido. Ahora bien, si conocer es ver fotografías, se plantea de inmediato el problema de quién sea el que ve internamente la fotografía. Esto nos lleva inevitablemente a una regresión infinita en la explicación del conocimiento o de la conciencia. Para un análisis exhaustivo de este asunto, véase el capítulo sexto, donde nos enfrentamos directamente con el problema, especialmente bajo el intento de refutación de la existencia de un "teatro cartesiano" dentro de la mente.

Por el momento, bástenos abstraer el problema de la inteligencia del problema de la conciencia, y sigamos considerando la posibilidad, por otra parte claramente demostrada por la inteligencia artificial, de una resolución de problemas que no necesita de la conciencia (piénsese por ejemplo en los excelentes programas de jugar ajedrez, que nos pueden dar jaque mate haciendo uso de hermosas combinaciones, todo sin que la computadora tenga la menor conciencia de estar venciendo a un adversario –por lo menos hasta donde puede uno estar seguro en este orden de cosas–). Imaginamos un programa de computación que aplica análisis de fines y medios, trabajando sobre representaciones, en este caso estructuras de datos dentro de la memoria de la computadora. "Representaciones" significa fichas formales, distinguibles unas de otras, perfectamente definidas y concretas; hay reglas que dicen cómo operar sobre ellas, reglas que podemos considerar como estrictamente sintácticas (relacionan a símbolos formales unos con otros).

Ahora bien: a una configuración de estas fichas puede corresponder de alguna manera una realidad; de algún modo podemos conectarla con un evento externo que podemos convenir en que ella representa. Consideramos a esta como la dimensión semántica de la ficha o estructura simbólica. Pero no la necesitamos tener presente para transformar la representación: dichosamente, las representaciones, en cuanto elementos físicos dentro del cerebro (o la computadora) tienen también su dimensión sintáctica, de relación con otras fichas o símbolos, y esa dimensión basta para que nos sea posible enunciar o ejecutar reglas de transformación u operaciones.

Lo más interesante de las representaciones es que pueden transformarse en otras representaciones por medio de la aplicación de reglas estrictamente formales (o sintácticas, o no interpretadas). En su momento, alguna nueva representación, producida así, puede ser de nuevo interpretada; ser leída semánticamente, por ejemplo, como la solución esperada a un problema. Pero ello no es necesario para que el proceso de razonamiento o de solución de problemas pueda llevarse a cabo; en una palabra, el significado (o la dimensión semántica o incluso la conciencia) no es necesario para la eficacia de la acción inteligente.

La idea de representación está esencialmente ligada a la idea de existencia de reglas formales para transformar estructuras, también formales, que son estructuras compuestas por otras estructuras y así sucesivamente hasta llegar a un nivel atómico donde estarían nuestras fichas básicas. Cuando hablamos de teoría de la representación estamos igualmente hablando de la hipótesis de los sistemas de símbolos físicos. Nuestros átomos de representación son físicos pero también son formales al mismo tiempo. No estamos hablando de un sistema de conceptos, sino de una realidad física. Y su estudio es una ciencia empírica, que se monta sobre la física, entre otras disciplinas, para construir sus sistemas.

Semántica y sintaxis

Si en el fondo nuestra mente estuviera constituida por algún tipo de sistema de símbolos físicos, ¿cómo podríamos explicar su intensionalidad?; ¿cómo podríamos explicar la dimensión semántica que indudablemente tiene nuestro "lenguaje interior"? Estas preguntas son importantes porque la tesis de que la inteligencia se reduce a un sistema de símbolos físicos ha sido objetada con mucha vehemencia, por personas como John Searle (confróntense sus argumentos en el capítulo sexto), precisamente diciendo que un sistema tal sería pura sintaxis y carecería de verdadera inteligencia por faltarle la dimensión semántica. La objeción es superficialmente razonable, pues la inteligencia, con todo su poder significativo, no parece poder estar basada en una cosa tan sencilla y elemental como un sistema de símbolos físicos que interactúan entre sí por medio de operaciones puramente formales. Sin embargo, creemos posible, dentro de la perspectiva funcionalista, reconocerles un nexo fuerte con la realidad.

La tesis de Newell y Simon, compartida por teóricos del calibre de Fodor, Pylyshyn y Dennett, es que existe un lenguaje interior, o lenguaje del pensamiento, organizado según las líneas simbólicas, y que ese lenguaje es lo que nos permite ser inteligentes. Ahora bien, ¿cómo explicar su amarre con la realidad, cómo garantizar que tiene una dimensión semántica? Sin intentar aquí resolver todo el problema, que probablemente constituye el más profundo y fundamental de las ciencias cognoscitivas, permítasenos señalar algunas pistas que nos permitan realizar algún avance hacia su solución.

Partamos de la distinción de Newell y Simon entre designación e interpretación. Son dos tipos distintos de evaluación de símbolos. En el primer caso, la evaluación nos lleva de una parte de la memoria a otra, pero no vanamente. Por ejemplo, uno de los logros de este movimiento se conecta con lo que tanto los filósofos como los programadores estructurados llaman abstracción, que esencialmente es el acto sagrado de nombrar, ya practicado por Adán en el paraíso. Un símbolo puede representar de una manera simple, actuando como nombre o etiqueta abstracta, a una estructura de datos complicada, a una expresión simbólica compleja. Aquí podemos decir con el programador que se logra un objetivo de eficiencia fundamental: poner un asa a una complejidad, que en adelante podrá ser invocada o manejada como si fuera sencilla – es la abstracción en el sentido de ocultamiento de detalles, sin la cual ningún pensamiento sería posible–. Y también podemos decir con el filósofo que se logra un objetivo de gran profundidad: la creación de niveles de pensamiento, donde los nombres (o su sustitución por descripciones definidas a la Russell) pueden constituir una ontología jerarquizada, lo que hay. Se trata de la abstracción en el sentido de niveles de discurso, sin la cual tampoco sería posible el pensamiento.

La designación en este sentido nos da ya toda la ontología en el sentido lógico explicado por Quine y comentado en el capítulo tercero: una ontología basada en los compromisos que adquirimos con nuestras teorías por el hecho de aceptar valores para nuestras variables. Es difícil ver aquí otra cosa que sintaxis. Sin embargo, cuando la relación entre símbolos se hace tan compleja como para crear toda una jerarquía conceptual, es también difícil no inclinarse a pensar que hemos creado, si no la dimensión semántica misma, por lo menos –usando vocabulario de Emmanuel Kant– sus condiciones de posibilidad.

Sin dejar todavía la designación, paremos mientes en dos casos de evaluación de elementos de un sistema de símbolos que pueden revestir singular importancia. Me refiero a los números y las hileras. Números; por ejemplo: 7834. Hileras; por ejemplo: "mi casa". Estas dos clases de expresiones tienen algo en común desde el punto de vista de su evaluación: ambas son autoevaluativas o idempotentes. Si evaluamos el número 7834 obtenemos el número 7834; y si evaluamos la hilera "mi casa" obtenemos la hilera "mi casa". Para elementos de un sistema de símbolos físicos esto no deja de ser sorprendente, pues precisamente hemos definido los símbolos como aquellas entidades que nos remiten a otra cosa.

Henos aquí considerando componentes de un sistema de símbolos, de gran importancia –dada su abundancia en cualquier sistema de utilidad–, que, sin embargo, no nos remiten a otra cosa sino, por el contrario, a sí mismos NOTA 24. En este sentido de idempotencia, números e hileras tienen una especie de dimensión semántica en sí mismos: un número es un número es un número.... Los números son valiosos por su carácter matemático, y puede argumentarse que ese carácter matemático es dimensión sintáctica pura; si quisiéramos encontrarles un correlato semántico, probablemente tendríamos que recurrir, como Penrose (confróntese el capítulo sexto), al mundo de las ideas platónicas. Y con respecto a las hileras, en cuanto tales es decir, prescindiendo de la composicionalidad de las palabras que las integran, que tendrían que ser evaluadas como símbolos , tal vez podríamos atribuirles un encanto especial, de tipo pictórico o (si les permitimos una traducción sonora) musical, quizás incluso poético, que fuera paralelo a aquella dimensión semántica interna que atribuimos a los números.

Antes de dejar el tema de los números y las hileras, permítaseme subrayar que cada una de estas clases de expresiones se conecta con la realidad de manera muy poderosa, sin necesitar para ello una superposición de dimensión semántica externa (dada por un ser humano que los interprete composicionalmente, por ejemplo). En cuanto a los números, al dar lugar a la matemática entera, proporcionan la base para un tipo de razonamiento que, en nuestra época de supercomputadoras que calculan trayectorias de satélites artificiales, nadie se atreverá a negar que puede realizarse sin dimensión semántica (por lo menos, en el sentido de la intensionalidad humana). La eficacia de la matemática es tan grande en la vida real, que si tuviéramos que renunciar a todo otro amarre del sistema de símbolos físicos con la realidad no quedaríamos tan mal parados. Pero además, en cuanto a las hileras, creo que ellas nos abren por su parte a un mundo de interacciones también reales, en el ámbito del arte, de la persuasión, de las emociones, de las relaciones interpersonales, independiente de la comunicación semántica composicional. Deberíamos investigar si decirle a la amada "te quiero", no sería un caso de uso simple de una hilera, más que de una proposición, que tiene por sí misma poderes causales, independientes de la fuerza representativa composicional de las palabras en que podría descomponerla un análisis gramatical NOTA 25.

Si ahora pasamos a considerar la interpretación, aquí es posible identificar muy fácilmente algunos amarres con la realidad claramente perceptibles. Me refiero a los procedimientos alambrados en la máquina física, que sirven de base al sistema de símbolos para recibir insumos del ambiente exterior y para producir resultados dirigidos a ese mismo entorno. Típicos entre ellos serían los procedimientos primitivos para imprimir, para leer el teclado, para contraer los músculos (o activar cualquier otro motor de locomoción o gesticulación), para recibir mensajes del "ratón", de un módem, etc. Difícil cuestionar el carácter eminentemente semántico de un procedimiento que produjera, al ser leído por el mecanismo evaluador, la traslación física del sistema de símbolos a otro cuarto de la casa, por ejemplo, o que ante la instrucción "COJA MANZANA", como parte de la interpretación de este procedimiento, alargara su brazo y de hecho tomara posesión de la respectiva fruta. Lo mismo cabe decir de la acción de un rastreador de caracteres, accionado por el intérprete, capaz de convertir en un archivo ASCII el contenido del editorial de La Nación del día de hoy. Aquí otra vez podríamos decir que si solo este amarre con la realidad pudiéramos rescatar de un naufragio, quedaríamos bastante bien parados.

La dimensión semántica probablemente es analizable en dos partes: por un lado, los amarres exteriores, pero por otro los amarres recíprocos. Estos amarres recíprocos no son de elemento a elemento, son de racimos de elementos a racimos de elementos. Esto es muy cercanamente lo que los investigadores de inteligencia artificial han llamado "redes semánticas", donde cada concepto representa un racimo que se conecta, de muchas maneras diferentes, con varios otros racimos. Estas conexiones entre racimos significativos, si son suficientemente ricas, darían tanta versatilidad y variedad del sistema que, otra vez aquí, si solo eso pudiéramos rescatar del naufragio quizá quedaríamos a flote.

Un mundo sin conversación sería un mundo sin profundidad; podemos, en soliloquio interminable, conectar ideas con ideas (no puede despreciarse el efecto significativo de estas conexiones), pero sin embargo, el máximo relieve de significación solo lo lograremos cuando conseguimos conectar, aunque sea brevemente, universos completos de discursos –esos que llamamos "personalidades"– unos con otros. Yo como escritor, en este momento, debo conformarme con el soliloquio de ideas; sin embargo, este trozo particular lo estoy escribiendo como un refinamiento de apuntes de un seminario en que todos mis estudiantes participaron conmigo en la empresa de perfilar la médula de este discurso.

Ustedes, mis lectores, están también en realidad conversando conmigo, aunque les sea difícil comunicarme de inmediato sus reacciones (pero recuerden que tienen mi apartado electrónico a su disposición), o del todo imposible si tuviere la suerte de estar siendo leído ya bien entrado el siglo XXI. Sin embargo, por lo menos están tratando de conectar este discurso, entendiéndolo bien o malinterpretándolo –eso no importa en este contexto–, con sus propias ideas, y con las ideas de los autores citados en este libro. Además, pueden interactuar con su profesor a propósito de todo este material, y tal vez con otros estudiantes o amigos. Cada una de esas personas tiene experiencias comunes muy ricas que permiten darle significado de profundidad a todo lo leído. Gran parte del significado que concebimos es producto de esta interconexión masiva, no ya de símbolos simplemente, sino de sistemas de símbolos independientes, conectados sin embargo entre sí como universos de discurso puestos parcialmente en contacto por los diversos medios de comunicación humana. A cada una de estas múltiples conexiones podemos calificarla de "puramente sintáctica"; pero a todas ellas, en su profunda complejidad, ¿nos atreveríamos a hacerlo? Y definitivamente aquí, si pudiéramos rescatar de un naufragio estas conversaciones, quedaríamos abundantemente bien surtidos.

Los símbolos se relacionan con otros símbolos no solo directamente; se relacionan sobre todo a través de las expresiones simbólicas, de cualquier grado de complejidad, de las que forman parte. Los símbolos forman expresiones y esas expresiones se juntan con otras para formar expresiones más grandes. En algún momento expresiones supercomplejas se conjugan para formar redes, y varias redes para formar sistemas. En el momento en que conversamos, se tienden puentes o conexiones entre múltiples universos de discurso. Cuando se tiene toda esta complejidad y, además, se tienen garantizadas ciertas ataduras claves con el mundo externo, como las descritas más arriba, todo esto, que en cada una de sus partes no es más que sintaxis, podemos, en su conjunto, llamarlo semántica. Por lo menos, este es el único concepto de semántica que el autor de estas líneas considera aceptable.


Ejercicios de evaluación

Para contestar estos ejercicios puede consultar cualquier texto. Conteste por escrito.

1) ¿Cómo pueden relacionarse los tres niveles de abstracción según Dennett con los tres (o cuatro) niveles de Marr?

2) ¿Qué se entiende por "préstamo de inteligencia" en el texto de Dennett?

3) Identifique algún "préstamo de inteligencia" en el párrafo siguiente:

El termostato que controla el aire acondicionado debe colocarse en un punto del cuarto que no esté expuesto a calor anormal o frío anormal en relación con la temperatura media del ambiente; ello porque si el termostato se coloca, por ejemplo, cerca de una lámpara encendida, probablemente creerá que hay más calor que el que realmente existe, como igualmente se confundiría si, por el contrario, lo pusiéramos en la trayectoria de la ráfaga de aire impulsado por un abanico mecánico.

Para contestar los siguientes ejercicios no consulte sus textos; si no puede contestar adecuadamente, busque en sus textos la respuesta correcta y repásela, hasta estar seguro de que domina la correspondiente materia. Exprésese con toda la amplitud necesaria para dar una respuesta exhaustiva.

4) Explique el contenido de las palabras que figuran en el título de la hipótesis de sistemas de símbolos físicos: "físicos", "sistemas", "símbolos".

5) Explique el concepto de "designación" usado en el texto de Newell y Simon.

6) Explique el concepto de "interpretación" usado en el texto de Newell y Simon.

7) ¿Cómo debemos entender el concepto "intensional" en la expresión usada por Dennett "sistema intensional"?

8) ¿En qué consiste el programa antirreduccionista, según Smith?

9) ¿En qué consiste el argumento de las realizaciones múltiples esgrimido en contra de la posibilidad de reducir la psicología a la neurología?

10) ¿Qué se entiende por "perceptrón"?

11) ¿En qué consiste un sistema conexionista?

12) ¿En qué consiste el desacuerdo entre simbolistas y conexionistas, según Fodor y Pylyshyn?


Respuestas para los ejercicios de evaluación

1) El nivel físico de Dennett corresponde a los niveles de componentes y mecanismos de
Marr; el nivel de diseño, al nivel de los algoritmos; y el nivel intensional, al nivel de la computación.

2) El uso de términos intensionales en una explicación científica puede considerarse "préstamo de inteligencia" en el sentido de que es una atribución provisional del características cuasipersonales a una entidad que no tiene carácter personal. Es un táctica metodológica útil para expresar de manera sintética un procedimiento muy complicado. Pero debe "pagarse" para que nuestra explicación contenga solo términos que tengan contenido empírico o lógico directo y que no necesiten más explicación. Esta táctica se parece mucho a un recurso a que recurren a menudo los programadores para simplificar su tarea y que recibe el nombre de programación estructurada: "piden prestado" el nombre de un procedimiento que todavía no han programado para poder programar otros procedimientos de nivel superior; pero más tarde deben programar el procedimiento cuyo nombre habían usado antes sin verdadero sustento.

3) La palabras "creerá" y "confundiría" implican un préstamo de inteligencia, ya que solamente seres inteligentes pueden creer o quedar confundidos. La palabra "controla" fue originalmente una palabra de esa misma naturaleza, pero el uso extendido en ingeniería (en teoría del control, precisamente) de ese término y términos conexos, los ha convertido en palabras normales del vocabulario tecnológico, que dan a entender un particular tipo de aparato y su funcionamiento.

4) ¿Por qué físicos? Porque los elementos de los sistemas que más les interesan a Newell y Simon (las computadoras) consisten en último término en altos y bajos en una corriente eléctrica. ¿Por qué sistemas? Porque esos elementos aparecen siempre integrados en conjuntos con relaciones muy complejas entre sí que, además, son muy escasas –y limitadas a ciertos canales de "entrada" y "salida"– en relación con el entorno. Y ¿por qué símbolos? El símbolo simboliza otra cosa que él mismo, a saber: lo que representa. Un símbolo físico es un ente físico muy especial que apunta hacia otra cosa. La palabra "apunta" es más clara que las palabras "simboliza" o "representa", porque tiene menos carga filosófica y emocional, y por ello nos permite hacer una transición suave hacia un concepto completamente informático del simbolismo, que es aquél asociado con el mecanismo de "puntero". En programación, un puntero es una variable cuyo contenido constituye el nombre de otra variable; una dirección de la memoria que contiene otra dirección. El símbolo en sentido puramente físico no es nada más ni nada menos que un puntero en la memoria de una máquina.

5) Una expresión designa un objeto si, dada la expresión, el sistema puede o bien afectar el objeto mismo o comportarse de maneras que dependen de ese objeto. El objeto puede ser un átomo o alguna otra estructura simbólica. Lo más importante es que se alude con "designación" a la provisión de una vía de acceso al objeto. El caso más simple es el del nombre de una variable, a la cual se le ha asignado un valor, por ejemplo, una expresión simbólica: decimos entonces que la variable designa a esa expresión.

6) Un sistema puede interpretar una expresión si la expresión designa un proceso y si, dada la expresión, el sistema puede llevar a cabo el proceso. La interpretación es entonces la capacidad de desencadenar un proceso informático que está asociado con una expresión. Dada la expresión, el sistema es puesto en movimiento para realizar el proceso que le está asociado, lo cual significa que el sistema puede invocar sus propios procesos para que se ejecuten, mediante un simple acceso a las expresiones que los designan.

7) La palabra "intensional" en este contexto no quiere decir "con intención"; se refiere más bien a la significación escolástica reintroducida en la filosofía contemporánea por Franz Brentano, de referencia a un objeto externo, contenida en todos los conceptos que expresan la actitud de un sujeto hacia un objeto de su entorno (tales como "creer","desear", "temer", "querer", "conocer", "creer", etcétera). Simplificando un poco, calificamos de intensional precisamente a todo aquello que tiene la naturaleza de un deseo (positivo o negativo) o de una creencia (falsa o verdadera).

8) El tema dominante del antirreduccionismo tiene tres movimientos:

  1. existen categorías de la psicología popular que son fundamentalmente correctas para caracterizar los estados mentales;

  2. estas categorías delimitan los estados intensionales y los procesos lógicos y deben continuar figurando de manera esencial, tanto en la investigación como en las teorías que se desarrollen en las ciencias cognoscitivas;

  3. estas categorías, esenciales para el nivel de descripción psicológico, no son reductibles al nivel de descripción neurobiológico.

9) Un argumento que suelen esgrimir los funcionalistas contra la posibilidad de reducir la psicología a la neurología consiste en la imposibilidad de realizar un mapeo de uno a uno entre los términos de la psicología y algunas expresiones de la neurología. Una persona puede decir "voy a cocinar" y se va a trabajar con un horno microondas, mientras que otra dice lo mismo y se va a trabajar en una cocina de leña. Por más diferentes que estas dos cosas sean desde el punto de vista estructural, no hay duda que en realidad las dos hacen lo mismo desde el punto de vista funcional, a saber, cocinar. Pareciera entonces que debe haber una ciencia encargada de dilucidar estas "funciones" y otra distinta para estudiar las realidades más primitivas que les sirven de base.

10) El perceptrón de Frank Rosenblatt. Consistía en un arreglo informático de entradas binarias, la retina, ordenadas en un espacio bidimensional; un conjunto de unidades binarias, los predicados, con conexiones fijas a un subconjunto de las unidades de la retina, tales que cada predicado computaba alguna función local sobre el subconjunto de unidades al cual estaba conectado; y una o más unidades de decisión, con conexiones modificables a los predicados. Minsky y Papert hicieron un análisis matemático muy cuidadoso de este mecanismo, y llegaron a la conclusión de que tenía limitaciones muy críticas. Demostraron, en particular, que el perceptrón era incapaz de calcular con simplicidad funciones matemáticas bastante sencillas, como la que determina si un número par o impar de puntos están en la retina, o la que determina si todos los puntos encendidos están conectados a todos los otros puntos encendidos, bien directamente o por medio de otros puntos encendidos. Aunque Minsky y Papert estaban en lo correcto en sus análisis, sus conclusiones se aplicaban solamente a los perceptrones más simples y no a otros tipos más complejos que aparecieron bastante más tarde. En particular, es posible mostrar que un perceptrón de estratos múltiples (es decir, que incluya varias capas de predicados entre la retina y la salida) puede computar las funciones señaladas antes, usando un número razonablemente pequeño de unidades.

11) Los sistemas conexionistas son redes electrónicas de gran número de unidades simples sumamente conectadas entre sí. Cada unidad recibe por sus líneas de entrada una activación con valores que son números reales, activación que puede ser excitatoria, inhibitoria, o una combinación de ambas. Estas unidades suman –algebraicamente– esta activación y cambian su estado interno como una función de esa suma. Cada conexión puede modular la activación que trasmite como una función de una propiedad intrínseca (pero modificable por acción de la misma red) llamada "peso". La activación en una línea de entrada es típicamente una cierta función no lineal del estado de activación de sus fuentes. El comportamiento de la red como un todo es una función del estado inicial de activación de las unidades y de los pesos de sus conexiones, los cuales sirven como de una especie de memoria.

12) El desacuerdo no se refiere al tema de la representación sino más bien al de la arquitectura de la mente. Este desacuerdo arquitectural puede concretarse en las siguientes tesis básicas:

(1) Las teorías simbólicas –pero no las conexionistas– postulan un "lenguaje del pensamiento" cuyas representaciones tienen sintaxis y semántica combinatorias. Esto implica que: (a) hay una distinción entre representaciones estructuralmente atómicas y estructuralmente moleculares; (b) las representaciones estructuralmente moleculares tienen constituyentes sintácticos que son ellos mismos o bien estructuralmente moleculares o estructuralmente atómicos; y (c) el contenido semántico de una representación (molecular) es una función de los contenidos semánticos de sus partes sintácticas, junto con su estructura constitutiva.

(2) En los modelos simbólicos, los principios por medio de los cuales los estados mentales se transforman, o por medio de los cuales una entrada selecciona la correspondiente salida, se definen sobre las propiedades estructurales de las representaciones mentales. Siendo así que las representaciones mentales simbólicas tienen estructura combinatoria, es posible para las operaciones mentales simbólicas aplicarse a ellas por referencia a su forma.

Según estos autores, lo que hay de profundamente equivocado en la arquitectura conexionista es esto: como no reconoce en las representaciones mentales ni estructura sintáctica ni semántica, por fuerza debe tratarlas no como conjuntos generativos sino como listas.

Notas

NOTA 1 De acuerdo a la filosofía de Emmanuel Kant (1724-1804), los juicios pueden clasificarse en analíticos y sintéticos, según el predicado esté o no implicado en el sujeto; y en a priori o a posteriori, según puedan o no enunciarse con necesidad y universalidad.

NOTA 2 Consúltense las opiniones de John Searle y de Roger Penrose, en el capítulo sexto, como ejemplos de pensadores que, con base en argumentos filosóficos (a nuestro parecer cuestionables) afirman que la hipótesis de los sistemas de símbolos físicos es en efecto falsa.

NOTA 3 Para los autores funcionalistas, las capacidades intelectuales se definen por la función que realizan, no por la estructura material que las sustenta.

NOTA 4 Una observación del fisiólogo francés Jean-Pierre Changeux me ha hecho notar una interesante correspondencia entre los niveles que se reconocen en informática y conceptos más generales de la filosofía tradicional. Sabemos desde Kant que la experiencia puede ser estructurada por las "formas de la sensibilidad". La computadora parece haber confirmado en nuestro tiempo esta intuición del gran filósofo de la Ilustración, aunque con un toque de ironía, pues a este aparato, que permea todos los aspectos de la civilización contemporánea, difícilmente la mayoría de la gente lo identificaría llanamente con la naturaleza humana (¿cómo explicaríamos los dos millones de años sobre la Tierra de especies humanas sin atisbos de informática?). Y sin embargo....
En todo caso, las teorías de Kant parecen haber salido vindicadas por la revolución informática por lo menos de un modo historicista: las formas de la sensibilidad condicionan sí la experiencia, aunque esas formas, productos esencialmente culturales, deban estar conformadas por situaciones históricas construidas a lo largo de siglos y milenios, hasta alcanzar la edad informática en que vivimos. Veamos el asunto en detalle.
Kant distingue tres niveles intelectuales:

  1. El de la sensibilidad, definido por la capacidad de recibir y procesar impresiones de los sentidos.

  2. El del entendimiento, facultad que constituye los conceptos como síntesis de elementos sensoriales.

  3. El de la razón, que contiene los principios de ilación y uso de los conceptos producidos por el entendimiento.
    (KANT 99)

Estas distinciones kantianas, como los niveles informáticos, nos permiten concebir tres niveles de abstracción, perspectivas de agregación intelectual sobre la realidad:

  1. El de las representaciones de los objetos del mundo exterior.

  2. El de los conceptos, síntesis de esas representaciones.

  3. El de las teorías generales, construidas por la razón con esos conceptos.

Changeux se arriesga fundamentar estas "facultades" intelectuales con organizaciones particulares de conexiones neuronales dentro de nuestro encéfalo. El parecido con las conexiones eléctricas en las entrañas de la computadora no puede ser más obvio.   (CHANGEUX 89)   (Nota de 2002) >

NOTA 5 Se entiende por formalización, en teoría del método científico, el proceso de reducir al mínimo el contenido significativo de las proposiciones, con el objeto de percibir con la máxima claridad posible sus aspectos estructurales.

NOTA 6 Esta liberalidad del autor en relación con la escogencia de puntos de vista debe recordarnos, por supuesto, el principio de tolerancia de Quine según el cual cada científico puede escoger su ontología y la formulación de la teoría correspondiente con toda amplitud, cuidando solamente de mantener la congruencia y la satisfabilidad empírica.

NOTA 7 Naturalmente, no es difícil hacer corresponder estas tres perspectivas con los tres niveles de la obra de Marr de 1982.

NOTA 8 Confróntese nuestro comentario sobre los símbolos en este capítulo del texto de Newell y Simon.

NOTA 9 No confundir, sin embargo, con otros usos, más sintácticos, de la palabra "que", como en "yo tengo que", donde la expresión "tener que" funciona más bien como una manera idiomática de indicar una obligación.

NOTA 10 Behaviorism en inglés y francés.

NOTA 11 Confróntese nuestro tratamiento de los textos de Dennett y Marr.

NOTA 12 Ciencia que estudia el movimiento.

NOTA 13 El concepto de inercia, más exacto, como movimiento uniforme y rectilíneo, se debe precisamente a Isaac Newton.

NOTA 14 Una consecuencia de esto es que cuando el cuerpo está muy cerca del Sol va mucho más rápido, lo que es desde luego compatible con la idea de Newton de que la atracción gravitacional es inversamente proporcional al cuadrado de la distancia. Conviene mencionar que Kepler fue llevado a la formulación de esas leyes por sus prejuicios místicos sobre cuáles figuras geométricas tenían más dignidad. Era un místico y de ahí sacó sus ideas, lo cual es indiferente para la epistemología: las ideas pueden surgir de cualquier parte. Lo importante es que sean congruentes y que estén de acuerdo –en una medida razonable– con los hechos. La medida de esa racionalidad depende, por supuesto, de la disponibilidad de hipótesis alternativas con parecido apoyo empírico.

NOTA 15 Es decir, por cada término de la psicología, encontrar una y solo una expresión de la neurología.

NOTA 16 Dejamos para un ejercicio de aprendizaje la tarea de decidir quién golpeó a quién, quién besó a quién y quién se movió.

NOTA 17 Para una mejor comprensión de lo que aquí significamos con "emergente" puede repasarse el discurso de Minsky en su libro "Society of Mind" que comentamos en el capítulo primero, a propósito del contenimiento como propiedad de una caja. Esta propiedad es emergente con relación a las seis tablas que constituyen la caja, ninguna de las cuales por sí sola posee la propiedad de contener.

NOTA 18 Es muy importante no confundir la categoría de "componente" con la de "parte". Las redes conexionistas, por supuesto, tienen partes, pero no tienen componentes. Las expresiones simbólicas, en cambio, pueden descomponerse (a menos que sean atómicas) en componentes que ellos mismos son todavía expresiones simbólicas. Las redes conexionistas pueden partirse (en partes), pero no descomponerse (en componentes). Otra manera de decir lo mismo es enunciar que las expresiones simbólicas tienen estructura, mientras que las redes conexionistas no la tienen.

NOTA 19 Es decir, algunas de sus entradas pueden tener como valores números reales positivos y otras números reales negativos.

NOTA 20 Esto quiere decir que no se produce ningún cambio mientras el valor de la función no sea superior (inferior) a un cierto valor. Cuando ese valor se obtiene, se produce el cambio.

NOTA 21 Por supuesto, hay una gran relación entre estos "eliminacionistas" y los reduccionistas tipo Patricia Smith Churchland, cuyas argumentaciones hemos examinado anteriormente.

NOTA 22 Este término "arquitectura" ha sido tomado por los autores directamente de la informática, donde normalmente identifica configuraciones específicas de hardware y software de sistemas que definen a computadoras de estilos particulares.

NOTA 23 Sin embargo, vale la pena anotar que prácticamente todos los científicos cognoscitivos aceptan la existencia de muchos procesos paralelos inconscientes en la cognición, especialmente en relación con la elaboración de información visual y del lenguaje (especialmente el hablado). Además, que prácticamente todos exigen que los fenómenos de la conciencia son producidos por un mecanismo serial; sin embargo, Dennett sostiene que la secuencia de los fenómenos conscientes es en gran medida fabricada por la propia mente (DENNETT 91).

NOTA 24 Otro ejemplo notable, en el lenguaje Lisp y otros lenguajes de los llamados simbólicos, es la expresión NIL, que además de ser idempotente (tener como evaluación la misma expresión) tiene la particularidad de ser al mismo tiempo átomo (el primitivo que designa falsedad) y lista (la lista vacía).

NOTA 25 Debe tenerse presente aquí algo que para los programadores de Lisp u otro lenguaje de procesamiento de listas es completamente claro: la diferencia entre la expresión simbólica (TE QUIERO) y la hilera "te quiero". La lista (TE QUIERO), como toda lista, es una expresión simbólica, compuesta de los símbolos TE y QUIERO, cada uno de los cuales puede estar asociado por referencia a un valor. La expresión "te quiero", en cambio, es idempotente y no puede descomponerse, excepto tal vez mediante procedimientos especiales (que la traten como un arreglo de caracteres). En todos estos lenguajes es posible, sin embargo, transformar una hilera en lista o viceversa, pero esto requiere un trabajo, es decir, la aplicación de algún procedimiento al respectivo argumento.

Copyright © 1993-1997 Claudio Gutiérrez