Epistemología e informática, Claudio Gutiérrez, Costa Rica

La informática como ciencia empírica

Claudio Gutiérrez book


Propósitos:

Este capítulo busca familiarizar al estudiante con la perspectiva según la cual la informática es una ciencia empírica, de parecida naturaleza a la biología o la física. Para profundizar en esta perspectiva, se hace énfasis en el carácter hipotético de algunas importantes tesis informáticas. Se busca también dar a conocer en cierto detalle el paradigma funcionalista, dominante en la informática. Como visiones alternativas, se presenta a los lectores

  1. la crítica al funcionalismo inspirada por los intentos de reducción de la psicología a la neurobiología y

  2. el enfoque conexionista que busca trascender el funcionalismo mediante análisis y construcción de procesos paralelos distribuidos.


Introducción

Una ciencia teórica examina, como hemos visto, los constreñimientos a que está sometido necesariamente el pensamiento, sea desde el punto de vista de la lógica o de las matemáticas. Una ciencia empírica, en cambio, describe a la naturaleza según ciertas categorías de carácter experimental, que pueden ser mejor o peor adaptadas a esta tarea; la ciencia es corregible de conformidad con los resultados de nuestras observaciones y experimentos sobre el mundo que nos rodea. De acuerdo con esto, queremos explorar la posibilidad de que la informática sea más bien una ciencia empírica, y no una ciencia teórica como la teoría de la computabilidad. Sin embargo, a pesar de ese contraste con lo tratado en el capítulo segundo, creemos que habrá continuidad en el tratamiento de la cuestión sobre la naturaleza de la informática, dado que la tesis "distintivamente Turing" –explicada en dicho capítulo– puede ser considerada como el fundamento teórico del paradigma computacional de la informática que discutiremos aquí. Tal paradigma surge como idea abstracta en la obra de Turing, la noción de máquina universal capaz de imitar a cualquier otra máquina, y logra ser elaborada en la forma de una "ley de estructura cualitativa", de carácter empírico, por Newell y Simon, en su conferencia del año 1980.

Cuando Newell y Simon, estudiosos de psicología e informática, se enfrentan con el tema de la inteligencia humana, se encuentran con que la obra de Turing les proporciona elementos suficientes con qué construir una hipótesis empírica sobre los fenómenos de la computación. Esta hipótesis va a ser definitivamente empírica y, por consecuencia, comprobable en la práctica, donde tendrá que demostrar su temple, en el sentido de Popper, proveyendo un marco conceptual adecuado para la articulación de las ciencias cognoscitivas. De acuerdo con la posición de estos autores, la informática es una ciencia "como las otras" (es decir, como las ciencias empíricas, sea la química, la física, la geología, la biología, las ciencias sociales) y, en cuanto tal, sus hipótesis pueden ser refutadas por la realidad, es decir, pueden ser falsadas por experimentos. En cambio, la máquina de Turing no puede ser falsa, pues como noción abstracta, en cuanto concepto de algoritmo, es solo una definición matemática, y no hay experiencia posible que pudiera refutarla; no está en su naturaleza ser refutable por su carácter analítico y a priori NOTA 1. Y la informática, según Newell y Simon, está constituida no por teorías analíticas, como las disciplinas matemáticas, sino por hipótesis empíricas, al igual que cualquier otra disciplina científica.

Básicamente, lo que estos autores nos dicen es que la computación es un fenómeno tan complicado, que hay que hacer hipótesis sobre él, como las que se hacen sobre el comportamiento de los sistemas físicos. Como los que estudian las otras ciencias empíricas, es también un fenómeno físico, al igual que la deriva de los continentes o la propagación de las enfermedades infecciosas. El estudio de un fenómeno tan complicado requiere, como la aclaración de cualquier otro fenómeno complicado, de experimentos, y de hipótesis que expliquen sus resultados. Si consideramos que el signo de las disciplinas empíricas, o ciencias experimentales, es el uso de experimentos, con ese criterio podemos sin duda decir que la informática es una ciencia empírica, puesto que cada programa de computación que corremos constituye un experimento, una pregunta que le lanzamos a la naturaleza.

Las disciplinas teóricas son una ayuda muy valiosa, sobre todo porque nos dicen qué cosas son imposibles y no debemos intentar, qué cosas son difíciles y debemos intentar solo con cautela, y en todo caso, qué previsiones debemos tomar para embarcarnos en distintos tipos de investigación. Pero nos dicen muy poco sobre qué cosas sean posibles; esto solo podemos averiguarlo haciendo experimentos. En este sentido, existe una clara complementariedad de la informática como ciencia teórica –la teoría de la computabilidad, que determina qué cosas son imposibles y explora los límites y posibilidades de la disciplina– y la informática como ciencia empírica –que trata de inventariar los fenómenos computacionales y formula toda suerte de hipótesis sobre su naturaleza y características–.

El método analítico de la teoría computacional determina los límites de la disciplina, de manera a priori, sin interrogar a la naturaleza. Pero, fijados esos límites, el fenómeno de esa complejidad que constituye la informática, deber ser aclarado por el mismo método que usan las ciencias experimentales, el método hipotético-deductivo que incluye la experimentación como etapa insoslayable. Esa es, en breve, la tesis de Newell y Simon. Otros autores que examinaremos en este capítulo refuerzan, amplían y profundizan esta tesis, conocida corrientemente por los nombres –intercambiables– de simbolismo o funcionalismo.


Explicación de textos

Ejercicio de lectura

Recomendamos leer el texto Alan Newell y Herbert Simon (NEWELL 81), o una selección traducida al español en el capítulo cuarto de nuestra Antología.


Comentario

En su artículo seminal de donde fue extraído este texto, versión publicada de una conferencia que impartieron precisamente cuando fueron galardonados con un premio que ostenta el nombre de Turing, Newell y Simon nos proponen como tesis que la informática es una ciencia empírica. Con ello quieren decir que la informática formula hipótesis sobre la realidad, abstraídas de datos empíricos, y después investiga si estas hipótesis son adecuadas, exactamente de la misma forma en que lo hacen la física o la biología. En el artículo original no se limitan a proponer la tesis de que la informática es una ciencia empírica; además, como prueba de este aserto, ofrecen dos ejemplos de hipótesis empíricas –que, por ser sustentadas en la experiencia, podrían eventualmente ser falsadas por esta– postuladas por la informática. Estos importantes ejemplos que proponen, en forma bastante detallada, son la hipótesis de los sistemas de símbolos físicos y la hipótesis de la búsqueda heurística. En el texto incluido en la Antología solamente se reproduce la primera de estas hipótesis. Dada esta omisión, permítasenos hacer aquí una síntesis de la segunda de ellas.

Newell y Simon estuvieron entre los primeros investigadores que trataron de reproducir en una máquina el ejercicio de la inteligencia, con un famoso programa llamado "Resolvedor general de Problemas" (más conocido por sus siglas en inglés, "GPS"). Este era un programa que emulaba la inteligencia humana por medio de una técnica que denominaron análisis de fines y medios. De acuerdo con esta técnica, se define un estado inicial y un estado final como forma de caracterizar la situación problemática; todo problema se plantea como un duplo: el estado que tenemos ahora y el estado que queremos obtener por medio del trabajo intelectual que intentamos emular. Estos estados tienen que estar representados en un formalismo común, porque de otro modo no habría manera de pasar de la representación del primer estado a la representación del segundo. Lo cual implica, por supuesto, que los problemas que se traten de resolver tienen que poder ser representados (según una tesis implícita en el paradigma funcionalista de que no hay inteligencia sin representación).

Pues bien, dentro de ese contexto, la hipótesis de la búsqueda heurística nos dice que los problemas se representan como estructuras simbólicas y que un sistema de símbolos físicos ejerce su inteligencia generando y progresivamente modificando estructuras simbólicas hasta producir la estructura que corresponde a la solución. El término "búsqueda" se utiliza porque en vez de pensar en esta progresiva modificación de estructuras, resulta útil imaginar un mundo conceptual, también llamado "espacio lógico", donde preexistirían todas esas formas estructurales, y concebir el ejercicio de la inteligencia como un viaje por ese espacio que finalmente nos lleva a encontrar la estructura final que andamos buscando.

En la práctica, todas estas estructuras no existen desde el principio, pero podemos pretender que existen si poseemos un "generador" capaz de producirlas, en forma ordenada, una por una, para que la inteligencia las compare con la estructura meta o final. De ahí que este método se haya llamado también el método de la generación y la prueba, que puede concebirse como un ciclo en que sucesivamente generamos una estructura y la comparamos con el modelo de la meta buscada; si no hay todavía correspondencia, volvemos a generar, y así sucesivamente hasta encontrar la meta o agotar las capacidades del generador. La palabra "heurística" se agrega a la de "búsqueda" porque normalmente la búsqueda no se hace de modo exhaustivo sino en forma selectiva, de conformidad con reglas que tratan de predecir cuán promisoria sea cada estructura que queremos desarrollar (emplear como base para generar otras estructuras).

La hipótesis de la búsqueda heurística hace uso esencial en su formulación del término "sistema de símbolos físicos". Este término es tan fundamental en informática, nos aseguran los autores, como el término "célula" es fundamental en la biología contemporánea, o "placa tectónica" lo es hoy en geología. Así pues, la hipótesis de búsqueda heurística, como todas las otras hipótesis que podríamos formular en informática, supone una hipótesis básica y fundamental, que nuestros autores califican de ley de estructura cualitativa, a saber: la hipótesis de los sistemas de símbolos físicos. Esta es la hipótesis a que se refiere la selección incluida en la Antología, y que procederemos a comentar.

Newell y Simon nos recuerdan que las ciencias tienen, además de leyes cuantitativas, que son las más elaboradas, leyes de estructura cualitativa, que son más generales y describen la naturaleza desde un punto de vista particular correspondiente a la respectiva disciplina. Mencionan como tales leyes, la doctrina celular de la biología, la doctrina de las placas tectónicas en la geología, la de los gérmenes en la medicina y la del atomismo en la física. Debemos hacer notar que esta caracterización tiene mucho que ver con el concepto de paradigma que hemos estudiado en el capítulo primero, especialmente en relación con el texto de Thomas Kuhn. Recomendamos al lector tomarlas aproximadamente como el mismo concepto –aunque en detalle puedan tener sus diferencias– pues para los efectos que aquí interesan "ley de estructura cualitativa" y "paradigma" funcionan de manera muy semejante.

La hipótesis de los sistemas de símbolos físicos es un ejemplo de ley de estructura cualitativa. Como tal, provee un paradigma para la ciencia cognoscitiva y, en este sentido, complementa la obra de Turing, dándoles un tono empírico y explícito a las anticipaciones teóricas e implícitas de ese gran matemático y filósofo. En el fondo, no es nada diferente de lo que hemos llamado la tesis "distintivamente Turing" en el capítulo segundo. Veamos cómo formulan la hipótesis estos autores.

Los sistemas de símbolos que les interesan a nuestros autores son sistemas de símbolos físicos. ¿Por qué físicos? Porque están hechos en último término de altos y bajos en una corriente eléctrica. ¿Por qué sistemas? Porque aparecen siempre integrados en conjuntos con relaciones muy complejas entre sí y que, además, tienen límites muy claros en relación con su entorno. Un sistema es una configuración de componentes que mantienen entre sí relaciones mucho más fuertes que las que mantienen con el entorno; además, estas últimas están localizadas en sus llamados canales de entradas y de salidas.

Y finalmente, ¿por qué símbolos? Esto se conecta con la noción de representación, mencionada antes; en el fondo, cuando decimos "sistemas representativos" estamos diciendo lo mismo que cuando decimos "sistemas de símbolos". El símbolo y la representación son conceptos muy cercanos; los dos conceptos nos remiten más allá de sí mismos: el símbolo simboliza otra cosa; la representación, la representa. Un símbolo físico es un ente físico muy especial que apunta hacia otra cosa. La palabra "apunta" es más clara que las palabras "simboliza" o "representa", está menos cargada de contenido filosófico y emocional, y por ello nos permite hacer una transición suave hacia un concepto completamente informático del simbolismo, más fácil de explicar y de entender, asociado con el mecanismo del puntero.

En programación, un puntero es una variable cuyo contenido constituye el nombre de otra variable; una dirección de la memoria que contiene otra dirección. El símbolo en sentido puramente físico no es nada más ni nada menos que un puntero en la memoria de una máquina. En su intento de aclarar la inteligencia, nuestros autores se deciden a usar como concepto clave para definirle el término de símbolo físico. Pero debemos notar que su concepto de simbolismo es minimalista: no contiene nada más elaborado que la idea informática de puntero, o sea, una dirección de memoria que aloja el nombre de otra dirección de la misma clase.

Creemos haber aclarado los conceptos de "sistema", "físico" y "símbolo" empleados por nuestros autores en el título de su teoría favorita. Antes de entrar directamente a su formulación, debemos todavía desglosar un poco el concepto de "expresión simbólica". Una expresión es una cadena de símbolos, que ella misma participa de la calidad representativa de otra realidad, computacional o externa a la máquina. Estas cadenas de símbolos son jerarquizadas, es decir, una expresión mayor es descomponible en expresiones menores, que a su vez pueden tener componentes que son también expresiones simbólicas, hasta llegar a componentes que son símbolos no descomponibles, o sea, punteros atómicos.

Otra manera de decir lo mismo es comenzar con los símbolos atómicos y decir que pueden combinarse entre ellos para formar expresiones simbólicas moleculares, que a su vez pueden asociarse con otras expresiones simbólicas, moleculares o atómicas, para formar expresiones simbólicas mayores, y así sucesivamente. Este carácter recursivo de las expresiones simbólicas resultará tener una importancia trascendental en la polémica del simbolismo con el conexionismo que veremos más adelante en este capítulo: en efecto, solo los sistemas de símbolos, pero no las redes conexionistas, son recursivas en este sentido.

Una vez introducida la idea de expresión simbólica, los autores atribuyen al sistema dos capacidades centrales relativas a la estructura de expresiones, símbolos y objetos: son ellas las capacidades de designación e interpretación.

Los objetos a que se refiere la definición de designación son otras estructuras simbólicas, o sea objetos computacionales. Lo más importante del concepto de designación es proveer una vía de acceso al objeto, en lo que consiste esencialmente la designación. El caso más simple es el del nombre de una variable, a la cual se le ha asignado un valor, por ejemplo, una expresión simbólica. Digamos el caso de que en Logo atribuyamos valor a una variable mediante la expresión:

De ahora en adelante, la lista que constituye el valor de la variable será accesible por el simple uso del símbolo "VARIABLE", por ejemplo, para imprimirlo, hacerlo parte de otra expresión simbólica más grande, etcétera.

La interpretación, por su parte, es la capacidad de desencadenar un proceso computacional que está asociado a una expresión. Dada la expresión, el sistema es puesto en movimiento para realizar el proceso que le está asociado, lo cual significa que el sistema puede invocar sus propios procesos para ser ejecutados, por el simple acceso a las expresiones que los designan. Por ejemplo, cualquiera de las primitivas de Logo es un símbolo que el sistema interpreta como una acción determinada: la expresión simbólica

desencadenará un proceso que producirá el correspondiente desplazamiento de la tortuga en la pantalla. Pero también, la expresión simbólica

producirá un dibujo en la pantalla, si previamente se ha asociado el símbolo "CUADRADO" con un procedimiento, mediante la expresión

Estas capacidades de designación e interpretación son de gran generalidad y poder. Así, un símbolo puede ser usado para designar absolutamente cualquier otra expresión. Por otra parte, existen expresiones para designar cada uno de los procesos originales de los que la máquina es capaz, como imprimir, hacer aparecer caracteres en la pantalla, etcétera. Además existen procesos para crear cualquier expresión, o para modificarla de manera arbitraria. Todas estas expresiones están dotadas de estabilidad: una vez creadas, permanecen como tales mientras no sean explícitamente modificadas o borradas. Finalmente, el número de expresiones que el sistema puede contener está limitado solamente por el tamaño de la memoria de la máquina.

Tomando en cuenta todas esas características de los símbolos y de las expresiones simbólicas que podemos construir a partir de ellos, nos es posible enunciar la hipótesis de estructura cualitativa para los sistemas de símbolos, a saber, la

hipótesis de los sistemas de símbolos físicos

Esta hipótesis hace uso de los conceptos de condición suficiente y necesaria estudiados en el capítulo anterior en relación con el concepto de definición lógica. Sin embargo, los autores no han querido usar los términos exactos, sino una versión debilitada de los mismos: no "condiciones necesarias (o suficientes)", sino simplemente "medios necesarios (o suficientes)". La razón de esta decisión tiene que ver con las limitaciones de la definición por condiciones suficientes y necesarias que analizamos en el capítulo anterior, en relación con la vida práctica. Tales definiciones son demasiado rigurosas como para ser útiles en las situaciones reales. La versión debilitada es más realista. Si empleáramos la definición estricta, sin debilitamiento, a saber,

esto equivaldría a afirmar que una computadora, como encarnación más próxima de la máquina universal de Turing, y por lo tanto de un sistema de símbolos físicos, está dotada de hecho y ahora mismo de inteligencia. En cambio, en la versión debilitada solo enunciamos, más prudentemente, que una computadora es programable para adquirir esa inteligencia.

Igualmente, la tesis fuerte nos diría que todo sistema inteligente exhibiría ya, sin necesidad de mucho análisis, su condición de sistema de símbolos físicos, sin que restara nada por hacer a los científicos para demostrar esta conformidad. En cambio, la tesis debilitada solo nos promete que, después de duras investigaciones, podremos algún día encontrar, por ejemplo, que el cerebro humano es un tal sistema de símbolos físicos.

Dicho de otra manera y en resumen, la hipótesis como está enunciada por Newell y Simon es la expresión de sendos programas de investigación, a largo plazo, para las disciplinas gemelas de la inteligencia artificial y la ciencia cognoscitiva: para la primera, en cuanto le toca elaborar las condiciones suficientes a partir de los medios suficientes que ofrecen los sistemas de símbolos físicos, a fin de producir la inteligencia de manera artificial; para la segunda, en cuanto le toca descubrir las condiciones necesarias a partir de los medios necesarios, a fin de comprender plenamente el funcionamiento del cerebro humano. Así lo expresan los autores mismos:

Y en cuanto a "acción inteligente general", se trata de la capacidad para que en situaciones reales se produzca un comportamiento del sistema apropiado a sus fines, adaptativo en relación con las demandas del ambiente.

Los autores insisten en que la hipótesis de sistemas de símbolos físicos es claramente una ley de estructura cualitativa. Tal ley especifica una clase muy general de sistemas dentro de los cuales se podrán y deberán encontrar aquellos capaces de acción inteligente. En cuanto ley de estructura cualitativa, es una hipótesis empírica, tanto como la hipótesis de placas tectónicas de la geología o la hipótesis celular de la biología, para citar a algunas de las otras leyes de estructura cualitativa, de carácter indudablemente empírico. La acción inteligente existe por doquier en el mundo biológico, especialmente en el comportamiento de los seres humanos. Pero además, es una forma de conducta tan característica, que podríamos reconocer por sus efectos, incluso en el caso de que fuera ejecutada por seres ni humanos ni biológicos.

La hipótesis es además muy ambiciosa; nos dice que la acción inteligente correspondería a sistemas de símbolos físicos incluso en esos casos de inteligencia no biológica. Como tal, bien podría ser falsa; podría ser por ejemplo que nunca resultara posible producir una inteligencia artificial. O que llegáramos a descubrir que el cerebro, después de todo, no es realmente un sistema de símbolos físicos NOTA 2. Esta característica de poder ser falsa es lo que concede a la hipótesis su carácter eminentemente empírico: en la medida en que la consideremos verdadera será porque la experiencia tienda a confirmarnos en la convicción de que es verdadera.

Para los autores, una de las más importantes confirmaciones de la hipótesis de los sistemas de símbolos físicos estriba en el hecho de que la búsqueda de explicaciones del comportamiento inteligente del hombre en términos de sistemas de símbolos ha tenido un éxito considerable durante los veinte años anteriores al artículo (décadas de los sesenta y setenta); hasta tal punto que la teoría del proceso de información ha llegado a ser el punto de vista dominante en psicología cognoscitiva. Especialmente en las áreas de resolución de problemas, adquisición de conceptos y memoria de largo plazo, los modelos de manipulación de símbolos dominan la escena, como lo hacen notar nuestros autores. Así, el carácter empírico de la informática queda confirmado por esta alianza de la informática con la psicología, ciencia que nadie podría tildar de simplemente teórica. Esa alianza es de doble dirección: no solo se usan experimentos psicológicos para comprobar la veracidad de los modelos de simulación que tratan de explicar la conducta humana, sino que de los experimentos surgen ideas para el diseño y construcción de nuevos sistemas de símbolos físicos.

Es importante notar que de acuerdo con este planteamiento y en consonancia con la perspectiva general del funcionalismo NOTA 3, las condiciones de la acción inteligente no tienen nada que ver con el material de que esté hecho el agente respectivo. Lo importante es que dicho agente encarne en su organismo o mecanismo un sistema de símbolos físicos. Es la función que realizan las partes de ese sistema y no la materia de que están construidas, lo que explica la acción inteligente. Una de las ventajas de este planteamiento es que logra una considerable unificación de las disciplinas científicas involucradas, ya que no necesitamos teorías diferentes para explicar inteligencias diferentes. Todas ellas resultan ejemplos de sistemas de símbolos físicos.

La hipótesis ofrece una explicación totalmente general al problema de la inteligencia, con completa abstracción de su forma de implantación, de su encarnación, por así decirlo. Dicho de otra manera, si la inteligencia es explicable como el comportamiento de un sistema de símbolos físicos, este sistema puede quedar encarnado en un hombre, en una computadora, en un animal no humano, o en un ser pensante cualquiera extraterrestre; es suficientemente general para cubrir cualquier sistema capaz de pensar, esté construido de neuronas, de conmutadores eléctricos, o de cualquier otra cosa. Esta osada teoría no se queda sin objetantes, como veremos más adelante en este mismo capítulo: contra ella van a reaccionar enérgicamente, entre otros, los practicantes o apóstoles de la neurociencia.


Ejercicios de aprendizaje

1) Haga un extracto de las principales ideas discutidas en el texto a que se refiere el comentario precedente.

2) Identifique dos sistemas de símbolos físicos cualesquiera que usted encuentre rutinariamente en su vida ordinaria.


Respuesta a los ejercicios de aprendizaje

1) Si su resumen incluye las siguientes ideas puede considerarlo correcto.

2) Por ejemplo, los signos de circulación en la ciudad (signos de ALTO, flechas de dirección sobre las calles, luces de distintos colores, etcétera); el sistema monetario (billetes de distintas denominaciones que se pueden cambiar por monedas fraccionarias de distintos valores, o por las mercancías, bienes y servicios que ellas representan).


Ejercicio de lectura

Recomendamos leer el texto Marr y Poggio, difícil de conseguir (MARR 76), o una selección traducida en el capítulo cuarto de nuestra Antología.


Comentario

El texto de Marr y Poggio nos pone en relación con uno de los estudios informáticos que reviste carácter más empírico. Se trata aquí de la obra de dos investigadores que contribuyen a esclarecer los aspectos epistemológicos de la percepción visual con un enfoque eminentemente empírico y tecnológico, a saber: mediante la construcción de una vista artificial. Para proceder de esta manera, han tenido que elaborar una metodología especial, que ha resultado ser de considerable trascendencia para la ciencia cognoscitiva contemporánea. Esa metodología, demasiado técnica para explorarla en detalle aquí, descansa en una ontología, es decir, en una caracterización fundamental sobre lo que hay, sobre los tipos o niveles de seres con que tenemos que lidiar en el estudio de la percepción visual.

En un libro que publica en 1982, seis años después de la publicación del artículo suyo que comentamos, David Marr propone un esquema de división de niveles en ciencia cognoscitiva que ha resultado muy influyente, basado en lo fundamental en la categorización de 1976. Propone ahí tres niveles ontológicos distinguibles: el computacional, el algorítmico y el de la implantación. Cada uno de estos niveles de descripción se diferencia claramente de los demás, y todos están relacionados entre sí lógica y causalmente. Sin embargo, ningún nivel particular de descripción es independiente de los otros. En realidad corresponden a diferentes focos de atención para concebir una realidad que es fundamentalmente la misma. Algoritmos diferentes se implantan más naturalmente en ciertas arquitecturas físicas, de modo que la información sobre la implantación puede determinar la configuración de nuestro nivel algorítmico. La categorización propuesta puede resumirse en la siguiente tabla:

Los tres niveles de una máquina que procesa información

Teoría computacional Representación y algoritmo Implantación en hardware
Cuál es la meta de la computación, por qué es apropiada y cuál es la lógica de la estrategia por medio de la cual se lleva a cabo. Cómo puede esta teoría computacional ser implantada. En particular, cuál es la representación para las entradas y salidas y cuál es el algoritmo para la transformación. Cómo pueden la representación y el algoritmo ser realizados físicamente.

NOTA 4

La teoría computacional enfoca el análisis del problema que el sistema soluciona, no los métodos por medio de los cuales lo soluciona. En el nivel computacional no es importante si la teoría se ofrece en la forma de una máquina Turing, de un conjunto de axiomas o de cualquier otra manera. No importa aquí tampoco cuánto dura la computación o si es afectada por la carga de la memoria o la complejidad del problema. Ni siquiera importa cómo se representa la información, con tal de que el lenguaje representativo sea suficientemente rico. Lo importante es cuál función se computa y no cómo se computa. En el nivel de descripción del algoritmo, en cambio, nos preocupamos de cuestiones de eficiencia, degradación del rendimiento por condiciones adversas, de la facilidad o dificultad del problema, del tiempo que toma la solución, de cómo representamos la información, etcétera. Este nivel pareciera ser, por ejemplo, el de la investigación psicológica en general; en relación con él es que parecen atinentes los datos psicológicos.

Marr recomienda como una buena estrategia para el desarrollo de teorías, comenzar por un análisis exhaustivo del propósito de la computación y un intento de formalización NOTA 5 del problema que el sistema debe resolver. Considera que el análisis del problema de arriba para abajo es un mejor enfoque para sugerir algoritmos que el análisis de abajo para arriba, y por ello le da la máxima importancia a este primer nivel de descripción. En la ciencia cognoscitiva, especialmente en psicología, pareciera predominar el nivel del algoritmo, pues la mayor parte de las investigaciones se concentran en ese nivel, y solo ocasionalmente llegan a formular teorías computacionales suficientemente compendiosas.

Toda esta cuestión ontológica se presenta en el artículo de Marr y Poggio bajo la forma de la pregunta por el nivel de abstracción en que deben ser observados los fenómenos. Con esta motivación es que recomiendan distinguir cuatro niveles: el más bajo, de componentes básicos (transistores, neuronas, diodos, sinapsis); el segundo, de mecanismos particulares (sumadores, memorias, etc.); el tercero, de algoritmos; y el superior, que corresponde a una teoría computacional que describe la tarea perceptiva de que se trata (por ejemplo, percibir un objeto). Como se ve, en el libro posterior de Marr se realiza una refundición de los primeros dos niveles, posiblemente por la razón de que no existe suficiente diferencia de naturaleza entre los componentes básicos y sus inmediatos ensambles. En cambio, es bastante claro que existe un contraste entre todos estos elementos de carácter fundamental y la noción misma de representación y de algoritmo.

El propósito principal del artículo es subrayar la importancia individual de cada uno de los niveles en la comprensión de un proceso informático y la importancia de distinguirlos y mantenerlos separados. Por ejemplo, en intentos de relacionar problemas psicofísicos con la fisiología, es útil determinar con claridad el nivel en que surge el problema. En particular, los autores consideran que el nivel máximo o computacional es usualmente descuidado, y en realidad, para el esclarecimiento de los problemas de la percepción, pareciera ser el más importante. Esto es así porque la estructura de las computaciones que subyacen a la percepción dependen más de los problemas que hay que resolver que de la arquitectura particular en que se realizan las soluciones. Los autores comparan la situación con el desarrollo de la física, donde las descripciones globales de la termodinámica constituyeron históricamente la primera etapa en el estudio de la materia, mientras que la descripción en términos de mecanismos o componentes elementales apareció solo mucho más tarde.

Los autores resumen en el artículo algunos ejemplos de teorías en diferentes niveles, ilustrando los tipos de predicciones que pueden emerger de cada uno de ellos. El número de niveles no es lo más importante. Lo importante es más bien el concepto epistemológico de que la realidad no puede ser entendida sino a partir de puntos de vista particulares, unos más globales que otros, todos los cuales se conjugan para integrar la función del respectivo conocimiento. Esta concepción, que –como hemos visto en el capítulo anterior– no es ajena a la tradición filosófica, logra en la obra de estos autores concretarse de una manera tecnológica con estipulaciones muy específicas. Es una confirmación de la tesis general, que muchos autores contemporáneos mantienen, de que la epistemología se ha ido transformando en nuestro tiempo en una disciplina con contenido cada vez más experimental y tecnológico.


Ejercicios de aprendizaje

1) Haga un extracto de las principales ideas discutidas en el texto a que se refiere el comentario precedente.

2) Usted desea resolver un problema práctico de la vida cotidiana de su casa, y quiere adoptar una metodología científica para ello; así, decide usar la teoría de los niveles de Marr y Poggio. Elija un problema particular y formule un esbozo de los mecanismos y/o algoritmos necesarios para resolverlo, así como su implantación física.


Respuesta a los ejercicios de aprendizaje

1) Si su resumen incluye las siguientes ideas puede considerarlo correcto.

2) Por ejemplo: hay un visitante nocturno de su cocina (un ratón) que debe ser eliminado por razones higiénicas y de economía doméstica. Este es el problema, que se plantea en el nivel más alto o de la computación. Un posible algoritmo/mecanismo para resolverlo es el envenenamiento; otro es la persecución y muerte del visitante, a garrotazos; otra posibilidad es la captura por arrinconamiento o trampa; otra es ahuyentar al visitante y sellar después las entradas a la pieza, etcétera. En el nivel físico, y dependiendo del tipo de algoritmo/mecanismo elegido, será necesario obtener veneno, garrote o ratonera, o bien disponer los muebles y otros elementos de la pieza para el arrinconamiento o sellamiento, etcétera.


Ejercicio de lectura

Recomendamos leer el texto de Daniel Dennett (DENNET 81), o una selección traducida al español en el capítulo cuarto de nuestra Antología.


Comentario

Teoría de niveles

Daniel Dennett, en la selección que presentamos en este capítulo, desarrolla sistemáticamente la misma idea de niveles que hemos visto en Marr y Poggio, aunque con un sentido epistemológico más acentuado: aunque los niveles sean algo que se da en la realidad (ontología), son también puntos de vistas que podemos escoger en distintas circunstancias para tratar de comprender esa realidad NOTA 6.

El autor distingue en particular tres de estas perspectivas:

  1. la física,

  2. la del diseño y

  3. la intensional. NOTA 7

La perspectiva física es la que se impone, por ejemplo, al ingeniero que construye una computadora; la del diseño, es la perspectiva que adopta su programador; la intensional, finalmente, es la que corresponde al usuario de un programa concreto. Cabe notar que la palabra "intensional" en este contexto no quiere decir "con intención"; se refiere más bien a la significación escolástica reintroducida en la filosofía contemporánea por Franz Brentano, de referencia esencial a un objeto, contenida en todos los conceptos que expresan actitud de un sujeto hacia un objeto (tales como "creer","desear", "temer", "querer", "conocer", "creer", etcétera). Para lo que sigue, vamos a llamar intensional a todo aquello que tiene la naturaleza de un deseo (positivo o negativo) o de una creencia. El conocimiento, como creencia justificada, será también considerado como un estado intensional del sujeto.

Dennett insiste en la conveniencia y legitimidad de usar el punto de vista superior (nivel intensional) para tratar de entender el comportamiento de un programa inteligente (por ejemplo, un programa que juegue ajedrez). Basa su recomendación en el supuesto de diseño óptimo del programa. Considera que este supuesto es semejante a la suposición de racionalidad que todos hacemos cuando interactuamos con otras personas (en este caso lo que suponemos es que el organismo de la persona con quien actuamos ha sido óptimamente diseñado por la evolución y la selección natural). Todo esto lleva al autor a postular, en conjunto con otros filósofos funcionalistas, la autonomía de la psicología como ciencia, por corresponder a un nivel de discurso e interpretación enteramente distinto de aquel en que se desenvuelve la ciencia neurofisiológica.

Todos conocen o han oído hablar de programas de computación que juegan ajedrez. No son todavía campeones del mundo, pero sí pueden vencernos a casi todos los otros jugadores. Imaginemos que presenciamos una partida entre uno de estos programas y un experto jugador humano. Si ahora nos preguntamos, cuál irá a ser la próxima jugada del humano o de la computadora –según sea el caso– nos encontramos con la siguiente situación.

  1. Es igualmente difícil o fácil predecir la jugada de cualquiera de los dos contrincantes.

  2. La predicción se basará en los mismos principios y circunstancias (básicamente, intenciones de los jugadores y significados, para cualquiera que conozca el juego, de las posiciones del tablero).

  3. Ninguna combinación de observaciones sobre estímulos y respuestas (de los que interesan a los psicólogos conductistas) sería suficiente para predecir ninguna jugada interesante.

  4. La predicción deberá basarse en la definición del juego, en la suposición de que el jugador tiene el propósito de ganar y en la suposición igualmente importante de que el jugador es racional (sabe escoger los medios adecuados para tratar de obtener los fines que persigue).

En relación con el supuesto de racionalidad, es interesante notar que no implica suponer que la computadora sea persona: basta suponerla "sistema intensional", tal como lo define Dennett en este texto (un sistema capaz de actuar como si tuviera creencias, propósitos, planes, etc.). No tenemos completamente claro en qué consista para un humano tener creencias, propósitos, etc. No obstante, cuando decimos –hablando de una computadora– que está tratando de fortalecer el flanco del rey, simplemente afirmamos que tiene en su "mente" algo semejante a lo que tendría un humano que se encontrara en esas circunstancias. Con una importante diferencia: en el caso de la computadora sabemos cómo funciona esa "mente", puesto que nosotros (o algún humano al que podemos interrogar) la hemos diseñado, construido y programado.

Imaginemos, por ejemplo, que la computadora acaba de adelantar un caballo. Pensemos en las maneras posibles de contestar esta pregunta: "¿Por qué hizo la computadora esa jugada?" Veamos. Si nos colocáramos en la perspectiva del ingeniero electrónico, sería complicadísimo contestarla: habría que mencionar innumerables transiciones en los estados físicos de complejos dispositivos eléctricos. En cambio, si la computadora no hubiera hecho ninguna jugada después de largo rato, la respuesta a la pregunta "¿por qué no ha jugado la computadora?" podría tal vez ser contestada por el ingeniero (o por cualquier otra persona con conocimientos rudimentarios de electricidad) de manera muy fácil; por ejemplo: "La corriente no puede pasar por este cable roto". Esta es una contestación en el nivel físico, un nivel al que recurrimos solamente cuando se descompone (enferma) el aparato.

El programador de la computadora, por su parte, podría quizá, con mucho esfuerzo, darnos su propia contestación sobre por qué la computadora adelantó el caballo, desde su propia perspectiva funcional o de diseño: para ello tendría que seguir el programa paso a paso (labor eminentemente tediosa, pero posible). Sin embargo, no podría decirnos nada sobre el caso del cable roto, en cuanto programador; podría hacerlo, en cambio, en cuanto electricista de sentido común. Ello porque en el caso de predicciones o explicaciones que se basen en el estado físico particular de un objeto determinado, tenemos que aplicar no nuestro conocimiento de un programa –ni del arte de la programación– sino nuestro conocimiento de las leyes de la naturaleza. El punto de vista del diseño implica que tratamos al objeto como un artefacto. Tiene aplicabilidad en la medida en que el objeto funcione de acuerdo con su diseño, pues si falla, no tendremos más remedio que asumir el punto de vista físico.

Los objetos naturales también pueden ser considerados desde el punto de vista del diseño. Esto implica suponer que fueron diseñados. ¿Diseñado por quién o qué? No necesitamos invocar una intervención sobrenatural. Podemos aceptar como diseñador a la evolución, a la selección natural. A la perspectiva del diseño, perspectiva eminentemente funcionalista (solo la función es importante) no le interesa distinguir entre objetos naturales y objetos artificiales; si un órgano cumple una función, puede ser explicado por exploración de su diseño, cualesquiera que fueren las fuerzas que lo hayan originado. Igualmente, esta perspectiva es neutral con respecto a la constitución física o la naturaleza de las vísceras del objeto cuyo comportamiento estamos tratando de explicar o predecir: le da igual que sea hecho de carne, de silicio, o de cualquier otro material, basado en la química del carbono o en cualquier otra química.

Si uno sabe exactamente cómo fue diseñado el programa, es posible predecir cuál jugada va a hacer, simplemente siguiendo sus instrucciones. La palabra "simplemente" en este caso puede disimular enormes dificultades prácticas. Pero, en principio, es posible. Estas predicciones se cumplirán siempre que la computadora o el programa trabajen sin interrupción física. Es normal adoptar este punto de vista del diseño para hacer predicciones sobre el comportamiento de objetos mecánicos, por ejemplo cuando la máquina de escribir se acerca al margen, decimos que va a sonar una campana. Lo fundamental de este enfoque es que hacemos las predicciones con base únicamente en el conocimiento del diseño del objeto, independiente de su constitución física. No nos interesa, por ejemplo, de qué material está hecha la máquina de escribir, y por supuesto, en el caso de la computadora, no nos importa si se trata de una Macintosh o una IBM.

La manera más natural, sin embargo, de contestar preguntas sobre aparatos que procesan información, como nuestro ejemplo del jugador electrónico de ajedrez, es desde el tercer nivel, el nivel intensional: "La computadora" –diremos– "adelantó el caballo porque cree que el flanco del rey está débil y desea fortalecerlo". Es de notar que en el nivel intensional es posible hacer predicciones (o explicaciones) en distintos subniveles, todos ellos intensionales. Se puede decir: "La computadora está tratando de ganar la partida", o "La computadora está tratando de hacer una buena apertura", o "La computadora trata ahora de dominar el centro".

El usar el nivel intensional de explicación no implica que los otros no sean también posibles; es más, siempre debemos bajar a ellos si las circunstancias así lo exigen. Estas predicciones o explicaciones en el nivel superior son válidas solo bajo el supuesto de un diseño óptimo. En el caso de los seres humanos, rara vez cuestionamos ese postulado: creemos que nuestros semejantes están bien diseñados, sea porque tenemos suprema confianza en la evolución y la selección natural, o porque hemos sido aculturados para actuar así. Necesitamos muchísimas muestras de comportamiento aberrante para aceptar la idea de que nuestro interlocutor humano no sea racional, es decir, que no esté en sus cabales. A veces lo hacemos, sin embargo; y en ese caso descendemos al nivel de diseño para preguntarnos por el problema psicológico que lo aqueja (tuvo un desengaño amoroso) o –si el caso es aún más grave (no nos contesta cuando le hablamos, por ejemplo)– recurrimos al nivel físico (presumiblemente habrá perdido el oído).

El nivel intensional en relación con el juego de ajedrez consiste en tratar a la computadora como si fuera un jugador humano. Pero esto no significa que la consideremos una persona, simplemente la tratamos como un sistema intensional. El concepto de un sistema intensional es una noción no metafísica que no tiene nada que ver con posición social, constitución biológica, conciencia moral, etcétera, de los entes que caen dentro de él. Es mucho más fácil decidir si una máquina puede ser un sistema intensional, que decidir si una máquina realmente piensa o es consciente o es moralmente responsable. Pero, además, es interesante anotar que esa simplicidad hace ideal al concepto de sistema intensional como fuente de orden y organización en el análisis filosófico de los hechos mentales. De ahí que el autor pueda hacer esta afirmación sumamente importante: cualquier cosa que la persona sea –por ejemplo una mente, un alma, un agente moral autoconsciente– esa persona es también y por supuesto un sistema intensional. Y cualquier cosa que se siga de ser un sistema intensional será obviamente verdadera de una persona.


Sistemas intensionales

Un sistema intensional es un sistema cuyo comportamiento, por lo menos algunas veces, puede ser explicado y predicho, basándose en adscripciones al sistema de creencias y deseos. "intensional" no debe confundirse con el concepto del lenguaje ordinario de intencional, en el sentido –por ejemplo– de que uno no debe dañar intencionalmente a otra persona. El concepto filosófico de intensionalidad corresponde a la relación "acerca de". Es decir, aquel aspecto de cualquier cosa que sea una dimensión hacia otra cosa; puede ser, en el caso más rico, el conocimiento que un sujeto tiene de un objeto, o en el menos rico, la función de apuntar de un puntero que hemos usado para explicar el concepto de simbolismo NOTA 8. Lo más fácil para aclarar este concepto es dar ejemplos. Lo intensional es básicamente lo que en una cosa nos refiere a otra cosa, siendo las creencias y los deseos el caso más conspicuo. En "yo creo que", "yo deseo que", ese "que" es profundamente intensional NOTA 9.

Dennett caracteriza de manera más precisa a los sistemas intensionales diciendo que solo podemos hablar de tales en relación con las estrategias de alguien que esté tratando de explicar o predecir un comportamiento. Por ejemplo, podríamos atribuir intensionalidad, considerar como un sistema intensional, incluso a algo tan simple como un termostato, cuando tratamos de explicar que haya puesto a funcionar la nevera "porque sabe que ha subido la temperatura interna".

Veamos con cuidado en qué consiste la dialéctica de Dennett. Primero se tiene un sistema, como por ejemplo una computadora que juega ajedrez, cuyo comportamiento es complejo y difícil de interpretar desde los puntos de vista físico o de diseño; entonces decide proyectarle dos categorías que pertenecen originalmente al lenguaje de la vida personal: deseos y creencias. Esto no quiere decir, sin embargo, que lo esté considerando como una persona, sino nada más que se ha adoptado una perspectiva analógica del mundo personal, pero sin ninguna suposición metafísica o ética, solamente como un artilugio para explicar un comportamiento. Lo que se postula como "sistema intensional" es un mínimo de significado, puramente epistemológico, dejando fuera toda implicación metafísica o ética.

Ahora bien, si la estrategia da buen resultado para explicar el comportamiento de una máquina, ¿por qué no aplicarla también a los seres humanos, para entender su comportamiento en forma minimalista, sin movilizar postulados metafísicos y éticos sobre lo que sea una persona como pura máquina epistémica? ¿Qué se seguirá de considerar a las personas como sistemas intensionales, sin ninguna suposición adicional? Lo interesante es que lo que se sigue es sumamente rico; que la estrategia produce muchísima información importante. Lo sorprendente del caso es que, simplemente considerando a las personas como sistemas intensionales, podemos explicar (por lo menos) la mayor parte de su comportamiento. Y con esto hemos hecho un ingreso por la puerta grande a la ciencia cognoscitiva. Eso es precisamente lo que ofrece el paradigma informático a la ciencia cognoscitiva: la posibilidad de explicar el comportamiento humano sin suposiciones morales o metafísicas.


La saga del conductismo

Probablemente todos nuestros lectores estarán de acuerdo en que comprender el funcionamiento de la mente humana es un problema muy difícil. En realidad, es reconocido por muchos autores como el problema más difícil que haya enfrentado nunca la ciencia. Frente a esa dificultad, no puede uno menos que, inspirándose en un consejo de Francis Bacon, procurar comprender los fenómenos complicados de la naturaleza estudiando fenómenos parecidos en casos más simples: lo que la naturaleza oculta en lo complejo, lo revela con prodigalidad en lo simple. Esta inspiración motivó a varios investigadores de comienzos de siglo a tratar de entender los fenómenos de la inteligencia estudiándolos primero en los animales. Así fue como nació la corriente psicológica que llamamos conductismo NOTA 10. También contribuyó como motivación de esos investigadores el deseo de dar al conocimiento psicológico un fundamento positivo: hacerlo tan experimental y firme como la física, en concordancia con el ideal epistemológico contemporáneo de la unidad de la ciencia. En efecto, este ideal exige que, en último término y en algún sentido fundamental, todas las ciencias puedan ser entendidas como conocimiento físico.

Así pues, este intento de dar base experimental a la psicología, el conductismo, tomó como modelo para toda la investigación psicológica los experimentos realizados con animales. Podemos considerar que la psicología animal se constituyó de hecho en el paradigma de las ciencias cognoscitivas, mucho antes del desarrollo del paradigma informático ahora vigente. Ese paradigma, en resumen, pretendía extender a todos los fenómenos psicológicos las categorías de estímulo y respuesta, originalmente inventadas solamente para lidiar con objetos de investigación que carecen de lenguaje y no nos pueden informar sobre sus propios estados internos. El caso más característico es el del perro del investigador ruso Pavlov, al cual se le puede crear un "reflejo condicionado" para que produzca saliva al sonar no más la campana que anuncia su comida.

El precio que el conductismo tuvo que pagar por ese intento de darle control empírico a la investigación psicológica fue, sin embargo, demasiado alto. Equivalió a negar validez al uso de vocablos intensionales en las explicaciones psicológicas. ¡Imagínense a lo que queda reducida la psicología si le negamos la posibilidad de mencionar en sus leyes cosas como deseos, propósitos, temores, aspiraciones o creencias! Contrástese esta privación con el hecho de que ahora nos atrevamos, estimulados por Dennett, incluso a usar esos vocablos para explicar las actuaciones de las máquinas. Pero, por supuesto, la gran diferencia es que sabemos que las acciones de las computadoras admiten explicaciones alternativas, aunque sean menos cómodas, que usen solamente términos funcionales o físicos. Esta posibilidad de producir, si se necesita, una explicación más básica, descansa en el hecho de que la computadora fue construida por ingenieros y programada por programadores, e ingenieros y programadores tienen sus propias maneras de explicar esos fenómenos que, para los simples usuarios de –por ejemplo– un programa de jugar ajedrez, parecen verdaderos actos de inteligencia.

Volviendo al tema de Bacon, nos encontramos que los animales no son los únicos casos en que los fenómenos intelectuales nos hablan un lenguaje sencillo; las máquinas pueden hacer otro tanto. Si los conductistas se inspiraron en los animales para entender la mente humana, los funcionalistas se inspiran hoy en las computadoras para hacer lo mismo. Pero, por lo demás, ¡qué gran diferencia! La misma que hay entre la opacidad y la transparencia. Donde en el caso de la psicología animal solo podemos considerar al animal como una caja negra, a la cual introducirle estímulos y de la cual recoger respuestas, en el caso de la computadora, podemos desarmarla, probar cada uno de sus circuitos, o estudiar detalladamente cada uno de los detalles de los programas ejecutados en ella.

¿Cómo pudimos escaparnos del dilema en que estaba el conductismo? ¿Cómo ha sido posible este milagro metodológico? Muy simple: el concepto de diseño óptimo forma un puente entre los conceptos intensionales o la idea de racionalidad y el terreno firme de las leyes de la física. La informática estudia estos diseños óptimos, también llamados programas. El paradigma de esta nueva ciencia – fundamentalmente la idea de la máquina universal– es lo que ha permitido en nuestros días considerar a cosas tan dispares como la teoría del cerebro, la psicología del aprendizaje o la inteligencia artificial, como aspectos diversos de una sola gran ciencia nueva: la ciencia cognoscitiva o moderna ciencia del conocimiento.


El estatus de los términos intensionales

Vale la pena resaltar un aspecto muy importante de la posición de Dennett con respecto al estatus epistemológico de los términos intensionales. De acuerdo con su perspectiva, es siempre en principio posible reducir el lenguaje intensional a un lenguaje no intensional, propio de los enfoques de diseño o físico. En sus propias palabras:

Estos préstamos de inteligencia se parecen mucho a un recurso a que recurren a menudo los programadores para simplificar su tarea y que recibe el nombre de 'programación estructurada'. En el capítulo II hicimos uso de ese recurso cuando escribimos en pseudo Logo lo siguiente:

La razón por la cual este trozo de código no es Logo sino pseudo Logo estriba en que en la segunda línea del procedimiento escribimos "(el :PROGRAMA, activado con :DATOS, llega a detenerse)" que es una descripción en lenguaje natural de una programación posible pero todavía no realizada. Cuando decimos: "aquí se ejecuta un procedimiento para tal cosa", o cuando invocamos el nombre de una subrutina todavía no definida, estamos tomando un "préstamo de programación". Más tarde tendremos que darle fundamento programático al procedimiento que por el momento es solo un nombre o una descripción en lenguaje ordinario. Este estilo de programar también se conoce como "programación de arriba hacia abajo", y es muy eficiente (por ejemplo, ayuda a mantener los errores lógicos en un mínimo, porque en todo momento el programador sabe lo que está haciendo, y en qué dirección desea dirigirse).

Dennett compara el discurso intensional con un medio de intercambio (una moneda) que permite la evaluación de teorías del comportamiento. En efecto, equivale a una abstracción que representa, suprimidos detalles no esenciales, las formas distintas que pueden revestir los préstamos de inteligencia y, en esa forma, es un medio confiable para detectar qué partes de una teoría están en deuda con respecto a la tarea de explicar los fenómenos cognoscitivos. Donde la teoría usa términos intensionales, ahí mismo se halla escondido un homúnculo (hombrecillo) que está ejerciendo una función intelectual que debe todavía ser explicada; o que, ha sido ya explicada en otro tiempo o lugar, pero que es engorroso llevarla a rastras en el curso del presente discurso. Cualquier mistificación queda exorcizada por adelantado, siempre que los hablantes sepan el uso a que están poniendo sus términos. Confusiones ocasionales no justifican negar a profesionales un arsenal de recursos heurísticos, útiles y seguros a personas que conocen su disciplina.


Ejercicios de aprendizaje

1) Haga un extracto de las principales ideas discutidas en el texto a que se refiere el comentario precedente.

2) Construya una explicación en tres niveles de descripción diferentes para cada uno de los siguientes sucesos:

a) María digita febrilmente sobre el teclado.
b) Los músculos faciales de Víctor se contraen, su cuerpo sufre movimientos de sacudida violentos y su aparato fonador exhala sonidos repetitivos aspirados con preponderancia de la vocal "a".
c) Alberto desea intensamente triunfar en el examen.

Respuesta a los ejercicios de aprendizaje

1) Si su resumen incluye las siguientes ideas puede considerarlo correcto.

2) Hay, por supuesto, varias explicaciones posibles, por ejemplo las siguientes:

a) nivel físico: Los huesos y músculos de los dedos [de María] se desplazan aceleradamente [sobre el teclado] mientras el sujeto produce abundante transpiración.
a) nivel de diseño: María digita febrilmente sobre el teclado.
a) nivel intensional: María escribe su carta de renuncia.

b) nivel físico: Los músculos faciales de Víctor se contraen, su cuerpo sufre movimientos de sacudida violentos y su aparato fonador exhala sonidos repetitivos aspirados con preponderancia de la vocal "a".
b) nivel de diseño: Víctor ríe a carcajadas.
b) nivel intensional: Víctor se divierte con los chistes que le cuenta su amigo Pablo.

c) nivel físico: El flujo sanguíneo [de Alberto] contiene una alta concentración de adrenalina.
c) nivel de diseño: Alberto repite en voz alta una y otra vez las palabras [del Código Penal].
c) nivel intensional: Alberto desea intensamente triunfar en el examen.


Ejercicio de lectura

Recomendamos leer el texto de Patricia Smith Churchland (CHURCHLAND 86), o la selección traducida al español en el capítulo cuarto de nuestra Antología.


Comentario

Patricia Smith coincide con los autores anteriores en considerar a la informática como una ciencia empírica; sin embargo, toma una posición fuertemente discrepante de la perspectiva funcionalista, es decir, de la posición de autores como Dennett, Newell o Minsky. Su criterio básico es que no es indiferente, como querrían los autores de la hipótesis de los sistemas de símbolos físicos, cuál sea el material de que están hechos los seres pensantes (protoplasma o silicio, por ejemplo) y que, por el contrario, no tenemos seguridad de hasta cuál nivel podemos descender sin encontrar que la constitución de los materiales comienza a ser importante.

Es interesante relatar que para la confección del libro del cual está tomado este texto, la autora – filósofa de profesión– dedicó muchos meses a convivir en varios laboratorios de fisiología del sistema nervioso con investigadores que estaban tratando de aclarar los misterios de la percepción, la motricidad y el pensamiento, con métodos estrictamente biológicos. El resultado de este notable proyecto, una reflexión filosófica sobre la investigación en neurociencia, ha sido calificado por ella misma con el sugerente término de "neurofilosofía".

Los argumentos que la autora esgrime contra el funcionalismo son principalmente que la división en tres (o cuatro) niveles de abstracción en el análisis de la cognición (por Marr y Dennett, por ejemplo) es artificial. Un fisiólogo podría distinguir muchísimos más en el funcionamiento del cerebro. Por otra parte, que es inconveniente para la psicología que sea declarada irreductible a la neurología; más bien conviene considerar a ambas disciplinas como ciencias que coevolucionan y continuarán haciéndolo todavía por cierto tiempo. También insiste la autora en que el hecho de que podamos usar categorías de sentido común para describir fenómenos psicológicos no es obstáculo para que intentemos reducir esas categorías a otras más básicas de carácter neurológico. De manera parecida, la categoría de sentido común temperatura pudo ser reducida a los conceptos más rigurosos de la termodinámica. Finalmente, la autora cuestiona la identificación de la cognición con el razonamiento, y de este con la simple computación sobre representaciones formales. Con base en todos estos argumentos, hace un llamado al trabajo cooperativo entre los investigadores de la mente y los investigadores del sistema nervioso.

Smith ofrece una excelente, y bastante objetiva caracterización del funcionalismo, antes de criticarlo. La afirmación fundamental es que, para los funcionalistas, es posible especificar clases funcionales por referencia a los papeles o perfiles relacionales que los objetos desempeñan, sin parar mientes en la estructura material en la cual dichas funciones quedan ejemplificadas. Por un ejemplo, lo que hace que una cierta parte de una máquina sea un levantador de válvulas es que dado cierto input aplicado a la máquina se producirá un cierto output de levantamiento de válvulas; no es parte de la caracterización que este levantador de válvulas esté construido con cierto material, pues la función puede estar ejemplificada en muchos distintos materiales físicos. Igualmente, una y la misma organización cognoscitiva puede ser encarnada en distintas estructuras y materiales, lo cual lleva a la conclusión de que no puede haber una correlación de 1 a 1 entre los tipos funcionales y los tipos estructurales (llamamos tipos estructurales a la forma material o física en que están constituidas las piezas de la máquina). En sus propias palabras:

La idea central del funcionalismo es la tesis de que los estados mentales se definen en términos de sus papeles causales abstractos dentro de un sistema más amplio de procesamiento de información. Un estado mental dado se caracteriza en términos de sus relaciones causales abstractas con referencia a las entradas del medio ambiente, a otros estados internos y a las salidas.

Es de advertir que, a pesar de su asimilación de los estados y procesos mentales a clases funcionales, los teóricos de la cognición de la escuela funcionalista tienen algo que decir –aunque mínimo– sobre la constitución de los aparatos cognoscitivos. En efecto, los funcionalistas se alían con el fisicalismo positivista al afirmar que nuestros estados mentales se ejemplifican en un material neuronal y no, como los dualistas –herederos de la posición de Descartes– sostienen, en un material espiritual. Pero su aceptación básica del materialismo no les impide afirmar que el hecho de que las neuronas estén orquestadas de la forma en que lo están, es lo que permite al sistema asumir la organización funcional que presenta, donde el substrato físico está subordinado al nivel superior de carácter funcional.

Comentemos ahora, con cierto detenimiento, algunas de las principales líneas de la maciza argumentación de la autora.

Los niveles psicológicos

Uno de los aspectos fundamentales de la descripción que la autora hace del funcionalismo corresponde a lo que podríamos llamar la teoría de los niveles de descripción, que corresponde a lo que antes hemos estudiado como la ontología de la informática y las ciencias cognoscitivas NOTA 11. Para la autora, lo más importante que debe ser percibido en esta conexión es que el caso de las computadoras ofrece la posibilidad de dar un sentido claro a la noción de niveles. Así, hay consenso en que la máquina tiene tres niveles básicos de descripción: el nivel semántico, el nivel sintáctico y el nivel de mecanismo, aunque tal vez distintos autores los reconocen con distintos nombres.

En el nivel semántico podemos describir ciertas metas de la máquina, como computar una raíz cuadrada, sacrificar una torre (en el juego de ajedrez), o inferir una conclusión a partir de algunas premisas. En el nivel sintáctico, podemos comentar los detalles del programa, el lenguaje de programación usado, si los símbolos están orientados a ser operados automáticamente por la máquina o ser interpretados por el usuario, etcétera. El nivel de mecanismo, finalmente, tiene que ver con la arquitectura material de la máquina, sus capacidades y constreñimientos físicos. Es dentro de este marco de referencia que los funcionalistas postulan su teoría del procesamiento de información aplicable a la comprensión de los fenómenos cognoscitivos humanos, como una teoría de la dinámica del nivel semántico, sujeta a las reglas lógicas y los principios de control del nivel sintáctico subyacente (operación sobre símbolos). Por el contrario, conceden a la neurobiología la atención del nivel inferior –es decir, en el nivel del mecanismo–, negándole toda competencia para estudiar ninguno de los niveles superiores.

La autora cuestiona firmemente este supuesto funcionalista de que el modelo de tres niveles, aceptable para las computadoras con memoria de silicio, sea también aceptable como interpretación de la actividad de los cerebros orgánicos. El principal problema que encuentra en la metáfora computacional es que con base en la complejidad que hemos encontrado en el cerebro, es evidente que se dan muchos niveles de organización entre el más alto y el más bajo, desde el nivel de sistema nervioso hasta el de la dinámica intercelular. Cuántos niveles haya y cómo deban ser descritos no es algo que se pueda decidir a priori, antes de la experimentación.

Por otra parte, la diferencia entre estructura y función, aunque es útil, es también un término relativo, porque a veces, lo que es estructura cuando se ve desde un punto de vista, se transforma en función si se contempla desde otro.

Pero sobre todo, simplemente no tenemos manera de saber, antes de una investigación exhaustiva, en qué nivel de organización uno está autorizado a suponer que el tipo de implantación física puede variar mientras que las capacidades siguen siendo iguales. Esto solo puede decidirse empíricamente. En la posición funcionalista hay una especie de dogma que dice que cualquier función puede implantarse con materiales diversos. Para la autora, es precisamente al revés: sencillamente no sabemos en qué nivel la función deja de ser independiente de sus materiales, puede ser que al llegar a cierto nivel hacia abajo – no sabemos a cuál– no haya opción para escoger materiales, si lo que se quiere implantar es una determinada función.

Un ejemplo tal vez venga al caso: hay ciertas funciones que solo se pueden realizar mecánicamente con materiales rígidos, por ejemplo la función de eje. Si construimos un eje de hule, no podrá cumplir su función (en realidad no podemos construirlo, ya que un eje de hule es una contradicción en términos). Lo mismo vale para un empaque que pretendamos construir de un material rígido, como el metal. Si esto es así en casos tan familiares, ¿qué tendría entonces de extraordinario que ciertas funciones del pensamiento (por ejemplo, las que hasta ahora han resultado muy difícil incorporar a la inteligencia artificial) solo pudieran programarse en materiales orgánicos, pero no en la memoria de una computadora? Son cosas que no se han investigado suficientemente. La autora sostiene que puede ser que cuando lleguemos a saber suficiente sobre las capacidades del cerebro humano, nos encontremos con que los únicos elementos estructurales que pueden producir ese comportamiento tendrán que tener una estructura muy parecida a la estructura de las neuronas.

Por lo demás, la autora encuentra que no todo es discutible en la afirmación de que tiene que haber niveles en la organización:

Una teoría sobre los cambios celulares y sinápticos que ocurren durante el aprendizaje resulta más fina que una teoría sobre cómo aprende una red interactiva, que a su vez será más fina que una teoría sobre cuáles estructuras anatómicas promueven el aprendizaje, que será todavía más fina que una teoría que postule mecanismos de codificación, mecanismos de recuperación, etc. Lo discutible es la afirmación de que el modelo de tres niveles, adecuado a las computadoras de von Neumann sirve también para los cerebros orgánicos.

Su conclusión general es, entonces, "que es supremamente ingenuo asumir que... las neuronas pueden ser pasadas por alto mientras avanzamos en la especificación funcional de la mente-cerebro...".


El programa antirreduccionista

La palabra "reduccionismo" se emplea en filosofía de la ciencia para referirse al intento de demostrar que una ciencia particular puede derivarse deductivamente de otra ciencia más general. En ese sentido, la astronomía de Kepler fue reducida a la física terrestre gracias a la obra de Isaac Newton. En el texto que sigue, al igual que en la selección de Smith, la palabra "reducir" aplicada a una disciplina científica (la psicología, por ejemplo) no significa "hacer de menor tamaño" sino demostrar que sus leyes son casos particulares de una ciencia fundante más amplia (por ejemplo, la neurobiología).

El programa antirreduccionista a que la autora se refiere, consiste en la colección de argumentos de los funcionalistas contrarios a la posibilidad de que sea posible llegar a demostrar que los fenómenos mentales son, en último análisis, fenómenos neurológicos. Para entender las implicaciones de este programa, y de su contrario, que podríamos denominar "el programa reduccionista", es importante detenernos aquí y recordar casos famosos de reducción de una ciencia a otra. Uno de los casos más famosos es el de la astronomía de Kepler y la mecánica de Galileo que quedaron ambas reducidas a la física de Newton. Es un caso bastante dramático, porque se trataba de dos disciplinas referidas a objetos, en cierta forma, opuestos, por lo menos según la tradición medieval; a saber: los cuerpos celestes y los cuerpos terrestres.

Galileo había elaborado su mecánica especialmente con base en experimentos sobre la caída de los cuerpos en un plano inclinado, y su teoría consistía en una serie de hipótesis, bastante precisas, sobre la cinemática NOTA 12 terrestre. No obstante, incluía algunas ideas equivocadas, por ejemplo el principio de inercia, que concebía como la tendencia de los cuerpos a seguir la curvatura de la Tierra NOTA 13. En todo caso, las leyes de Galileo tenían gran contenido matemático y apoyo experimental, y se referían a cuerpos eminentemente terrestres y de pequeñas dimensiones. Por otro lado, el astrónomo Kepler había formulado leyes sobre el movimiento de los astros (concretamente, del sistema solar en la interpretación copernicana, con el Sol en el centro) que explicaban un voluminoso cuerpo de observaciones compiladas por Tycho Brahe. Kepler encontró que todas esas observaciones podían explicarse razonablemente bien si suponíamos que los planetas se movían en órbitas elípticas, que el Sol estaba situado en uno de los focos de la elipse, y que los radios de la elipse barrían áreas iguales en tiempos iguales NOTA 14.

Lo sorprendente de esta historia es que cuando viene Newton y formula sus leyes de movimiento y la ley de la gravitación universal, todo esto –tanto la cinemática de Galileo como la astronomía de Kepler– cae en su lugar como casos particulares de la teoría general. En ambos casos, con ciertas correcciones: como lo mencionamos antes, el concepto de movimiento inercial de Galileo queda enmendado, y la ley de barrido de Kepler representa solamente una aproximación a lo que realmente sucede según la teoría de Newton. Este es el caso más famoso de reducción, el más asombroso por abarcador (puso, por así decirlo, el cielo y la tierra en la misma canasta). Además, es el más antiguo, pues se produjo apenas comenzando a nacer la tradición científica moderna. Pero no es el único. El que cita Patricia Smith es uno que los autores suelen citar, por lo que lo llamaremos canónico: consiste en la reducción de la termodinámica de los gases a la cinemática (teoría del movimiento) del mismo Newton. Repasémoslo un poquito.

Ante todo, y a diferencia del caso explicado antes, aquí la reducción se da con la ayuda de una hipótesis adicional de carácter estadístico. Se trata de una ley de correspondencia para poder deshacerse del término "temperatura", que no es un término de la cinemática pero sí de la termodinámica. Al tratar de exponer el contenido de la termodinámica dentro del contexto cinemático, había que preguntarse sobre ese término extraño, la temperatura: ¿y esto qué es? Bueno, contestaron los autores de este trascendental acto de reducción, pues considerémoslo como el valor promedio del estado de movimiento de las moléculas, la agitación promedio de las moléculas en un gas. En el caso de la astronomía, al realizar la reducción dejamos de hablar de áreas barridas por los radios de la elipse que conectan el planeta y el Sol; paralelamente, en el caso de la termodinámica, dejamos de hablar de temperatura, excepto entendiéndola de nueva manera como término definido, equivalente al valor cinético promedio de un gas. Esto es importante: significa que estamos reformando el lenguaje, hasta el punto de que hacemos desaparecer ciertos términos. Se trata en realidad de algo más: estamos cambiando de ontología; nuestro mundo queda poblado por entes diferentes.

¿Qué es, entonces, lo que tendríamos que reducir ahora para realizar el programa reduccionista con que sueñan unos y que rechazan otros, en el mundo de las ciencias cognoscitivas? Se trata de la psicología, que deberíamos ver reducida a la ciencia más general y fundamental de la neurofisiología. Pero, ¿qué es la psicología actualmente? Pensemos en la ontología de la psicología. ¿Qué términos usa, qué objetos se reconocen como existentes, en psicología? Si hiciéramos una lista larga de términos psicológicos, quizá encontraríamos que con muy pocas excepciones, como "ego", "superego", "libido", o "inconsciente", los términos del lenguaje psicológico han sido extraídos del lenguaje ordinario; son parte del sentido común y corresponden a objetos que normalmente reconocen los seres humanos no especialistas como parte del mobiliario social: "creencia", "deseo", "temor", "conocimiento", "voluntad", "esperanza", etcétera. Son solo una "cientificación" de términos de la psicología popular, de la sabiduría ancestral plasmada en refranes y proverbios, y de la que está llena la charla de las matronas de las sociedades tradicionales o el oído de los confesores o sacerdotes de las distintas grandes religiones.

Si más allá de la ontología nos vamos a la teoría propiamente dicha y hacemos un inventario de las teorías psicológicas más importantes, nos encontramos que –con la posible excepción de la teoría del inconsciente de Freud– todas las demás serían teorías preexistentes en el folclore, por medio de las cuales el pueblo se expresa –a menudo con connotaciones morales– sobre la conducta de las gentes.

A este propósito, cabe mencionar que varios filósofos de la ciencia contemporánea han caricaturizado el proceso de desarrollo de las ciencias sociales, especialmente la sociología y la psicología, como un intento de poner en palabras difíciles lo que todo el mundo siempre ha sabido por tradición. Dentro de ese mismo espíritu, Ernest Nagel (NAGEL 61) insiste en que todas estas disciplinas no llegan a ser todavía científicas y establece como prueba que deben pasar para que se las reconozca, el que su vocabulario –su ontología– se haga distinto del usado por el sentido común. El argumento dado para exigir ese requisito consiste en la evidencia de que, tanto las ciencias físicas como las biológicas han desarrollado una serie de conceptos (cromosoma, gen, electrón, etcétera) que no tienen ningún parangón, ninguna similitud, con los términos del lenguaje ordinario. Entonces, mientras las ciencias sociales no encuentren esos términos, mucho más abstractos que los del lenguaje ordinario, y no acuñen leyes y teorías que usen esos términos, estas disciplinas no podrán considerarse como realmente científicas.

La autora asocia el programa antirreduccionista con los teóricos del funcionalismo. Señala que su tema dominante tiene tres movimientos:

  1. Existen categorías de la psicología popular que son fundamentalmente correctas para caracterizar los estados mentales.

  2. Estas categorías delimitan los estados intensionales y los procesos lógicos y deben continuar figurando de manera esencial, tanto en la investigación como en las teorías que se desarrollen en las ciencias cognoscitivas.

  3. estas categorías, esenciales para el nivel de descripción psicológico, no son reductibles al nivel de descripción neurobiológico; estas categorías definen lo que es intensional, es decir, definen un mundo característico, distinto de otros mundos, y tienen que mantener su existencia autónoma.

Examinemos estos tres puntos. Si entendemos por categorías las formas en que fragmentamos el mundo para conocerlo, resulta que para los funcionalistas la fragmentación del mundo dada por la psicología popular es adecuada. ¿Qué quiere decir que es adecuada? Pylyshyn en particular es muy riguroso al dar un criterio para la adecuación de categorías. Nos dice que si las categorías nos sirven para formular leyes que explican las regularidades que encontramos en la realidad, entonces son adecuadas. Las categorías son adecuadas si salvan una regularidad que existe en la experiencia, si son útiles para expresar regularidades que encontramos en los fenómenos. ¿Cómo podrían resultar inadecuadas? Pueden fallar de dos maneras distintas: si son demasiado fragmentarias, entonces perderemos la visión de conjunto, y dejaremos de poder formular alguna regularidad general importante. Si son demasiado globales, perderemos entonces la visión de detalle, y no podremos expresar regularidades más finas.

Las categorías deben ser ni muy amplias ni muy estrechas pero, en todo caso, deben coincidir con la manera en que la naturaleza se parte a sí misma en clases dentro del campo de estudio de que se trate. Otra manera de decir esto es que esas categorías deben separarse entre sí siguiendo las fisuras de la realidad misma. Si, por ejemplo, en psicología popular hablamos de propósitos, es porque en la realidad existen regularidades que necesitan ese término para poder formularse, y que se perderían si el término no estuviese disponible.

Naturalmente, todo esto es de nuevo el tema de la ontología científica. En psicología hablamos de propósitos, de hábitos, de resentimiento, de depresión, de muchas cosas por el estilo que suponemos existen en la vida intensional, en esa dimensión que define la realidad humana. Para los funcionalistas, contrariamente a los teóricos mencionados antes, estas categorías son fundamentalmente adecuadas, y el alejamiento del sentido común solo lograría, en este campo, la pérdida de la sabiduría psicológica acumulada por innumerables generaciones. Si la adecuación de un sistema de categorías se mide por la conservación de regularidades, no ha de haber una palabra que agrupe cosas que solo por casualidad quedan juntas. La psicología tradicional, según los funcionalistas, fragmenta la realidad en sus junturas naturales, según la experiencia tradicional de la humanidad.

La autora argumenta sobre las ciencias humanas en el sentido de que no tienen por qué ser autónomas, de que son reductibles en principio a otras ciencias que se ocupan de niveles más básicos. Cualquiera que sea la justificación de esta pretensión, parecería, sin embargo, que es legítimo establecer un criterio de adecuación para la reducción de la psicología: cualquiera que sea su futuro como disciplina científica, debería ser posible conservar un nivel de abstracción en que continúen siendo formulables muchas de las leyes de comportamiento identificadas por el folclore psicológico. Sean o no estas leyes reductibles al nivel de abstracción estudiado por la neurología, debería, sin embargo, perdurar el vocabulario en que fueron escritas las obras literarias que profundizaron en el conocimiento del hombre, mucho antes que la ciencia psicológica positiva, como se entiende hoy, hubiera hecho su entrada en la arena intelectual. Hay sin duda un cierto sentido en que lo que los funcionalistas tratan de hacer es claramente encomiable; a saber, tratar de salvar de la embestida de las ciencias empíricas un nivel semántico que nos permita continuar hablando de intensionalidad, de conocimiento, de deseos y temores, todo lo cual se perdería si bajáramos, sin transición adecuada, al nivel ínfimo de los mecanismos, que serían las neuronas en este caso.


El argumento de las ejemplificaciones múltiples

Un argumento que suelen esgrimir los funcionalistas contra la posibilidad de reducir la psicología a la neurología consiste en la imposibilidad de realizar un mapeo de uno a uno entre los términos de la psicología y algunas expresiones de la neurología NOTA 15. Es útil considerar primero una analogía informática. Dos computadoras pueden estar en el mismo estado funcional a pesar de estar en estados estructurales muy diferentes. Las dos pueden estar corriendo el procesador de palabras Smart pero una lo hace en una McIntosh y otra es una PC compatible con IBM; las dos son estructuras (hardware) muy diferentes entre sí desde el punto de vista físico. Veamos ahora una situación equivalente en psicología. Una persona puede decir "voy a cocinar" y se va a trabajar con un horno microondas, mientras que otra dice lo mismo y se va a trabajar en una cocina de leña. Por más diferentes que estas dos cosas sean desde el punto de vista estructural, no hay duda que en realidad las dos hacen lo mismo desde el punto de vista funcional, a saber, cocinar.

Otro ejemplo es el que presenta Pylyshyn: estalla un incendio y varias personas van a pedir ayuda, es decir, salen corriendo con la intención de pedir ayuda. Un análisis psicológico de la intención de estas personas sería coincidente en decir que todas ellas desean (planean, quieren, etcétera) pedir ayuda. Sin embargo, lo que realmente van a hacer, para satisfacer ese deseo o intención, es muy diferente en cada caso, pues el estado psicológico aludido puede materializarse con muy diversos procedimientos: uno se dirige al teléfono, otro se apodera del extinguidor más cercano, otro corre hacia la estación de bomberos a la vuelta de la esquina, etc. Todos, sin embargo, están haciendo lo mismo, es decir, pidiendo ayuda (PYLYSHYN 84). "Pedir ayuda", como será probablemente obvio para el lector, es parte de la ontología de comportamientos posibles de la psicología folclórica o tradicional.

Este argumento contra el programa reduccionista se conoce como el argumento de la ejemplificación múltiple o de la "realizabilidad" múltiple, lo cual quiere decir que los estados intensionales se pueden realizar de muy distintas maneras. Los estados funcionales son ejemplificables de manera múltiple y el rango de estas implantaciones físicas puede ser tan diverso, que no hay manera posible de forzarlos a acomodarse en una "clase natural". Por ejemplo, en el mismo caso de un incendio, una persona desesperada que grita "¡fuego!", y otra, reposada y más inteligente, que procede pausadamente a llamar a los bomberos, no pueden concebirse como ejemplos de una misma descripción neurológica. Entonces, ¿qué pasaría si quisiéramos reducir un lenguaje intensional con la expresión "pedir ayuda"? ¿A cuál de las diversas formas de actuar vamos a traducir esta expresión? El problema aquí es mucho más complicado que cómo lo hemos presentado, porque en el nivel básico debe haber –por dar alguna cifra– algo así como quinientas maneras distintas de pedir ayuda.

Smith argumenta que este razonamiento antirreduccionista es un ejemplo de una mala interpretación en que frecuentemente incurren los filósofos funcionalistas en relación con lo que implica reducir una teoría a otra. El funcionalista parece suponer que la reducción interteórica no puede realizarse a menos que las propiedades de la teoría reducida tengan una única realización a nivel de la teoría reductora. Sin embargo, en el ejemplo canónico de reducción que hemos comentado –la reducción de la termodinámica a la cinemática–, "temperatura de un gas" es un predicado de la termodinámica y conforme esta ciencia y la teoría molecular evolucionaron juntas, la temperatura de un gas pasó a ser entendida como la energía cinética media de las moléculas del respectivo volumen gaseoso. Ahora bien, dos volúmenes de un gas pueden tener la misma temperatura pero las distribuciones de la energía cinética –velocidad– de sus correspondientes moléculas ser muy diferentes. Ello por la sencilla razón de que una energía media se calcula como el promedio de las energías de cada una de las moléculas consideradas, y se puede tener el mismo promedio con muy distintos conjuntos de números.

Este argumento es contundente así como viene. Sin embargo, no parece ser suficientemente general para dar cuenta de todos los casos que pueden interesarnos, ya que depende esencialmente de que en este caso el término "temperatura" se reduce por medio de una premisa estadística que incluye la idea de promedio. No queda claro, sin embargo, que un mapeo semejante de uno a muchos deba siempre producirse, aun en casos donde no trabajemos con promedios u otras intermediaciones reductoras de tipo estadístico.

Pero incluso aceptando el argumento de las ejemplificaciones múltiples, que "cocinar" es siempre cocinar, sea que cocinemos en cocina de leña o en horno de microondas, la posibilidad de reducir la psicología a una ciencia más básica, sin que por ello se pierda la posibilidad de distinguir entre las categorías superiores, es completamente aceptable. Puede llegarse a determinar que es necesario para que uno esté haciendo una u otra de esas cosas (cocinar o pedir ayuda, por ejemplo) que un cierto conjunto de neuronas en alguna parte de la jerarquía del sistema nervioso, se encuentre en una determinada configuración. O que es necesario que se dé la misma configuración de estados neuronales en un área determinada del cerebro. Solo la investigación empírica podrá llegar a aclarar estas cosas. Puede ser que todo esto llegue a establecerse por investigación empírica, lo cual, sin embargo, no impedirá que sigamos considerando a todos los casos de cocinar o de pedir ayuda como estados psicológicos únicos, precisamente en virtud de esa organización neuronal común.


La coevolución de las disciplinas científicas

Un punto fuerte de la crítica de la autora al argumento antirreduccionista consiste en que el precio de reclamar autonomía para una teoría inmadura, es blindarla contra fuerzas de revisión esenciales para que pueda llegar a la madurez. Según Pylyshyn, debe aplicarse una ley de división del trabajo entre los psicólogos y los neurólogos. A los primeros corresponde descubrir la teoría cognoscitiva y a los segundos determinar los diseños físicos subyacentes que ejemplifican el "programa" cognoscitivo. Smith discrepa de esta posición con mucha vehemencia porque piensa que el argumento antirreduccionista y la correspondiente ideología de la investigación son no solo teóricamente injustificables sino también pragmáticamente imprudentes. En su lugar propone una actitud de mutua colaboración entre las dos ciencias, a fin de asegurar que las dos coevolucionen hacia un estado superior de comprensión de los fenómenos correspondientes.


Computación, representación y razonamiento

La hipótesis empírica central del funcionalismo es que la cognición es una especie de computación. Hemos visto desarrollada esta posición, por ejemplo, en el texto de Newell y Simon. Pylyshyn la expresa directamente, incluso en el título del libro citado. Esta tesis implica que la cognición es, fundamentalmente, manipulación de símbolos y que las relaciones importantes en el proceso de información cognoscitiva son las relaciones lógicas de los símbolos. La mente se entiende, en su esencia, una máquina serial gobernada por las leyes de la lógica, las cuales operan en representaciones proposicionales. La autora rechaza contundentemente esta posición: "Dudo enfáticamente que la cognición en general sea nada parecido a razonar y que los símbolos proposicionales sean en general el modo de representación".

El término "representación" viene fundamentalmente de representación teatral, en que se remeda una situación real por medio de una situación fingida. "Representación", tal y como lo entendemos hoy en día en ciencia cognoscitiva, es un concepto que arranca con Locke y Hume. Son ellos quienes empiezan a hablar de las ideas como término medio entre el sujeto y el mundo externo. Esto es una novedad en la teoría del conocimiento, porque para el pensamiento medieval conocer era una suerte de asimilación: conocer un caballo, por ejemplo, era acaballarse un poco, como conocer a Dios –en la medida en que ello se consideraba posible– era divinizarse hasta cierto punto. Esto tiene desde luego raíces muy primitivas. La teoría del conocimiento antiguo era directa, un acto de comercio entre el sujeto y el objeto, sin intermediaciones, una especie de acto digestivo. Lo cual no deja de ser sorprendente, por coincidental, ya que la biología nos enseña actualmente que el sistema nervioso está ligado en su evolución al sistema digestivo. Filogenéticamente es así: el sistema nervioso surge alrededor de la abertura por la cual entra la comida. En un sentido general, entonces, el conocimiento comienza por el sentido del gusto. En el principio del conocimiento no hay ideas, no hay intermediación, sino contacto físico. No deja de ser notable que la teoría del conocimiento haya sufrido una evolución parecida a la del sistema que sirve de base al conocimiento.


Ejercicios de aprendizaje

1) Haga un extracto de las principales ideas discutidas en el texto a que se refiere el comentario precedente.

2) Ofrezca tres ejemplos de funciones que no son independientes de los materiales usados para encarnarlas, distintos del que aparece en el texto.

3) Escriba tres refranes que usted conozca que representen conocimientos psicológicos populares. Trate de formular, con alguna apariencia de carácter científico, el conocimiento encerrado en ellos.


Respuesta a los ejercicios de aprendizaje

1) Si su resumen incluye las siguientes ideas puede considerarlo correcto.

2) Una "suiza" (para saltar los niños) no puede ser de metal; ni las monedas de aceite; ni los alambres eléctricos de madera.

3) Por ejemplo:

"Perro que come huevos, ni aunque le quemen el hocico": Existe una tendencia muy fuerte a repetir un comportamiento gratificante, a pesar de la actitud adversa del conglomerado social con respecto a dicho comportamiento.

"Del agua mansa me libre Dios, que de la brava me libro yo": Una situación que implica peligro para el sujeto es más fácilmente perceptible por este si su grado de agresividad es elevado que si no lo es.

"Genio y figura hasta la sepultura": La fuerza de los hábitos, especialmente si están internalizados en el carácter, es muy grande, lo que los hace muy difíciles de modificar.


Ejercicio de lectura

Recomendamos leer el artículo sobre modelos de la cognición (RUMELHART 86b), o en su defecto la selección traducida al español en el capítulo cuarto de nuestra Antología.


Comentario

Rumelhart y su grupo de investigadores tratan de aclarar en su artículo la cognición sobre la premisa de que se basa fundamentalmente en procesos paralelos distribuidos en todo el sistema nervioso. No son ellos investigadores del cerebro, sino más bien informáticos de un nuevo cuño, que tratan de simular los fenómenos cognoscitivos por medio de computadoras (tradicionales o especialmente diseñadas). La disciplina que ellos cultivan, identificada como "redes neuronales" o "conexionismo" consiste en la construcción y uso de configuraciones informáticas inspiradas en la idea de un gran número de neuronas conectadas extensamente por medio de sinapsis. Oponen a la computación tradicional, que es de naturaleza básicamente secuencial, una computación en paralelo, en que muchos procesos ocurren simultáneamente. Además, esos procesos están distribuidos en varias partes de la red, en vez de concentrados en un solo mecanismo central como el centro lógico de las computadoras von Neumann.

Una de las características más importantes de los sistemas conexionistas es que no son programables en el mismo sentido en que lo son las computadoras clásicas, a saber, mediante el almacenamiento en la memoria del texto de un algoritmo cuyos pasos debe la máquina seguir sucesivamente. En cambio, una red neuronal se adiestra por medio de pruebas con casos especialmente seleccionados. Por ejemplo, se le muestra la figura de la letra "A", con el propósito de que más tarde sea capaz de reconocerla. La red neuronal aprende más que es programada. Tal aprendizaje lo realiza modificando ella misma los valores de las conexiones (sinapsis) entre sus distintas celdas (de donde surge el calificativo de "conexionismo" para esta metodología de investigación).

El artículo que comentamos presenta los aspectos más fundamentales de este enfoque, muy diferente –como el lector podrá apreciarlo– al enfoque simbolista o funcionalista. Nos relata algunos incidentes históricos importantes, como la crítica de Minsky y Papert a los primeros modelos conexionistas y la superación de esas críticas por desarrollos contemporáneos. Finalmente, trata de rebatir los principales argumentos esgrimidos por los funcionalistas contra esta metodología.


La historia del perceptrón

La historia del conexionismo comienza al final de la década de los cincuenta y al inicio de la década de los sesenta, cuando se produjo un gran interés investigativo en el desarrollo de redes autoorganizantes y otros artificios inspirados en el funcionamiento de las neuronas. El más conocido fue el perceptrón de Frank Rosenblatt. Consistían en un arreglo de entradas binarias, la retina, ordenadas en un espacio bidimensional; un conjunto de unidades binarias, predicados, con conexiones fijas a un subconjunto de las unidades de la retina, tales que cada predicado computaba alguna función local sobre el subconjunto de unidades al cual estaba conectado; y una o más unidades de decisión, con conexiones modificables a los predicados. Rosenblatt esperaba que el perceptrón pudiera servir tanto de base para la inteligencia artificial como para el modelado del cerebro. Minsky y Papert, que favorecían el enfoque de procesamiento serial de símbolos, hicieron entonces un análisis matemático muy cuidadoso de este mecanismo, y llegaron a la conclusión de que tenía limitaciones muy críticas para lograr las pretensiones de su autor (MINSKY 69). Demostraron, en particular, que el perceptrón es incapaz de calcular con simplicidad funciones matemáticas bastante sencillas, como la que determina si un número par o impar de puntos están en la retina, o la que determina si todos los puntos encendidos están conectados a todos los otros puntos encendidos, bien directamente o por medio de otros puntos encendidos.

El análisis de Minsky y Papert se refiere únicamente al perceptrón de un estrato, no al que tuviera unidades ocultas entre las entradas y las salidas. La razón para limitar su estudio a este mecanismo especialmente simple fue la existencia de un poderoso procedimiento de aprendizaje para el perceptrón de un solo estrato, el procedimiento de convergencia de Rosenblatt. En el tiempo de Minsky y Papert no había tal procedimiento poderoso para los sistemas más complejos de múltiples estratos. Esta crítica contundente de dos de los fundadores de la disciplina de la inteligencia artificial, así como algunos éxitos tempranos del enfoque simbólico, fueron suficientes para sugerir a la comunidad científica que no había futuro para esta clase de artificio en inteligencia artificial y psicología cognoscitiva.

Como muy bien lo hacen notar los autores del texto que comentamos, aunque Minsky y Papert estaban en lo correcto en sus análisis, sus conclusiones se aplicaban solamente a los perceptrones más simples y no a otros tipos más complejos que aparecieron bastante más tarde. En particular (como Minsky y Papert lo han reconocido) es posible mostrar que un perceptrón de estratos múltiples (es decir, que incluya varias capas de predicados entre la retina y la salida) puede computar las funciones señaladas antes, usando un número razonablemente pequeño de unidades. Por otra parte, existe ya hoy una generalización directa del procedimiento de aprendizaje del perceptrón aplicable a redes con estratos múltiples y retroalimentación entre estratos. Esto ha hecho posible un renovado interés en la investigación de las llamadas redes neuronales, que cuentan hoy con un grupo creciente de entusiastas entre los practicantes de las disciplinas gemelas de la inteligencia artificial y la ciencia cognoscitiva.


Las objeciones contra el conexionismo

Los autores tratan de contestar a la crítica más común contra los modelos de actividades cognoscitivas basados en procesos paralelos y distribuidos (PPD), a saber: la frecuente sugerencia de que estos mecanismos carecen de la capacidad de realizar computaciones recursivas y que, en consecuencia, no pueden procesar frases y otras estructuras definidas recursivamente. Consideran estas sugerencias como simplemente incorrectas, y afirman que es posible construir una máquina computacional arbitraria a partir de unidades con umbrales, incluyendo por ejemplo una máquina Turing (con la limitación, por supuesto, que se aplica también a los sistemas biológicos, de que los sistemas reales no pueden propiamente ser máquinas Turing porque poseen un hardware finito). A pesar de esta posibilidad en principio de imitar máquinas recursivas, los practicantes del conexionismo no las imitan en la práctica, porque no están de acuerdo "con quienes arguyen que tales capacidades son de la esencia de la computación humana". Como cualquiera que ha intentado procesar frases como "el hombre que el niño que la muchacha golpeó besó se movió" NOTA 16 puede atestiguar, nuestra habilidad para procesar estructuras anidadas no puede compararse con la de un analizador formal o mecánico. No obstante, "la habilidad humana para usar información contextual semántica y pragmática que facilita la comprensión excede enormemente la de cualquier máquina procesadora de frases que conozcamos". Lo que se necesita, según los autores, no es un mecanismo para procesamiento de construcciones anidadas. Los compiladores de los lenguajes de computación que proveen tales capacidades carecen, sin embargo, de suficiencia para procesar el lenguaje natural. Lo que se necesita, en cambio, es un analizador capaz de dar consideración simultánea a un gran número de constreñimientos mutuos e interdependientes.

Por otra parte, los críticos funcionalistas han alegado que los modelos conexionistas se dirigen a un nivel de descripción fundamentalmente diferente que los modelos psicológicos. A esta objeción los autores contestan que sus modelos deben considerarse más bien competidores de otros modelos en el nivel de los algoritmos (para usar la clasificación de niveles de Marr), como medios de explicar la misma clase de datos psicológicos. Los autores proceden a hacer un análisis muy interesante sobre la cuestión de los niveles de abstracción en las ciencias cognoscitivas. Aceptan sin discusión que a distintos niveles corresponden distintos conceptos y que cada nivel tiene conceptos propios que solamente emergen cuando se asciende a ese nivel. Más aún, la misma cognición puede entenderse como un tal concepto que emergería en el nivel más elevado posible. Pero para ellos la verdadera cuestión es entender la cognición, o en realidad, cualquier otro de los conceptos emergentes NOTA 17 . Y para comprender debemos descender a los niveles inferiores; en el fondo, no hay ninguna otra manera de comprender, excepto por referencia a componentes o partes de la cosa que tratamos de comprender. Esto es lo que llamamos precisamente analizar una cosa o situación. Así pues, el conexionismo trata de entender la cognición como una propiedad emergente de las interacciones de unidades conectadas entre sí en forma de red. Los autores nos ofrecen muchos ejemplos de esta forma de comprensión:

No podemos conocer sobre diamantes por el estudio de átomos aislados; no podemos entender la naturaleza de sistemas sociales por el estudio de individuos aislados; y no podemos entender el comportamiento de redes de neuronas por el estudio de neuronas aisladas. Aspectos como la dureza del diamante se entienden por la interacción de los átomos de carbono y la manera en que están alineados. El todo es diferente de la suma de las partes.

Ejercicios de aprendizaje

1) Haga un extracto de las principales ideas discutidas en el texto a que se refiere el comentario precedente.

2) Construya un árbol sintáctico, o alguna otra forma de representación similar, que clarifique el sentido de la proposición siguiente: "el hombre que el niño que la muchacha golpeó besó se movió".

Respuesta a los ejercicios de aprendizaje

1) Si su resumen incluye las siguientes ideas puede considerarlo correcto.

2) [la muchacha golpeó a [el niño –el cual– besó a [el hombre –el cual– se movió]]].


Ejercicio de lectura

Recomendamos leer el artículo de Fodor y Pylyshyn en que se crítica al conexionismo (FODOR 88) o en su defecto, la selección traducida al español que aparece en el capítulo cuarto de nuestra Antología,.


Comentario

El artículo de Fodor y Pylyshyn es una embestida frontal contra las pretensiones del conexionismo. Estos autores hacen radicar la diferencia fundamental entre el enfoque simbólico y el conexionista en la presencia o ausencia, respectivamente, de contenido semántico en los componentes NOTA 18 de los respectivos tipos de sistemas. Como una consecuencia de esta diferencia se sigue que las expresiones de los sistemas simbólicos son generativas; es decir, pueden producir innumerables formas con base en la aplicación de sus reglas, con vocabulario y alfabeto limitados. Esto las hace tener una gran fuerza expresiva, precisamente la que asociamos con el lenguaje. En contraste, los sistemas conexionistas tienen valor semántico solo en su nivel más alto, y carecen en consecuencia, de poder generativo. Esto los hace ser útiles solamente en tareas muy específicas, como el reconocimiento de imágenes, pero totalmente inadecuados para representar fenómenos tan complejos como el lenguaje. En particular, los sistemas conexionistas son incapaces de procesos recursivos (en que un procedimiento se llama repetidamente a sí mismo, por ejemplo), para los que los sistemas simbólicos, en cambio, son eminentemente idóneos.

Los autores caracterizan a los sistemas conexionistas como redes de gran número de unidades simples sumamente conectadas entre sí. Cada unidad recibe por sus líneas de entrada una activación con valores que son números reales, activación que puede ser excitatoria, inhibitoria, o una combinación de ambas NOTA 19. Estas unidades suman algebraicamente esta activación y cambian su estado interno como una función (usualmente tipo umbral NOTA 20 ) de esa suma. Cada conexión puede modular la activación que trasmite como una función de una propiedad intrínseca (pero modificable por acción de la misma red) llamada "peso". La activación en una línea de entrada es típicamente una cierta función no lineal del estado de activación de sus fuentes. "El comportamiento de la red como un todo es una función del estado inicial de activación de las unidades y de los pesos de sus conexiones, los cuales sirven como de una especie de memoria". Concluyen que el estudio de los sistemas conexionistas ha llevada a notables y no anticipados hallazgos, como que es posible realizar una gran cantidad de computación con una red uniforme de elementos simples interconectados. Igualmente reconocen que estos modelos tienen una plausibilidad neuronal de la que carecen las arquitecturas clásicas.

Enseguida, los autores proceden a hacer una aclaración conceptual sumamente importante para situar adecuadamente el desacuerdo entre informáticos conexionistas y simbolistas. Se refiere a la cuestión de la representación, con la que hemos ya tropezado repetidamente en esta obra. Nos advierten que existen dos tradiciones opuestas en la teorización moderna sobre la mente, la representacionalista y la eliminacionista. El segundo calificativo no parece muy feliz, por razones que veremos de inmediato. Los representacionistas mantienen que la vida mental se basa en estados representacionales (también llamados intensionales o semánticos) que codifican estados del mundo. Los eliminacionistas, por su parte, piensan que las teorías psicológicas pueden prescindir de nociones semánticas y conformarse con un vocabulario neurológico o conductista o sintáctico; "en todo caso, no un vocabulario que caracterice los estados mentales en términos de lo que representan". No se trata tanto pues de "eliminar" algo que se dé en la teoría, sino de no aceptarlo del todo en ella como una cuestión de postulación ontológica NOTA 21. Ahora bien, en esta polémica, nos instruyen los autores, los conexionistas están definitivamente del lado de los representacionistas, y en consecuencia están conformes con las posiciones de los investigadores simbolistas o funcionalistas (como Dennett, Pylyshyn, Newell, etc.). En efecto, tanto los simbolistas como los conexionistas asignan contenido semántico a algo, a saber: los conexionistas, a los nodos o unidades o agregados de unidades de sus redes; en tanto que los simbolistas se lo asignan a las expresiones simbólicas. En lo que las teorías simbolistas no están de acuerdo con las teorías conexionistas es en el tipo de relaciones primitivas que existen entre las entidades que soportan estos contenidos.

El desacuerdo, entonces, no se refiere al tema de la representación sino más bien a la concepción de la arquitectura NOTA 22. Los autores concretan este desacuerdo arquitectural en las siguientes tesis básicas:

Los autores toman (1) y (2) literalmente como las tesis que definen el enfoque simbólico. Tal enfoque supone que las estructuras simbólicas se encuentran en correspondencia con una estructura física del cerebro, y su estructura combinatoria tiene alguna contrapartida en relaciones estructurales entre propiedades físicas del cerebro. De ahí que sistemas computacionales como el cerebro y las computadoras clásicas se hayan calificado como sistemas de símbolos físicos. La teoría clásica (el funcionalismo) está comprometida no solamente con que haya un sistema de símbolos realizados físicamente, sino también con la tesis de que las propiedades físicas sobre las cuales la estructura de los símbolos se puede mapear "son las propiedades mismas que causan que el sistema se comporte como lo hace". En cambio, la arquitectura clásica es neutral sobre la cuestión de si las operaciones sobre los símbolos deben ocurrir secuencialmente en el tiempo o están constreñidas para ocurrir en paralelo.

En resumen: las teorías simbólica y conexionista no se oponen en cuanto al tema del carácter representativo de la cognición; ambas aceptan ese carácter. Tampoco se oponen en cuanto al carácter serial o paralelo de los procesos; los conexionistas favorecen el paralelismo y los simbolistas son básicamente neutrales sobre esta materia NOTA 23. "Para la primera, pero no para la segunda, las representaciones mentales exhiben característicamente una estructura constitutiva combinatoria y una semántica combinatoria". Concomitantemente, las teorías simbólica y conexionista discrepan sobre la naturaleza de los procesos mentales: "para la primera, pero no para la segunda, los procesos mentales son característicamente sensibles a la estructura combinatoria de las representaciones sobre las cuales operan".

Los autores se concentran luego en el asunto de la composicionalidad de los elementos básicos de la teoría cognoscitiva. Recalcan que, en los sistemas clásicos o simbólicos, la existencia de una estructura interna en las representaciones dota a éstas de capacidades esencialmente ilimitadas. "En particular, existen indefinidamente muchas proposiciones que el sistema puede codificar. Sin embargo, este ilimitado poder expresivo debe ser alcanzado por medios finitos. La manera de hacer esto es tratar el sistema de representaciones como expresiones que pertenecen a un conjunto generado". Podemos definir, de manera intuitiva, un conjunto generado como una colección de ítemes que se establece no por enumeración, sino por medio de una regla cuya aplicación puede generar miembros del conjunto, uno por uno, tantas veces como se quiera. Con base en esos poderes generadores, "la correspondencia entre una representación y la proposición que expresa se construye recursivamente con base en correspondencias entre partes de la expresión y partes de la proposición. Pero, desde luego, esta estrategia solo puede operar cuando un ilimitado número de expresiones son no atómicas. Por ello las representaciones lingüísticas (y mentales) deben constituir sistemas de símbolos". La conclusión inevitable es que, dada la existencia de los lenguajes naturales, incluido un hipotético "lenguaje del pensamiento", y sus características más sobresalientes (su infinitud potencialmente generable y la limitación de sus medios), "la mente no puede ser un sistema conexionista".

Los autores hacen referencia al trabajo de Chomsky (CHOMSKY 68), quien ha establecido convincentemente que el conocimiento que subyace en la competencia lingüística es generativo –es decir, permite en principio generar (o entender) un número ilimitado de oraciones, de la misma manera que nuestro conocimiento aritmético apoya la producción de un número ilimitado de sumas o restas–. Las teorías simbólicas pueden acomodar estos requisitos porque suponen arquitecturas en las cuales existe una distinción funcional entre memoria y programa, ya que son congruentes con la definición de una máquina Turing, y esto permite agregar más memoria conforme la generación de oraciones lo requiera, sin tener que afectar el programa. En cambio, en un autómata de estado finito o una máquina conexionista, agregar memoria (por ejemplo, añadiendo unidades