Condicionamiento de Thorndike

Webscolar

hace 4 años

El psicólogo Edward Thorndike (1874-1949) fue uno de los pioneros en el estudio del condicionamiento instrumental. Para ello, ideó sus denominadas “cajas de solución de problemas”, que eran jaulas de las que los gatos (que eran los animales con los que trabajaba) podían escapar mediante acciones simples como manipular un cordón, presionar una palanca o pisar una plataforma.

Como incentivo para resolver el problema, el gato podía ver y oler que fuera de la caja había comida, pero no podía alcanzarla. Al principio, el gato comenzaba a hacer movimientos azarosos, hasta que casualmente resolvía el problema, por ejemplo tirando de la polea que abría la jaula. Sin embargo, cada vez que Thorndike metía al gato en la jaula, tardaba menos en salir. Esto se debía a que se estaba produciendo un condicionamiento operante: la conducta de tirar de la polea estaba siendo reforzada por su consecuencia (la apertura de la caja y la obtención de la comida). Esta conducta, al ser reforzada, se convertía en la conducta más probable en un futuro cuando las circunstancias eran similares.

A partir de estos experimentos, Thorndike estableció un principio que denominó Ley del efecto: «Cualquier conducta que en una situación produce un efecto satisfactorio, se hará más probable en el futuro». Si la respuesta va seguida de una consecuencia satisfactoria, la asociación entre el estímulo y la respuesta se fortalece; si a la respuesta le sigue una consecuencia desagradable, la asociación se debilita. En otras palabras, Thordike defendía que todos los animales, incluyendo al ser humano, resuelven los problemas mediante el aprendizaje por ensayo y error.

En 1898, Thorndike estableció las bases de un principio simple pero importante, que se llamó ley del efecto, la cual afirma que cuando una respuesta es reforzada se hace más fuerte en el sentido que tenderá a repetirse en el futuro. La ley del efecto fue la piedra angular del condicionamiento operante (Tarpy, 1989). Thorndike llegó a esta conclusión tras una serie de experimentos con gatos, perros y gallinas que encerraba repetidamente en cajas experimentales (llamadas cajas problema).

En uno de sus principales experimentos, Thorndike colocó a unos gatos hambrientos en una caja problema (Figura 1), cuya puerta se abría cuando se golpeaba un pestillo situado dentro de la jaula, permitiendo así al gato acceder a la comida que se encontraba en el exterior junto a la caja. Cuando Thorndike introdujo por primera vez a los gatos en la jaula, estos se agitaban desordenadamente de un lado para otro, como buscando la forma de escapar. Sin embargo, después de cierto tiempo los gatos golpeaban inevitablemente el pestillo permitiéndoles comer tras abandonar la jaula. A medida que se repetía esta situación, la conducta de los gatos fue haciéndose más eficaz, necesitando cada vez menos tiempo para golpear el pestillo en los siguientes ensayos. Había aparecido un aprendizaje, los gatos habían adquirido una nueva conducta ante cierta situación, fruto de la experiencia. A este tipo de aprendizaje se le denominó instrumental u operante, porque la conducta del animal era instrumental para obtener la consecuencia deseada (en este caso la comida) (Tarpy, 1989).

En el condicionamiento operante, igual que en el clásico, el estímulo utilizado, para producir aprendizaje, puede ser positivo o aversivo. Un ejemplo de condicionamiento instrumental aversivo consiste en administrar al animal, a través de una rejilla situada en el suelo de la jaula, una descarga eléctrica que el animal puede interrumpir apretando una pequeña palanca que sobresale de una de las paredes de la jaula. Al principio, el animal salta violentamente intentando escapar de la descarga y, como en el experimento de Thorndike, en algún momento golpea la palanca (que interrumpe la descarga). Tras un corto período de tiempo, el proceso vuelve a repetirse y se observa que a medida que avanza el entrenamiento el animal aprende a interrumpir la descarga inmediatamente después de su presentación. La respuesta, al igual que en el caso anterior, es instrumental para escapar de la descarga dolorosa.

Existen cuatro procedimientos o tipos de condicionamiento instrumental:

Refuerzo positivo o condicionamiento de recompensa: Un refuerzo positivo es un objeto, evento o conducta cuya presencia incrementa la frecuencia de la respuesta por parte del sujeto. Se trata del mecanismo más efectivo para hacer que tanto animales como humanos aprendan. Se denomina “refuerzo” porque aumenta la frecuencia de la conducta, y “positivo” porque el refuerzo está presente. Refuerzos positivos típicos son las alabanzas, los regalos o las aportaciones monetarias.
Refuerzo negativo: Un refuerzo negativo es un objeto, evento o conducta cuya retirada incrementa la frecuencia de la respuesta por parte del sujeto. Al igual que el anterior, se denomina “refuerzo” porque aumenta la frecuencia de la conducta, pero “negativo” porque la respuesta se incrementa cuando el refuerzo desaparece o se elimina. En el refuerzo negativo se pueden distinguir dos procedimientos:
- Condicionamiento de escape: En este caso, la frecuencia de una respuesta aumenta porque interrumpe un estímulo aversivo, es decir, un suceso que está ocurriendo y que el sujeto considera desagradable.
- Condicionamiento de evitación: En este caso, la frecuencia de una respuesta aumenta porque pospone o evita un estímulo aversivo futuro.
Entrenamiento de omisión: Se produce cuando la respuesta operante impide la presentación de un refuerzo positivo o de un hecho agradable; es decir, consiste en retirar el estímulo positivo de una conducta para así provocar la extinción de la respuesta. Un ejemplo importante es el de “tiempo fuera”, en el que se retira la atención de un niño aislándolo durante un cierto período de tiempo.
Castigo: El castigo provoca la disminución de una conducta porque el suceso que la sigue es un estímulo aversivo. Un ejemplo típico es castigar a una rata con una pequeña corriente eléctrica cuando pulsa una palanca. Aunque el castigo puede ser en ocasiones muy eficaz para hacer que desaparezca una conducta, se recomienda utilizarlo lo menos posible, ya que tiene muchos efectos adversos o no deseados. En muchas ocasiones la conducta solo desaparece temporalmente o únicamente en los contextos en los que es probable el castigo.

Fases del condicionamiento operante

Adquisición: La adquisición de la respuesta se refiere a la fase del aprendizaje en que la respuesta es seguida por reforzadores. Durante la adquisición la respuesta se vuelve más fuerte o más frecuente, debido a su relación con la consecuencia reforzante.
Generalización: Las respuestas fortalecidas mediante procedimientos operantes en un conjunto de circunstancias tienden a extenderse o a generalizarse en situaciones similares, al igual que ocurre en el condicionamiento clásico. Cuando más parecidos sean los contextos, más probable es la generalización.
Discriminación: Los individuos desarrollan también discriminaciones al reforzarse las respuestas en una situación, pero no en otra.
Extinción: Cuando se retira el reforzamiento para alguna respuesta particular, dicha conducta disminuye su frecuencia gradualmente hasta que solo ocurre con la misma frecuencia con que ocurría antes del reforzamiento. Sin embargo, es importante advertir que en muchas ocasiones, después de que se retiren los reforzadores, se advierte inicialmente un aumento de la cantidad de respuesta y de la frustración antes de que empiece la disminución.
Recuperación espontánea: Al igual que en el condicionamiento clásico, las respuestas que se han extinguido vuelven a aparecer algunas veces, es decir, se da una recuperación espontánea después de un descanso

Para desarrollar sus investigaciones se apoyó en el estudio de animales, en concreto gatos, y la utilización de herramientas como la “caja rompecabezas” o “caja-problema”, en la que el animal debía accionar un mecanismo para poder salir de ella. El resultado de sus estudios fue la elaboración de la teoría del aprendizaje por ensayo y error. Según él, el proceso de aprendizaje se puede reducir a varias leyes: la ley de la disposición, que establece la preparación de las conducciones neurológicas en la conexión estímulo-respuesta; la ley del ejercicio, o del uso y desuso, en la que la conexión estímulo-respuesta se refuerza con la práctica o a la inversa; y la ley del efecto, la más importante de ellas, que describe cómo en el proceso de ensayo y error, si se produce una respuesta seguida por una satisfacción, la conexión se hace más fuerte y conduce a su aprendizaje, y al contrario, si hay un displacer o refuerzo negativo, la conexión estímulo-respuesta se debilita y acaba desapareciendo.

En relación con estas leyes, introdujo los conceptos de la motivación, como refuerzo positivo a la respuesta correcta, y la transferencia (junto a Robert S. Woodworth), o introducción de elementos similares a los ya resueltos en los nuevos ejercicios para facilitar la tarea de aprendizaje; estas nociones resultaron fundamentales en el desarrollo de la Psicopedagogía y están en la base de las técnicas usadas por dicha disciplina.

Asimismo, investigó sobre las diferencias individuales e ideó diferentes tipos de tests para medir la capacidad intelectual y las aptitudes.

Fue autor de numerosas obras, entre las que destacan:

Educational psychology (1903),
The theory of mental and social measurements (1904),
Principles of teaching based on Psychology (1905),
Animal intelligence (1911),
Education: a first book (1912),
The psychology of learning (1914),
The measurement of intelligence (1926) y
Human nature and the social order (1940).

La investigación sobre el condicionamiento operante ha dado lugar a una tecnología muy minuciosa para la enseñanza, denominada modificación de conducta. En el condicionamiento instrumental hay cuatro principios básicos: premio, castigo, huída y omisión.

Citar este texto en formato APA: _______. (2020). WEBSCOLAR. Condicionamiento de Thorndike. https://www.webscolar.com/condicionamiento-de-thorndike. Fecha de consulta: 5 de abril de 2025.