¿Se pueden cometer errores con el clicker?

«Lo que no se debe emparejar: consecuencias de mezclar consecuencias» es un interesante artículo que saca a la luz uno de los problemas que se dan en el trabajo con perros utilizando sistemas como el clicker. Todavía hay muchos guías y entrenadores que creen que utilizar el clicker no conlleva riesgos cuando lo cierto es que se pueden cometer errores con el clicker. Y gordos. 

errores con el clicker

Lo que no se debe emparejar: consecuencias de mezclar consecuencias

Desde 2003 he tenido el privilegio de formar parte de los ponentes en las conferencias de la asombrosa ClickerExpo de Karen Pryor.  Hasta el momento hemos celebrado 26 de estos eventos, en los cuales varios cientos de personas y sus perros se reúnen durante tres días de conferencias y talleres sobre todos los aspectos del adiestramiento con el clicker.  Incluye una mesa redonda de una hora en la que seis miembros del equipo docente se sientan en el escenario para ir respondiendo las preguntas del público.

En una ocasión, surgió una pregunta interesante: “¿hay algún error que se pueda cometer al entrenar y que luego no se pueda corregir?”  O lo que es lo mismo, en adiestramiento con clicker, ¿hay alguna manera que, sin querer, se pueda causar un daño permanente a la capacidad de aprendizaje de tu animal en el futuro?

Escuela de Guías Caninos

Al principio nos dimos cuenta de que el uso prolongado de castigos puede, por descontado, crear miedos duraderos y discapacidades en el aprendizaje.  Tras esa cláusula de descargo de responsabilidad, mis colegas, en su mayoría, dijeron que entrenar con el clicker es muy indulgente y que puedes salir prácticamente de cualquier problema con hacer “click”.

Pero yo no estaba de acuerdo. Hay un error de entrenamiento del que me estoy concienciando cada vez más y que creo que puede perjudicar significativamente la capacidad del animal para aprender y para confiar en su entrenador. Este error ocurre cuando cambias el significado emocional de castigos o reforzadores. A menudo, los entrenadores hacen esto sin darse de cuenta de lo que está ocurriendo.  El condicionamiento clásico es el proceso de aprendizaje responsable de este cambio en el valor afectivo de un castigador o un reforzador.

PerrosdeBusqueda en Youtube

Recordando a Pavlov

El condicionamiento clásico es un proceso por el cual los animales aprenden asociaciones predictivas entre estímulos ambientales. Todos  recordamos a Ivan Pavlov, hace 100 años en Rusia, enseñando a los perros a salivar en respuesta al sonido de una campana. Hizo esto a través de pruebas repetitivas, vinculando el sonido de la campana y  que el perro comiera.

Para que “funcionara” el condicionamiento clásico, el sonido de la campana (estímulo condicionado o EC) tenía que preceder a la alimentación del perro (estímulo incondicionado o EI). En otras palabras, estos dos estímulos tenían que ocurrir en secuencia: EC seguido de EI. De lo contrario, el EC no adquiriría ningún significado predictivo (o anticipatorio) para el animal. Por tanto, para que se produzca un condicionamiento clásico, el EI no puede preceder al EC y tampoco pueden ocurrir los dos estímulos simultáneamente.

Otro principio fundamental del condicionamiento clásico es que el valor emocional del EI se extiende hacia atrás para “infectar” el EC. Esto significa que muchos emparejamientos del “EC seguido por el EI,” la emoción que siente el animal en respuesta a la vista, sonido u olor o percepción del EI se convertirá en la sensación reflexiva sobre el EC. El estímulo condicionado asumirá el valor emocional del estímulo incondicionado. Hay que tener en cuenta que, en algunos casos, la reacción fisiológica del animal al EC será diferente a su reacción al EI.  Por ejemplo, la respuesta de una rata a una descarga eléctrica es incrementar la actividad bruscamente. Mientras que la respuesta de una rata a un sonido que señala la descarga es reducir drásticamente la actividad.  Para más ejemplos ver Rescorla, R. (1988) Pavlovian Conditioning: It’s Not What You Think It IsAmerican Psychologist43, 151-160]

errores con el clicker

El condicionamiento clasico puede cambiar la percepción sobre reforzadores y castigadores

Los entrenadores de animales pueden utilizar el poder del condicionamiento clásico en una variedad de maneras productivas.  Es el proceso responsable de crear reforzadores condicionados (o secundarios) de todo tipo, incluído el sonido del clicker. [Hay que tener en cuenta que las reglas del condicionamiento clásico requieren que haya una breve pausa entre el click y el premio. Si los dos ocurren simultáneamente, incluso si el animal percibe como premio el movimiento de la mano hacia la comida,  el animal no considerará el click como reforzador. Por tanto, el click debería preceder a cualquier movimiento de las manos, ojos o cuerpo hacia la comida o juguete que se está utilizando como premio].

El condicionamiento clásico puede crear respuestas emocionales condicionadas, sea de alegría o de miedo, hacia imágenes o sonidos ambientales percibidos por el animal.  También permite que los entrenadores sigan reglas simples para transferir con éxito antiguas pautas de comportamiento en nuevas pautas.

Pero hay otro modo en el que el condicionamiento clásico se cuela en nuestro entrenamiento, una que puede pasar desapercibida fácilmente. El condicionamiento clásico puede cambiar la percepción del animal sobre cuáles son los estímulos reforzadores y cuáles son los castigadores. Y estos cambios aprendidos en el valor afectivo de supuestamente reforzar o castigar las consecuencias, pueden ser generalizados y duraderos.

Knine comida para perros

Murray Sidman, en su revolucionario libro Coercion and its Fallout explica claramente este concepto. Demostrando el principio con el ejemplo de una rata, en una cámara de comportamiento operante, el Dr. Sidman describe el sencillo procedimiento que convertirá las descargas eléctricas en reforzadores positivos tan poderosos que puede ser utilizados para que una rata aprenda una conducta totalmente nueva.

El investigador puede usar el proceso de condicionamiento clásico para vincular las descargas con comida (ej. la rata recibe la descarga e inmediatamente recibe comida).  A pesar de que nuestro sentido común nos dice que las descargas eléctricas están castigando a los animales, como resultado de este entrenamiento el estimulo doloroso puede convertirse realmente ser un reforzador positivo para la rata, algo que el animal trabajará activamente para conseguir.   (pp. 74-75).

Aquí hay un estracto de otro libro, un maravilloso libro de texto antiguo de Frank A Logan, titulado Fundamentals of Learning and Motivation (1970, Dubuque Iowa: Wm. C. Brown).

“Una manera de ilustrar la importancia del  principio de respuesta anticipada es usar como estímulo condicionado y estímulo incondicionado dos estímulos. Uno de ellos es emocionalmente positivo (como la comida) y el otro emocionalmente negativo (como una descarga eléctrica).  Veamos lo que ocurre dependiendo del orden de estos dos estímulos.

Tertulias Caninas

Consideremos primero un ambiente en el cual un organismo ocasionalmente recibe una descarga eléctrica que señala que pueda acercarse a un contenedor de comida y comer.  Por este orden, la descarga es el estímulo condicionado y la comida el estímulo incondicionado. Y las respuestas emocionales positivas a este último se condicionan al primero. A menos que sea muy intensa, la descarga pierde sus propiedades aversivas. El organismo acepta la descarga con calma e irá con entusiasmo a por la comida. Quizás preferiría que un tono o una luz señalaran la comida pero es capaz de vivir de forma aceptable en ese ambiente.

Ahora vamos a reinvertir el orden por el espacio de un solo segundo.  En el primer caso, la comida se entregaba medio segundo después de la descarga. Y ahora organicemos el entorno para que la comida este a libre disposición. Pero medio segundo después de que el animal de el primer bocado, se le da una descarga eléctrica. En este orden, las respuestas negativas emocionales provocadas por la descarga se condicionan a la comida y el animal raramente comerá.  Vive en un continuo estado de conflicto y su conducta es pésima.  Su vida, de hecho, es miserable.

Visto desde la distancia estos dos entornos son idénticos: la misma cantidad de comida y el mismo número de descargas. Pero la respuesta del animal a cada uno es muy diferente: el segundo suceso llega a dominar la situación.   Esto es porque las respuestas emocionales hacia ello se condicionan al primer estimulo y cambia su valor afectivo. La descarga puede volverse placentera, la comida puede ser aversiva.” [El énfasis es mío.] (pp 55-56)

La descarga puede volverse
placentera
y la comida puede volverse
aversiva

Los entrenadores caninos debemos ser conscientes de que ambos procesos de aprendizaje (castigos que se convierte en reforzadores o refuerzos que se convierten en castigos) ocurren con bastante frecuencia sin que nos demos cuenta.  Ese es el verdadero peligro: que nuestros perros aprendan que el tirón de correa, las reprimendas verbales y otros aversivos son realmente reforzadores. Y que la comida, los juguetes, las caricias y las felicitaciones son en realidad castigos. Esto destruirá nuestra capacidad para entrenar nuevas conductas y causará frustración al entrenador y confusión al perro.

Aquí tenemos un ejemplo común de cómo se desarrolla este problema durante en el entrenamiento.   Supongamos que le gritas al cachorro por morder la pata de la mesa del comedor y, en cuanto deje de hacerlo, le felicitas e incluso le das un premio.  Algunos entrenadores llaman esto “rutina de Jekyll y Hyde” o el “procedimiento poli bueno-poli malo”. Significa que debes ser muy severo cuando tu perro se comporta mal. Pero en cuanto cambie su comportamiento para hacer algo más deseable, deberías pasar del grito o tirón de correa a una voz dulce , sonrisas y darle comida.

En realidad no importa si este método es efectivo para que deje de morder la pata de la mesa. Está consiguiendo algo mucho más significativo.  Está convirtiendo las reprimendas (o golpes o tirones) en reforzadores condicionados.  Esto significa que, con el tiempo, esta consecuencia será menos efectiva a la hora de suprimir el comportamiento. Como no te das cuenta de por qué sucede es probable que pienses que debes incrementar la intensidad de tus gritos (o golpes o tirones). 

Pero si tras cada uno de estos estímulos aversivos intensificados continúas entregando reforzadores positivos, incluso estos llegarán a perder sucapacidad para castigar (es decir: disminuirán la fuerza del comportamiento anterior). El Dr. Sidman afirma que incluso las descargas emitidas a través de la rejilla del suelo de una cámara de  condicionamiento-operante, suficientemente fuertes como para hacerla pie a una rata*, pueden convertirse en reforzadores positivos con capacidad para motivarla a aprender un nuevo comportamiento.

errores con el clicker

Todo esto, aplicado al clicker

¿Y por qué todo esto es importante para los entrenadores de clicker y para todo entrenador que se base en el refuerzo positivo?  ¿No evitamos utilizar castigos tanto como sea posible?  Si, por supuesto, pero creo que es esencial que preservemos el poder de los castigos suaves y humanos para suprimir una conducta. De esta manera, en las raras ocasiones en las que decidamos utilizar uno en nuestro programa de entrenamiento (ej. decir “ehh ehh!” cuando las patas de nuestro perro se despegan del suelo en un intento de robar el pollo asado de la encimera de la cocina), funcionará según lo esperado.

El peor de los casos es que decidamos utilizar un castigador ocasional como parte de un plan de entrenamiento cuidadosamente planeado. Pero entonces descubrimos que no sólo no suprimió el comportamiento indeseado sino que en realidad ¡lo incrementó!  Se necesita un entrenador sensato para darse cuenta de que, en esta situación, gritar más alto al perro no resolverá el problema.

La regla para evitar este efecto dañino es simple: continúa cualquier evento de castigo con un periodo de no interacción con el perro (o tu caballo o incluso tu hijo).  No comuniques nada al perro durante 30 segundos si es posible o por lo menos 10 segundos, si es lo que puedes conseguir.  “Desconecta” del animal durante este breve período de tiempo (psicológicamente, no físicamente -¡no sueltes la correa!) Debes asegurarte de que nada de lo que hagas inmediatamente después del castigo de ninguna manera contracondicione su aversión. Después de dar un castigo, evita todo tipo de «rebote de cariño» hacia el perro.  Por supuesto, queremos reforzar positivamente cualquier comportamiento deseado que ofrece el perro pero no en ese momento vacío después de un castigo.

detrás de cualquier castigo 
intercala un período de
no interacción de al menos
10 segundos

¿Se podría utilizar este proceso intencionadamente para desactivar un castigo potencial?

Si, y se me ocurren varios ejemplos.  Quizás alguien de tu familia grita al perro y te gustaría utilizar el condicionamiento clásico para enseñar al perro que gritar ( o tirarle del pellejo o del collar) es realmente algo bueno, es decir, una señal que predice la llegada de comida rica o un divertido juego de tira y afloja o una carrera en el jardín.

Otra situación que suele darse con muchos de mis clientes  es que, cuando van de paseo con la correa y se ponen nerviosos, tensan la correa.  El perro generalmente interpreta esta tensión en la correa como estresante e incomoda.  Pero en casa, como una tarea de entrenamiento, el cliente puede utilizar el condicionamiento clásico para convencer al perro que una correa tensa es indicador de que llega algo bueno.  Tras muchos ensayos de “correa tensa” (el estimulo condicionado) seguido de “premio de hígado” (el estimulo incondicionado), el perro reaccionará emocionalmente a la correa tensa como hace con los premios de hígado (es decir: ¡yupiii!)

¿Y qué hay de la segunda posibilidad que menciona el Dr. Logan de que la comida se puede volver algo aversivo?  Este es un gran problema para los entrenadores en positivo y es precisamente uno de los que veo a menudo.  La forma más común de que ocurra es que el entrenador presente un señuelo de comida e inmediatamente pase algo doloroso, molesto o que da miedo.  Esto repetido “señuelo de comida seguido inmediatamente por un estimulo aversivo” enseñará al perro a no confiar o incluso a evitar la comida.  Esta es la razón real detrás de muchos casos en los que el guía dice: “es que a mi perro no le motiva la comida”.

errores con el clicker

La comida puede crear conductas de evitación

Aquí hay unas situaciones en los que el condicionamiento clásico accidental puede crear algún nivel de evitación a la comida:

  • Utilizar trozos de carne para atraer a tu perro que tiene dudas y miedo a subir al balancín en las clases de agility (carne seguida del movimiento aterrador del balancín).
  • Untar manteca de cacahuete en la puerta de la nevera para que tu perro lo lama mientras le quitas los nudos del pelo (manteca de cacahuete seguida de un acicalamiento demasiado intenso o incómodo; aunque podría ir bien si fuese un cepillado ligero).
  • Darle a tu perro nervioso un nuevo juguete Kong™ lleno de queso y galletas justo antes de ir a trabajar (queso y galletas seguido de un despedida/separación extremadamente angustiosa. Esto es especialmente problemático para perros que no han aprendido antes a comer del Kong™ en una situación libre de estrés).
  • Tu perro es agresivo cuando va con la correa y le das trocitos de comida en cuanto ves que se acerca un perro por la calle. Tu perro ve al otro perro acercándose justo después de haber comido el pollo (pollo después de la aparición del perro “amenazante”. Sería una buena técnica si le das al perro los trocitos de pollo después de que haya visto al otro perro).
  • Darles chuches a extraños para que se las den al cachorro tímido emeroso y entonces le acaricien (chuches seguido de demasiado interacción cercana con una persona intimidante).

incluso el entrenamiento
técnicamente más adecuado
y el plan de modificación de conducta
más creativo no pueden compensar
el fracaso a  la hora de mantener
reforzadores y castigos
separados y diferenciados

Y aún peor…

Dos formas menos comunes en las que veo que la comida adquiere una asociación negativa es cuando los entrenadores intentan seguir dando comida a un perro saciado (quizás al final de una clase de entrenamiento). O cuando intentan forzarle a comer, normalmente en una situación estresante (ej. en el veterinario).

De la misma forma es incluso posible infectar inadvertidamente el sonido del clicker con asociaciones negativas. Por eso siempre tengo mucho cuidado al usar el clicker en situaciones en las que el perro tiene miedo. Aunque el entrenamiento con clicker es una forma ideal de ayudar a los perros a superar su miedo, es esencial que el clic no vaya seguido de eventos que pueden asustar o agobiar al perro.   Según las palabras del legendario  entrenador Bob Bailey: “tu clicker es para siempre”.  Por eso debemos tener cuidado para mantenerlo inequívocamente positivo.

Cuando estoy entrenando cualquier animal es de vital importancia preservar el efecto emocionalmente negativo de cualquier castigo humano que decida utilizar alguna vez. Y también conservar el efecto emocionalmente positivo de todos mis reforzadores incondicionados. (ej. comida, juguetes, juego, paseo, caricias) y refuerzos condicionados (ej. clicker, «yes!», elogios).  Incluso el entrenamiento técnicamente más adecuado y el plan de modificación de conducta más creativo no pueden compensar el fracaso a  la ahora de mantener reforzadores y castigos separados y diferenciados.


Autora: Kathy Sdao
Traducción: Maria Santos e Isabel Herrán

* «Una caja de Skinner puede tener en su base una rejilla electrificada formada por varillas metálicas paralelas. Ratas y ratones se agarran a esas varillas rodeándolas con sus dedos. La electrificación de la rejilla se utiliza para que asocien un estímulo (táctil en este caso) con una situación determinada (accesibilidad de la comida, por ejemplo). Esa rejilla tiene las varillas separadas entre sí del orden de un centímetro o más, con lo que los roedores tienen que mantener un equilibrio relativamente incómodo, al no poder apoyar el pie de la forma natural que correspondería a una superficie plana. De ahí que corrientes relativamente bajas (y en absoluto dañinas) les hagan «perder el pie» y que se les cuele entre las varillas. La rata puede incluso asustarse y «perder pie» sin que eso afecte a su capacidad de aprendizaje.»

Deja aquí tu comentario (debe ser aprobado para que aparezca)

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Si continúas navegando estás dando tu consentimiento para la aceptación de las cookies y nuestra Política de Privacidad. Haz clic en el enlace para mayor información.

ACEPTAR

Aviso de cookies