Informations

La généralisation des stimuli est-elle acquise en raison de l'incapacité à discriminer les stimuli ?

La généralisation des stimuli est-elle acquise en raison de l'incapacité à discriminer les stimuli ?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Le cas classique de la généralisation du stimulus est Little Albert. Le lien About.com l'explique également en termes de chiens. Je constate que dans les deux cas, il semble fort probable que le sujet (chien ou nourrisson) soit incapable de discriminer les stimuli ou incapable de déterminer quel partie du stimulus est pertinent.

Y a-t-il eu des études sur la généralisation des stimuli chez les adultes ?

Plus précisément, je me demande si la généralisation du stimulus résulte de l'incapacité de déterminer quelle partie d'un stimulus inconditionné (rat blanc) est associée au stimulus conditionné (bruit fort).

Je sais que la discrimination peut être causée par le conditionnement avec des stimuli pertinents et l'extinction de stimuli non pertinents, mais un humain adulte généraliserait-il la peur à un stimulus général ou spécifique et pourquoi ?


Si vous pensez que le stimulus est représenté par un ensemble distribué de caractéristiques (Tanifuji et al., 2001), alors je ne dirais pas que c'était un échec discriminer. Au cours de l'entraînement à la réponse conditionnée pour Albert, toutes les caractéristiques étaient présentes en tant que stimuli. Ce n'était pas qu'il ne pouvait pas distinguer les caractéristiques, juste que chacune des caractéristiques était entraînée en tant que stimuli conditionnés.

Je soupçonne qu'un adulte penserait au rat symboliquement, et le conditionnement se ferait sur ce symbole mental de rat. Les caractéristiques individuelles ne produiraient probablement pas de peur. On pense que les enfants de l'âge d'Albert n'ont pas encore développé la pensée symbolique (DeLoache, 1987). Ainsi, le conditionnement se ferait sur les composants visuels eux-mêmes.

Les références

http://anon.cs.rochester.edu/users/faculty/dana/tanifuji.pdf http://www.sciencemag.org/content/238/4833/1556.short


La généralisation des stimuli est-elle acquise en raison de l'incapacité à discriminer les stimuli ? - Psychologie

Skinner s'intéressait aux comportements qui ont des effets sur l'environnement et sur les comportements eux-mêmes. Les comportements qui agissent ou « opèrent » sur des environnements physiques et sociaux sont appelés opérants. Le conditionnement opérant est un changement de comportement, tel qu'une augmentation ou une diminution de la fréquence d'occurrence, en raison des conséquences de ces comportements (Nye, 1992).
La notion de sélection naturelle de Charles Darwin, la « loi de l'effet » d'Edward Thorndike et la théorie de l'apprentissage opérant de Skinner sont basées sur la même idée : Si la conséquence est favorable, la probabilité que la cause de la conséquence se produise augmente. (Lefrancois, 2000).

Skinner a construit une petite chambre insonorisée, appelée chambre opérante, pour observer, manipuler et enregistrer le comportement des animaux (Carlson & Buskist, 1997)

La boîte à écorcher

Les conditions environnementales dans la boîte peuvent être manipulées pour observer comment elles affectent le taux de réponse de l'animal.

Une étude typique de Skinner impliquait l'observation de rats appuyant sur un levier ou de pigeons picorant un disque dans une chambre opérante, ce qui déclencherait un distributeur pour libérer de la nourriture. Le principal intérêt de Skinner n'était pas le comportement réel (picage ou pression), mais la vitesse à laquelle ces comportements se produisent dans différentes conditions. Il est important de comprendre les conditions dans lesquelles un comportement augmente ou diminue car nous basons nos hypothèses sur les attributs des personnes sur des observations de la fréquence d'apparition de certains comportements (Nye, 1992).

La contingence à trois termes est la relation entre l'événement précédent (stimulus discriminant), la réponse (comportement opérant) et l'événement suivant (conséquence) (Carlson & Buskist, 1997).

Le scénario suivant est représentatif de l'éventualité à trois termes :

  • Vous marchez dans le parc et il commence à pleuvoir.
  • Vous ouvrez votre parapluie et le tenez au-dessus de votre tête.
  • Vous restez au sec.
  • Le stimulus discriminant est la pluie.
  • Le comportement opérant utilise le parapluie.
  • La conséquence est de rester sec.

Une réponse opérante agit comme un renforçateur s'il produit une conséquence favorable. Il existe deux classes de renforçateurs :

    Un renforçateur positif - L'apparition d'un stimulus appétitif, suite à une réponse, qui agit pour augmenter la fréquence de cette réponse (Milhollan & Forisha, 1972).

Si un élève est félicité pour avoir levé la main en classe et que le fait de lever la main augmente en fréquence, la louange peut être considérée comme un renforcement positif.


Un stimulus aversif, suite à une réponse, qui agit pour diminuer la fréquence de cette réponse, est appelé un punisseur .

Si un enfant se fait mordre après avoir tiré la queue d'un chien, il est probable que le comportement de tirer la queue diminuera en fréquence. La morsure est le punisseur.

L'utilisation de la punition a plusieurs effets secondaires négatifs, y compris le risque de causer des dommages physiques graves, d'induire la peur ou l'hostilité (l'enfant peut développer une peur de tous les chiens après avoir été mordu) et l'incapacité d'apprendre la bonne réponse dans la situation particulière ( Carlson & Buskist, 1997).

La suppression d'un stimulus appétitif est aussi une forme de punition. Un exemple bien connu de cette forme de punition, appelée coût de réponse, est le « time out ». Retirer un enfant d'une activité stimulante sert de punition pour un comportement indésirable.


Lorsqu'une réponse n'est plus suivie d'un renforçateur, cette réponse précédemment renforcée diminue en fréquence. C'est appelé extinction . Par exemple, un enfant arrêtera de faire des crises de colère s'il ne les renforce plus en y prêtant attention. Cela se produit non pas parce que l'enfant a oublié comment donner des coups de pied et crier, mais parce qu'un tel comportement ne produit pas l'effet souhaité. L'extinction est différente de l'oubli (Carlson & Buskist, 1997).

Les renforçateurs primaires, tels que la nourriture, l'eau et les températures extrêmes, sont liés à notre fonctionnement biologique de base. Les renforçateurs secondaires, ou conditionnés, sont des stimuli qui sont à l'origine neutres, mais deviennent des renforçateurs par leur association avec des renforçateurs primaires. Un puissant renforçateur secondaire est l'argent. Il a été associé à de nombreux renforçateurs primaires. Les renforçateurs généralisés sont des renforçateurs secondaires associés à plusieurs renforçateurs primaires. L'affection est un exemple de renforçateur généralisé. Il a été associé à un contact sexuel et à l'obtention de ressources telles que la chaleur et la protection (Nye, 1992).

Le renforcement accidentel d'une réponse peut conduire à un comportement superstitieux. Skinner a démontré le conditionnement d'un tel comportement en utilisant des pigeons. Il a réglé le distributeur pour livrer de la nourriture aux animaux dans une chambre opérante à des intervalles de temps fixes, par exemple toutes les 15 minutes. Les pigeons associaient tout comportement dans lequel ils se livraient au moment de la distribution de la nourriture à la livraison de la nourriture. La probabilité que ces comportements se produisent a ensuite augmenté. Skinner a conditionné les pigeons à tourner en rond, à hocher la tête ou à faire des mouvements de balancement. (Nyé, 1992)

Renforcement continu : Chaque réponse est renforcée. Par exemple, chaque fois qu'un pigeon picore le disque dans une chambre opérante, de la nourriture est distribuée.

  • Calendrier à ratio fixe : Le renforcement est livré après qu'un nombre fixe de réponses ait été effectué. Par exemple, chaque cinquième fois qu'un pigeon picore le disque dans une chambre opérante, la nourriture est distribuée.
  • Programme de ration variable : Le nombre de réponses requises pour qu'un renforçateur soit délivré varie pour chaque essai. Par exemple, une machine à sous nécessite un nombre variable de réponses après chaque essai pour payer.
  • Programme à intervalle fixe : un renforçateur est administré après un laps de temps déterminé. Par exemple, la nourriture est distribuée à intervalles de 15 minutes.
  • Horaire à intervalle variable : Un renforçateur est administré après un laps de temps moyen. Par exemple, la nourriture peut être distribuée après 30 secondes lors du premier essai et après 90 secondes lors du deuxième essai, mais la moyenne reste de 60 secondes (Carlson et Buskist, 1997).

La mise en forme consiste à renforcer les approximations successives d'un comportement souhaité. Il est largement utilisé par les dresseurs d'animaux pour apprendre aux animaux à faire des tours.

L'enchaînement implique une réponse conduisant à l'apparition d'une autre réponse. La plupart des comportements se produisent dans les chaînes. Un exemple de base d'enchaînement consiste à dire les lettres de l'alphabet. La lettre A agit comme le stimulus discriminant pour produire la réponse suivante, en disant la lettre B, et ainsi de suite (Milhollan & Forisha, 1972).

La généralisation implique l'obtention d'une réponse à un stimulus qui ressemble au stimulus discriminant. La généralisation est utile dans la mesure où elle facilite le transfert de comportement dans des situations similaires. Par exemple, une secrétaire qui peut taper sur une machine à écrire peut également taper sur un clavier d'ordinateur.

La discrimination implique le déclenchement d'une réponse uniquement en présence d'un stimulus discriminant spécifique, et non en présence de stimuli similaires. La discrimination est utile lorsqu'une réponse particulière n'est pas appropriée dans des situations similaires. Par exemple, un comportement approprié dans un restaurant de restauration rapide, comme manger avec les mains, peut ne pas être approprié dans un restaurant français. (Carlson & Buskist, 1997)


  • Acquisition
    • Période pendant laquelle une réponse est apprise
    • CS est associé à UCS pour établir un solide CR
    • Le plus rapide : jumelage de trace avant (CS apparaît avant UCS)
    • Plus lent : appairage simultané (CS apparaît avec UCS)
    • Le plus lent : appariement en amont (CS apparaît après UCS)
    • Généralement plus fort lorsque les appariements répétés, UCS intense et séquence impliquent un appariement avant avec une courte pause entre CS et UCS
    • Extinction – si CS est présenté à plusieurs reprises sans UCS, CR s'affaiblira et disparaîtra
      • Des essais d'extinction répétés accéléreront l'extinction
      • La RC issue de la récupération spontanée est généralement plus faible
      • L'extinction se produit plus rapidement
      • Généralisation des stimuli – une fois la CR acquise, l'organisme répondra à d'autres stimuli similaires à la CS d'origine
        • Plus de chances de CR dans des CS plus similaires
        • Conditionnement d'ordre supérieur - un stimulus neutre devient un CS après avoir été associé à un autre CS (plutôt que l'UCS d'origine)
          • En règle générale, le nouveau CS est plus faible et s'éteint plus tôt
          • Acquérir et surmonter la peur
            • La plupart des peurs sont conditionnées
            • Thérapie d'exposition - technique conçue pour éteindre les réponses d'anxiété en exposant les clients à des stimuli ou à des situations anxiogènes, permettant à l'extinction de se produire
            • Désensibilisation systématique - le patient apprend des techniques de relaxation puis est progressivement exposé au stimulus provoquant la peur
            • Inondations – expose immédiatement la personne au stimulus phobique
            • Thérapie d'aversion - tente de conditionner une aversion à un stimulus qui déclenche un comportement indésirable en l'associant à un UCS nocif

            Apprentissage prédictif et potentiel humain

            La psychologie étudie comment l'hérédité (la nature) et l'expérience (l'éducation) interagissent pour influencer le comportement. Dans le chapitre précédent, nous avons lié la hiérarchie des besoins humains de Maslow à des conditions humaines très différentes. Que nous grandissions dans la forêt tropicale ou dans un environnement urbain technologiquement amélioré, le bas de la pyramide reste le même. Nous avons besoin de manger et de boire et avons besoin de protection contre les éléments. La privation de nourriture ou d'eau nous rendra plus actifs à mesure que nous recherchons la substance nécessaire. Des conditions météorologiques désagréables nous obligeront à devenir plus actifs pour éliminer la source de désagréments. Nos sens nous permettent de détecter les stimuli appétitifs et aversifs dans nos environnements internes et externes. Notre structure physique nous permet de déplacer, saisir et manipuler des objets. Notre système nerveux relie nos systèmes sensoriel et moteur.

            Les êtres humains héritent de certaines connexions sensori-motrices améliorant la probabilité de notre survie. Les nourrissons héritent de deux réflexes qui augmentent les chances de réussite de l'allaitement. Un réflexe est un comportement héréditaire simple caractéristique des membres d'une espèce. Les nourrissons humains héritent des réflexes d'enracinement et de succion. Si un mamelon est placé dans le coin de la bouche d'un nourrisson, il centrera le mamelon (c'est-à-dire la racine). Le nourrisson sucera alors un mamelon au centre de sa bouche. Les seins des mères biologiques se remplissent de lait et gonflent, ce qui entraîne une gêne qui est soulagée par l'allaitement du nourrisson. Cela augmente la probabilité que la mère tente d'allaiter l'enfant. Cette heureuse combinaison de caractéristiques héritées a permis aux nourrissons humains de survivre tout au long des millénaires.

            Les mères humaines finissent par arrêter de produire du lait et les nourrissons humains finissent par avoir besoin de nutriments supplémentaires pour survivre. Cela crée la nécessité d'identifier et de localiser les sources de nutriments. Les humains ont commencé en Afrique et ont migré vers pratiquement tous les endroits de la Terre. Compte tenu de la variabilité des types d'aliments et de leurs emplacements, il serait impossible pour les humains de dépendre du processus d'évolution biologique très lent pour identifier et localiser les nutriments. On ne peut pas hériter de réflexes pour aborder toutes les possibilités. Un autre type plus rapide et flexible de mécanisme sensori-moteur adaptatif doit être impliqué.

            Nous avons décrit des voyages de recherche de nourriture menés par des membres de la tribu Nukak. Les aliments se composaient de fruits et de miel et de petits animaux sauvages, notamment des poissons et des oiseaux. Les Nukak changeaient d'emplacement tous les quelques jours afin de localiser de nouvelles réserves de nourriture. Où ils se sont installés et ont changé avec les saisons. La chasse et la cueillette comprenaient l'utilisation d'outils assemblés avec des éléments naturels. De toute évidence, l'expérience antérieure (c'est-à-dire l'éducation) a affecté leur comportement. C'est ce que nous entendons par apprentissage.

            Définition opérationnelle de l'apprentissage

            Toutes les sciences s'appuient sur des définitions opérationnelles afin d'établir une certaine cohérence dans l'utilisation de la terminologie. Les définitions opérationnelles décrivent les procédures utilisées pour mesurer le terme particulier. On n'observe pas directement l'apprentissage. Il doit être déduit des observations du comportement. La définition opérationnelle décrit comment on détermine objectivement si une observation comportementale est un exemple du processus.

            Les définitions opérationnelles les plus courantes de l'apprentissage sont des variantes de celle fournie dans la révision de Kimble de Hilgard et Marquis. Conditionnement et apprentissage (1961). Selon Kimble, « l'apprentissage est un changement relativement permanent du potentiel comportemental qui se produit à la suite de la pratique ». Analysons cette définition. Premièrement, il convient de noter que l'apprentissage n'est inféré que lorsque nous voyons un changement de comportement résultant d'une expérience appropriée. Sont exclues d'autres causes possibles de changement de comportement, y compris la maturation, qui n'est pas expérientielle. La fatigue et les médicaments ne produisent pas de changements « relativement permanents ». Kimble inclut le mot « potentiel » après le comportement pour souligner le fait que même si l'apprentissage a eu lieu, cela ne garantit pas un changement de comportement correspondant.

            Le fait que l'apprentissage antérieur puisse ne pas être reflété dans les performances est basé sur une expérience classique menée par Tolman et Honzik en 1930. Ils ont étudié des rats de laboratoire dans des conditions ressemblant à la chasse et à la cueillette des Nukak. Trois groupes différents ont été placés dans un labyrinthe complexe et le nombre d'erreurs (c'est-à-dire de mauvais virages) a été enregistré (voir la figure 5.1).

            Graphique 5.1. Labyrinthe utilisé dans l'étude de Tolman et Honzik dans les années 1930 avec des rats (Jensen, 2006).

            Un groupe Hungry No Reward (HNR) a simplement été placé dans la zone de départ et retiré du labyrinthe après avoir atteint la fin. Un groupe Hungry Reward (HR) a reçu de la nourriture à la fin et a été autorisé à manger avant d'être retiré. Le troisième, No Reward -> Reward groupe, a commencé de la même manière que le groupe No Reward et est passé à être traité de la même manière que le groupe Regular Reward après dix jours (HNR-R).

            Avant de considérer le troisième groupe, voyons comment les résultats des deux premiers nous permettent de conclure que l'apprentissage a eu lieu dans le groupe Récompense régulière (voir Figure 5.2). Les groupes HNR et HR ont été traités de la même manière à une exception près, le second a reçu de la nourriture à la fin. Par conséquent, si les résultats diffèrent, nous pouvons conclure que ce doit être cette expérience qui a fait la différence. Le nombre moyen d'erreurs n'a pas chuté de manière significative en dessous des performances aléatoires au cours de l'expérience pour le groupe HNR. En comparaison, le groupe RH a démontré une baisse constante et substantielle des erreurs, exactement le modèle auquel on s'attendrait si l'apprentissage se produisait. Cette baisse des erreurs par l'expérience répond à la définition opérationnelle de l'apprentissage. Il ne serait pas possible de conclure que l'expérience a fait une différence dans le groupe HR sans la condition de contrôle HNR. On pourrait soutenir que quelque chose d'autre était responsable du déclin en cours (par exemple, un changement dans les conditions de laboratoire, la maturation, etc.).

            Graphique 5.2. Résultats de l'étude Tolman & Honzik’s (Jensen, 2006).

            Il est possible de conclure que le groupe récompensé a appris le labyrinthe sur la base d'une comparaison de ses résultats avec le groupe sans récompense. Une conclusion connexe, apparemment logique, serait que le groupe ne recevant pas de nourriture n'a pas réussi à apprendre le labyrinthe. Le troisième groupe de Tolman et Honzik était comme le groupe sans récompense pour les 10 premiers jours et comme le groupe récompensé pour les jours restants. Ce groupe a permis de tester si l'absence de nourriture entraînait ou non l'absence d'apprentissage. Il est important de comprendre la raison de cette condition. Si le groupe HNR-R n'avait rien appris sur le labyrinthe au cours des 10 premiers jours, le nombre d'erreurs devrait diminuer progressivement à partir de là, le modèle démontré dès le début par la condition HR. Cependant, si le groupe HNR-R avait appris le labyrinthe, une baisse plus spectaculaire des erreurs serait attendue une fois la nourriture introduite. C'est en effet ce déclin dramatique des erreurs qui s'est produit, conduisant à la conclusion que les rats avaient appris le labyrinthe malgré le fait que cela n'était pas évident dans leur comportement. Ce résultat a été décrit comme un « apprentissage latent » (c'est-à-dire un apprentissage qui ne se reflète pas dans les performances). L'apprentissage n'est qu'un des nombreux facteurs qui influent sur le comportement d'un individu. Les résultats de Tolman et Honzik impliquent que la motivation incitative (la nourriture dans ce cas) était nécessaire pour que les animaux montrent ce qu'ils avaient appris. Ainsi, nous voyons la nécessité d'inclure le mot « potentiel » dans la définition opérationnelle de l'apprentissage. Au cours des 10 premiers essais, les rats ont clairement acquis le potentiel de négocier le labyrinthe. Ces résultats peuvent vous rappeler ceux cités au chapitre 1 avec de jeunes enfants. Vous vous souviendrez peut-être que certains ont obtenu de meilleurs résultats aux tests de QI lorsqu'ils ont reçu des récompenses extrinsèques pour des réponses correctes. Tout comme les rats de Tolman et Honzik, ils avaient le potentiel de mieux performer mais avaient besoin d'une incitation.

            1. Énoncez la définition opérationnelle de l'apprentissage, en décrivant pourquoi chacun des termes est inclus.
            2. Décrivez les procédures, la justification, les résultats et les implications de l'étude de Tolman et Honzik démontrant que l'on ne peut conclure à l'absence d'apprentissage de l'absence de performance.

            L'apprentissage en tant que processus adaptatif

            La définition opérationnelle nous dit comment mesurer l'apprentissage mais ne nous dit pas ce qui est appris ou pourquoi c'est important. J'ai tenté d'y parvenir en définissant l'apprentissage comme un adaptatif traiter où les individus acquièrent la capacité de prévoir et de contrôler l'environnement (Levy, 2013). Il n'y a rien que les Nukak puissent faire pour provoquer ou empêcher la pluie. Au fil du temps, cependant, ils peuvent être en mesure d'utiliser des indices environnementaux tels que le ciel sombre ou peut-être même des indices liés au passage du temps pour prédire l'occurrence de la pluie. Les Nukak peuvent contrôler la probabilité de découvrir de la nourriture en explorant leur environnement. Ils peuvent obtenir des fruits des arbres en les attrapant et en les saisissant. Les capacités de prédire la pluie et d'obtenir de la nourriture augmentent certainement les chances de survie des Nukak. Autrement dit, ces capacités sont adaptatives.

            La définition de l'apprentissage adaptatif nous permet d'apprécier pourquoi il est nécessaire de porter notre attention sur deux chercheurs célèbres dont les contributions ont énormément influencé l'étude de l'apprentissage pendant des décennies, Ivan Pavlov et B. F. Skinner. Les procédures de Pavlov, appelées conditionnement classique, étudiaient l'apprentissage dans des circonstances où il était possible de prédire les événements mais pas de les contrôler. Skinner a étudié l'apprentissage dans des circonstances où le contrôle était possible. Ces deux chercheurs ont créé des appareils et des procédures expérimentales pour étudier les détails de l'apprentissage adaptatif. Ils ont identifié de nombreux phénomènes d'apprentissage importants et introduit des vocabulaires techniques qui ont résisté à l'épreuve du temps. Nous décrirons les contributions de Pavlov à l'étude de l'apprentissage prédictif dans ce chapitre et les contributions de Skinner à l'étude de l'apprentissage du contrôle dans le chapitre suivant.

            On ne saurait trop insister sur l'importance des contributions d'Ivan Pavlov à l'étude de l'apprentissage prédictif. Pavlov a introduit un niveau de rigueur et de précision de mesure des variables indépendantes et dépendantes dans l'apprentissage des animaux qui n'existait pas à l'époque. En 1904, Pavlov, un physiologiste, a reçu le prix Nobel de médecine pour ses recherches sur le processus digestif chez le chien. Il est devenu fasciné par une observation que lui et ses assistants de laboratoire ont faite lors de cette recherche. L'un des processus digestifs étudiés était la salivation. La salive contient des enzymes qui initient le processus de décomposition de ce que l'on mange en nutriments de base nécessaires pour alimenter et réparer le corps. Les sujets ont fréquemment commencé à saliver avant d'être placés dans l'appareil expérimental. Pavlov a décrit cette salivation comme une "sécrétion psychique" car elle n'était pas directement provoquée par la nourriture. Il considérait le phénomène si important qu'en quelques années il abandonna son programme de recherche en digestion et consacra le reste de sa carrière professionnelle à étudier systématiquement les détails de ce processus d'apprentissage de base.

            C'est un merveilleux exemple de ce qui a été décrit comme un heureux hasard, ou une découverte accidentelle en science. Les chiens sont domestiqués depuis des milliers d'années. Un nombre incalculable de personnes ont probablement observé des chiens semblant prédire (c'est-à-dire anticiper ou s'attendre) à la nourriture. Pavlov, cependant, a reconnu l'importance de l'observation en tant qu'exemple d'un processus d'apprentissage fondamental. Nous pensons souvent à la science comme nécessitant de nouvelles observations. La « découverte » par Pavlov du processus de conditionnement classique est un exemple de la façon dont ce n'est pas nécessairement le cas. L'une des caractéristiques d'un scientifique exceptionnel est de reconnaître l'importance des observations courantes.

            Nous allons maintenant passer en revue l'appareil, les méthodes et la terminologie que Pavlov a développés pour étudier l'apprentissage prédictif. Il a adapté un appareil expérimental conçu pour un domaine de recherche scientifique (la physiologie de la digestion) à un domaine entièrement différent (l'apprentissage adaptatif). Pavlov a pratiqué une petite incision chirurgicale dans la joue du chien et implanté un tube permettant de recueillir directement la salive dans un tube à essai gradué. La quantité de salive pourrait alors être mesurée avec précision et représentée graphiquement comme le montre la figure 5.3. L'apprentissage prédictif a été déduit lorsque la salivation s'est produite à un stimulus auparavant neutre à la suite d'une expérience appropriée.

            Vidéo

            Regardez la vidéo suivante décrivant Pavlov et le conditionnement classique :

            Les animaux héritent de la tendance à faire des réponses simples (réflexes) à des types spécifiques de stimulation. La recherche de Pavlov sur la salivation était basée sur le déclenchement réflexif de la salivation par la nourriture (par exemple, la poudre de viande). Cette recherche a été adaptée à l'étude de l'apprentissage prédictif en incluant un stimulus neutre. Par neutre, nous entendons simplement que ce stimulus n'a initialement suscité aucun comportement lié à la nourriture. Pavlov a démontré que si un stimulus neutre précédait un stimulus biologiquement significatif à plusieurs reprises, on verrait une nouvelle réponse se produire au stimulus précédemment neutre. La figure 5.4 utilise la traduction la plus populaire de la terminologie de Pavlov (qui a écrit en russe). Le comportement réflexif a été appelé la réponse inconditionnée (UR). Le stimulus qui a suscité par réflexe cette réponse a été appelé stimulus inconditionné (US). Un nouveau stimulus, en raison de son association dans une relation prédictive avec la nourriture (US), acquiert la capacité de susciter une réponse conditionnée (CR) liée à la nourriture. Une fois cette capacité acquise, le nouveau stimulus est considéré comme un stimulus conditionné (CS).

            Figure 5.4 Procédures de conditionnement classiques et terminologie de Pavlov.

            De base Phénomènes d'apprentissage prédictif

            Au chapitre 1, nous avons discuté de l'hypothèse du déterminisme telle qu'elle s'appliquait à la discipline de la psychologie. Si l'apprentissage prédictif est un processus licite, une enquête empirique contrôlée a le potentiel d'établir des relations de cause à effet fiables. Nous verrons que c'est le cas en passant en revue plusieurs phénomènes de conditionnement classiques de base. Beaucoup de ces phénomènes ont été découverts et nommés par Pavlov lui-même, en commençant par le processus d'acquisition décrit ci-dessus.

            Acquisition

            Le terme acquisition fait référence à une procédure ou à un processus par lequel un stimulus est présenté dans une relation prédictive avec un autre stimulus. L'apprentissage prédictif (conditionnement classique) est déduit de l'apparition d'une nouvelle réponse au premier stimulus. En gardant à l'esprit que les termes mentalistes sont des inférences basées sur des observations comportementales, c'est comme si l'individu apprenait à prédire si cela se produit, alors cela se produit.

            Le terme extinction fait référence à une procédure ou un processus par lequel un stimulus prédictif précédemment établi n'est plus suivi par le second stimulus. Cela se traduit généralement par un affaiblissement de la force de la réponse apprise antérieurement. C'est comme si l'individu apprenait ce qui se passait n'arrive plus. L'extinction est couramment utilisée à mauvais escient comme terme décrivant uniquement le résultat de la procédure ou du processus. C'est-à-dire qu'il est souvent utilisé comme le terme schizophrénie, qui est défini exclusivement du côté de la variable dépendante (symptôme). L'extinction ressemble en fait plus à la grippe, en ce sens qu'il s'agit d'une véritable explication de la relation entre une variable indépendante spécifique (la procédure) et une variable dépendante (le changement de comportement).

            Vidéo

            Regardez la vidéo suivante décrivant l'acquisition et l'extinction du conditionnement classique :

            Récupération spontannée

            Le terme récupération spontanée fait référence à une augmentation de la force de la réponse apprise antérieurement après qu'une période de temps prolongée s'est écoulée entre les essais d'extinction. L'individu agit comme si, peut-être que ce qui se passait, le fait toujours.

            L'extinction est-elle un désapprentissage ou un apprentissage inhibiteur ?

            Pavlov était un excellent exemple de quelqu'un qui serait aujourd'hui considéré comme un neuroscientifique du comportement. En fait, le titre complet de son livre classique (1927) est Réflexes conditionnés : une enquête sur l'activité physiologique du cortex cérébral. Les neuroscientifiques comportementaux étudient le comportement afin d'en déduire les mécanismes cérébraux sous-jacents. Ainsi, Pavlov ne s'est pas perçu comme passant d'un physiologiste à un psychologue lorsqu'il a abandonné son étude de la digestion pour explorer les subtilités du conditionnement classique. Comme le laisse entendre sa métaphore de la «sécrétion psychique», il croyait qu'il continuait à étudier la physiologie, détournant son attention de l'étude du système digestif pour étudier le cerveau.

            Une question d'intérêt pour Pavlov était la nature du processus d'extinction. Pavlov a supposé que l'acquisition produisait une connexion entre un neurone sensoriel représentant le stimulus conditionné et un motoneurone provoquant la salivation. La réduction de la réponse résultant de la procédure d'extinction pourrait résulter de la rupture de ce lien (c'est-à-dire du désapprentissage) ou de sa neutralisation par une réponse concurrente. Le fait qu'une récupération spontanée se produise indique que le lien n'est pas rompu pendant le processus d'extinction. L'extinction doit impliquer l'apprentissage d'une réponse inhibitrice contrecarrant la réponse conditionnée. L'individu semble apprendre qu'un stimulus n'en prédit plus un autre. La conclusion que l'extinction n'élimine pas de façon permanente une association précédemment apprise a d'importantes implications pratiques et cliniques. Cela signifie qu'une personne qui a reçu un traitement pour un problème et s'est améliorée n'est pas la même chose qu'une personne n'ayant jamais besoin de traitement en premier lieu (cf., Bouton, 2000 Bouton et Nelson, 1998). Par exemple, même si quelqu'un a arrêté de fumer, il y a une plus grande probabilité que cette personne rechute qu'un non-fumeur n'en acquiert l'habitude.

            Décrivez la base pour conclure que l'extinction est un processus inhibiteur par opposition à un processus de désapprentissage.

            Généralisation des stimuli et discrimination

            Imaginez si vous deviez apprendre à faire la même réponse encore et encore à chaque nouvelle situation. Heureusement, ce n'est souvent pas nécessaire. La généralisation des stimuli fait référence au fait qu'une réponse précédemment acquise se produira en présence de stimuli autres que l'original, la probabilité étant fonction du degré de similitude. Dans la figure 5.5, nous voyons qu'une réponse apprise à une fréquence de 500 Hz se produit à d'autres stimuli, le pourcentage de fois dépendant de la proximité de la fréquence à 500. C'est comme si l'individu prédisait ce qui se passe après un événement se produira après des événements similaires.

            Figure 5.5 Gradient de généralisation du stimulus.

            Le fait que la généralisation se produise augmente considérablement l'efficacité des expériences d'apprentissage individuelles. Cependant, il y a généralement des limites à la pertinence de faire la même réponse dans différentes situations. Par exemple, les nouveaux pères rayonnent souvent la première fois qu'ils entendent leur bébé dire « papa ». Ils sont moins ravis lorsqu'ils entendent leur enfant appeler le facteur « papa ! Habituellement, il est nécessaire de mener un enseignement supplémentaire pour que l'enfant ne dise « papa » qu'en présence du père. La discrimination de stimulus se produit lorsqu'un stimulus (le S+, p. ex. un ton ou le père) est prédictif d'un deuxième stimulus (p. mailman) n'est jamais suivi de ce deuxième stimulus. Finalement, l'individu répond au S+ (ton ou père) et non au S- (lumière ou facteur) comme s'il apprenait si cela se produit, cela se produit, mais si cette autre chose se produit, cela ne se produit pas.

            1. Définir et donner des exemples des phénomènes de conditionnement classiques suivants : acquisition, extinction, récupération spontanée, généralisation des stimuli et discrimination.
            2. Expliquez comment le fait que la récupération spontanée se produise indique que le lien entre un stimulus conditionné et une réponse conditionnée n'est pas rompu pendant le processus d'extinction.

            Modèle de substitution de stimulus de Pavlov du conditionnement classique

            Pendant la majeure partie du 20e siècle, le modèle de substitution de stimulus proposé à l'origine par Pavlov du conditionnement classique a été largement accepté. Pavlov considérait le conditionnement comme un résultat mécaniste (automatique) de l'appariement d'événements neutres et biologiquement significatifs dans le temps. Il croyait que le stimulus conditionné établi devenait un substitut au stimulus inconditionnel d'origine. Il y avait quatre hypothèses sous-jacentes à ce modèle de substitution de stimulus :

            • Le conditionnement classique nécessite un stimulus biologiquement significatif (c'est-à-dire US)
            • La contiguïté temporelle entre un stimulus neutre et un stimulus inconditionné est nécessaire pour que le stimulus neutre devienne un stimulus conditionné
            • La contiguïté temporelle entre un stimulus neutre et un stimulus inconditionné est suffisant pour que le stimulus neutre devienne un stimulus conditionné
            • La réponse conditionnée ressemblera toujours sinon être identique à la réponse inconditionnée.

            Le conditionnement classique nécessite-t-il un stimulus biologiquement significatif ?

            Le conditionnement d'ordre supérieur est une procédure ou un processus par lequel un stimulus auparavant neutre est présenté dans une relation prédictive avec un second stimulus prédictif préalablement établi. L'apprentissage est déduit de l'apparition d'une nouvelle réponse en présence de ce stimulus auparavant neutre. Par exemple, après avoir associé le ton avec de la nourriture, il est possible de placer le ton dans la position des États-Unis en présentant une lumière juste avant qu'il ne se produise. La recherche indique qu'une réponse conditionnée (la salivation dans ce cas) se produira à la lumière même si elle n'était pas associée à un stimulus biologiquement significatif (nourriture).

            Vidéo

            Regardez la vidéo suivante pour une démonstration de conditionnement d'ordre supérieur :

            La contiguïté temporelle est-elle nécessaire au conditionnement ?

            Les êtres humains ont spéculé sur le processus d'apprentissage depuis au moins l'époque des premiers philosophes grecs. Aristote, au IVe siècle av. J.-C., a proposé trois lois d'association qu'il croyait appliquées à la pensée et à la mémoire humaines. La loi de contiguïté stipulait que des objets ou des événements se produisant à proximité dans le temps (contiguïté temporelle) ou dans l'espace (contiguïté spatiale) devenaient associés. La loi de similitude stipulait que nous avions tendance à associer des objets ou des événements ayant des caractéristiques en commun de telle sorte que l'observation d'un événement incite à se souvenir d'événements similaires. La loi de fréquence stipulait que plus nous expérimentions des objets ou des événements, plus nous serions susceptibles de nous en souvenir. En un sens, Pavlov a créé une méthodologie permettant de tester empiriquement les lois d'Aristote. La loi qui s'applique dans cette section est la loi de contiguïté temporelle. Les effets de temps, comme de nombreuses variables étudiées scientifiquement, se prêtent à des études paramétriques dans lesquelles la variable indépendante est constituée de différentes valeurs sur une dimension. Il a été démontré que dans le conditionnement des paupières humaines dans lequel une lumière est suivie d'une bouffée d'air vers l'œil est la plus forte lorsque la bouffée se produit environ 500 millisecondes (½ seconde) après la lumière. La force du conditionnement à des intervalles plus ou moins longs diminue en quelques dixièmes de seconde. Ainsi, la contiguïté temporelle semble critique dans le conditionnement des paupières humaines, conformément à la deuxième hypothèse de Pavlov.

            Une exception – a acquis une aversion pour le goût

            L'aversion gustative acquise est la seule exception apparente à la nécessité de la contiguïté temporelle dans l'apprentissage prédictif (conditionnement classique). Cette exception peut être comprise comme une adaptation évolutive pour protéger les animaux des intoxications alimentaires. Imaginez si des membres des Nukak tombaient malades après avoir mangé un aliment particulier et continuaient à manger la même substance. Il y a de fortes chances que les membres de la tribu (et la tribu !) ne survivent pas longtemps. Il serait avantageux d'éviter les aliments consommés avant de tomber malade, même si les symptômes n'apparaissent pas avant plusieurs minutes, voire plusieurs heures. Le phénomène d'aversion gustative acquise a été largement étudié. Les intervalles de temps utilisés diffèrent parfois en heures plutôt qu'en secondes ou en dixièmes de secondes. Par exemple, des rats sont tombés malades en étant exposés aux rayons X après avoir bu de l'eau douce (Smith & Roll, 1967). Les rats ont une forte préférence pour l'eau douce, la buvant environ 80 pour cent du temps lorsqu'ils ont le choix avec de l'eau du robinet ordinaire. Si le rat tombait malade en moins d'une demi-heure, la consommation d'eau douce était totalement éliminée. Avec des intervalles de 1 à 6 heures, il a été réduit de 80 à 10 pour cent. Il y avait même des preuves d'un effet après un délai de 24 heures ! Les chiens de Pavlov n'associeraient pas un ton à la présentation de la nourriture une heure plus tard, et encore moins 24 heures. L'aversion acquise pour l'eau douce peut être interprétée soit comme une exception à la loi de contiguïté temporelle, soit comme la contiguïté doit être considérée sur une échelle de temps de différents ordres de grandeur (heures plutôt que secondes).

            La contiguïté temporelle est-elle suffisante pour le conditionnement ?

            Pavlov croyait non seulement que la contiguïté temporelle entre CS et US était nécessaire pour que le conditionnement se produise, il croyait également que c'était tout c'est nécessaire (c'est-à-dire que c'était suffisant). Rescorla (1966, 1968, 1988) a démontré que la corrélation entre CS et US (c'est-à-dire la mesure dans laquelle le CS a prédit les US) était plus importante que la contiguïté temporelle. Par exemple, si le seul moment où l'on est choqué est en présence du son, alors le son est en corrélation avec le choc (c'est-à-dire qu'il est prédictif du choc). Si une personne est choquée de la même quantité, que le ton soit présent ou non, le ton n'est pas corrélé avec le choc (c'est-à-dire qu'il ne fournit aucune information prédictive). Rescorla a démontré que malgré la contiguïté temporelle entre le tonus et le choc dans les deux cas, le conditionnement classique serait fort dans le premier cas et ne se produirait pas dans le second.

            Un autre exemple du manque d'apprentissage prédictif malgré la contiguïté temporelle entre deux événements est fourni dans une étude de Léon Kamin (1969). Un groupe bloquant a reçu une tonalité (CS 1) suivie d'un choc (US) dans la première phase et un groupe témoin a été simplement placé dans la chambre (voir figure 5.13). Les groupes sont désormais identiques. Au cours de la deuxième phase, un stimulus composé composé de la lumière et d'un ton (CS 2) a été suivi d'un choc. Lors d'une phase de test, chaque composant a été présenté seul pour déterminer l'étendue du conditionnement.

            Dans le groupe bloquant, le conditionnement s'est produit au niveau du ton et non de la lumière. Le conditionnement s'est produit pour les deux éléments du composé dans le groupe témoin. C'est comme si l'expérience préalable avec le ton avait fait en sorte que les sujets du groupe de blocage ne prêtaient pas attention à la lumière dans la deuxième phase. La lumière était redondante. Il n'a pas fourni d'informations supplémentaires.

            Une démonstration originale et amusante de blocage chez des étudiants universitaires impliquait un jeu vidéo informatisé (Arcediano, Matute et Miller, 1997). Les sujets ont essayé de protéger la terre de l'invasion par les martiens avec un pistolet laser (la barre d'espace). Malheureusement, les martiens entreprenants avaient développé un bouclier anti-laser. Si le sujet tirait alors que le bouclier était en place, leur pistolet laser serait inefficace, permettant à un groupe de martiens d'atterrir et de faire leur mal. Une lumière clignotante a précédé la mise en place du bouclier laser pour les sujets du groupe de blocage. Un groupe témoin n'a pas ressenti de stimulus prédictif pour le bouclier laser.Par la suite, les deux groupes ont subi un stimulus composé composé d'une lumière clignotante et d'un ton complexe. Le groupe témoin associait la tonalité à l'activation du bouclier laser alors que, en raison de leurs antécédents avec la lumière, le groupe bloquant ne l'avait pas fait. Pour eux, le ton était redondant.

            Vidéo

            Regardez la vidéo suivante pour une démonstration de blocage :

            La procédure de blocage démontre que la contiguïté temporelle entre les événements, même dans une relation prédictive, n'est pas suffisante pour que l'apprentissage se produise. Dans la deuxième phase de la procédure de blocage, le stimulus composé précède les États-Unis. Selon Pavlov, étant donné que les deux composantes sont contiguës aux États-Unis, les deux devraient s'y associer et éventuellement susciter des RC. La combinaison des résultats de Rescorla (1966) et de Kamin (1969) conduit à la conclusion que l'apprentissage se produit lorsque les individus obtiennent Nouveau informations leur permettant de prédire des événements qu'ils n'étaient pas en mesure de prévoir auparavant. Kamin a suggéré que cela ne se produit que lorsque nous sommes surpris. C'est-à-dire que tant que les événements se déroulent comme prévu, nous n'apprenons pas. Une fois que quelque chose d'inattendu se produit, les individus recherchent des informations pertinentes. Beaucoup de nos activités peuvent être décrites comme « habituelles » (Kirsch, Lynn, Vigorito et Miller, 2004) ou « automatiques » (Aarts et Dijksterhuis, (2000). Nous avons tous eu l'expérience de faire du vélo ou de conduire comme si nous sommes sur "pilote automatique". Nous ne sommes pas consciemment engagés dans le pilotage tant que les événements se déroulent normalement. Une fois que quelque chose d'inattendu se produit, nous attirons notre attention et nous nous concentrons sur les circonstances environnementales immédiates. Cela offre la possibilité d'acquérir de nouvelles informations. C'est une compréhension beaucoup plus active et adaptative de l'apprentissage prédictif que celle fournie par le modèle de substitution de stimulus de Pavlov (voir Rescorla, 1988).

            La réponse conditionnée doit-elle ressembler à la réponse inconditionnée ?

            Nous allons maintenant examiner la quatrième hypothèse de ce modèle, à savoir que la réponse conditionnée ressemble toujours à la réponse inconditionnée. La poudre de viande provoque par réflexe la salivation et Pavlov a observé la même réaction à un stimulus conditionné prédictif de la poudre de viande. Les bouffées d'air provoquent par réflexe des clignements des yeux et des tapes sur le genou provoquent des secousses du genou. Les réponses conditionnées sont similaires aux réponses non conditionnées dans la recherche impliquant des bouffées d'air et des coups de genou comme stimuli non conditionnés. Il est compréhensible que Pavlov et d'autres aient cru pendant si longtemps que la réponse conditionnée doit ressembler sinon être identique à la réponse inconditionnée. Cependant, Zener (1937) a filmé des chiens soumis à un conditionnement salivaire et n'était pas d'accord avec cette conclusion. Il a observé : « Malgré les affirmations de Pavlov, le chien ne semble pas manger une nourriture imaginaire. C'est une réponse différente, anthropomorphiquement descriptible comme la recherche, l'attente, la chute de la nourriture avec une volonté d'adopter le comportement alimentaire qui se produira lorsque la nourriture tombera.

            Kimble (1961, p. 54) a proposé l'interprétation possible que « la fonction de la réponse conditionnée est de préparer l'organisme à l'apparition du stimulus inconditionné ». Les recherches de Shepard Siegel (1975, 1977, 1984, 2005) ont fait basculer le pendule vers une large acceptation de cette interprétation de la nature de la réponse conditionnée. La recherche de Siegel impliquait l'administration d'un médicament comme stimulus inconditionné. Par exemple, des rats ont reçu une injection d'insuline en présence d'un nouveau stimulus (Siegel, 1975). L'insuline est un médicament qui abaisse le taux de sucre dans le sang et est souvent utilisé pour traiter les diabétiques. Finalement, une réponse conditionnée a été développée au nouveau stimulus (maintenant un CS). Cependant, plutôt que d'abaisser le taux de sucre dans le sang, le taux de sucre dans le sang augmenté au CS. Siegel a décrit cette augmentation comme une réponse compensatoire en préparation de l'effet de l'insuline. Il a fait valoir qu'il était similaire à d'autres mécanismes homéostatiques conçus pour maintenir des niveaux optimaux de processus biologiques (par exemple, la température, le nombre de globules blancs, les niveaux de liquide, etc.). Des réponses compensatoires similaires ont été démontrées avec la morphine, un médicament ayant des propriétés analgésiques (Siegel, 1977) et avec la caféine (Siegel, 2005). Siegel (2008) est allé jusqu'à suggérer que « le chercheur en apprentissage est un chercheur en homéostasie ».

            Siegel a développé un modèle fascinant et influent de tolérance aux médicaments et d'effets de surdosage basé sur ses découvertes concernant l'acquisition de réponses compensatoires (Siegel, 1983). Il a suggéré que de nombreuses surdoses d'héroïne sont en fait le résultat de la même dose consommée différemment ou dans un environnement différent. Un tel effet a en effet été démontré expérimentalement chez le rat. Alors que 34 pour cent des rats ayant reçu une dose d'héroïne plus élevée que d'habitude dans la même cage sont morts, 64 pour cent des rats ayant reçu la même dose dans une cage différente sont morts (Siegel, Hinson, Krank, & McCully, 1982). À titre expérimental, cette étude a une validité interne élevée mais n'a évidemment pas pu être répliquée avec des sujets humains. Dans une étude à haute validité externe, Siegel a interrogé des survivants d'overdoses d'héroïne présumées. La plupart ont insisté sur le fait qu'ils avaient pris la quantité habituelle mais ont indiqué qu'ils avaient utilisé une technique différente ou consommé la drogue dans un environnement différent (Siegel, 1984). Cette combinaison de résultats à validité externe élevée et à validité interne élevée constitue un argument convaincant en faveur du modèle d'apprentissage de Siegel sur la tolérance aux médicaments et les effets de surdosage.

            Les réponses compensatoires induites par les médicaments sont cohérentes avec l'interprétation selon laquelle la réponse conditionnée constitue une préparation au stimulus inconditionné. La combinaison de cette interprétation avec les conclusions tirées concernant la nécessité de la prédictivité pour que le conditionnement classique se produise conduit à l'alternative suivante au modèle de substitution de stimulus de Pavlov : Le conditionnement classique est un processus adaptatif par lequel les individus acquièrent la capacité de prédire les événements futurs et de se préparer à leur apparition..


            Possibilités d'accès

            Acheter un seul article

            Accès instantané à l'intégralité de l'article PDF.

            Le calcul des taxes sera finalisé lors du paiement.

            Abonnez-vous à la revue

            Accès en ligne immédiat à tous les numéros à partir de 2019. L'abonnement se renouvellera automatiquement chaque année.

            Le calcul des taxes sera finalisé lors du paiement.


            5. Composants clés, éléments, principes

            5.1. Analyse expérimentale du comportement

            5.1.1. Réponses suscitées : réflexes à un stimulus

            5.1.2. Réponses émises : comportements non associés à un stimulus

            5.1.2.1. Analyse expérimentale du comportement : manipulation d'événements observables dans un cadre contrôlé

            5.2. Conditionnement opérant

            5.2.1. Hypothèses du conditionnement opérant

            5.2.2. Principes de renforcement

            5.2.2.1. Caractéristiques du renforcement

            5.2.2.1.1. Le renforcement doit se produire immédiatement après l'opérant et est lié au comportement

            5.2.2.1.2. Le renforcement ne renforce pas la réponse mais augmente plutôt la probabilité de la réponse à l'avenir

            5.2.2.2. Facteurs affectant le renforcement :

            5.2.2.2.1. Niveau de compétence : la capacité de l'apprenant

            5.2.2.2.2. Histoire de renforcement : expériences antérieures des apprenants

            5.2.2.2.3. Dotation génétique : caractéristiques héritées de l'apprenant

            5.2.2.3. Types de renfort

            5.2.2.3.1. Renforceurs primaires : stimuli qui peuvent augmenter la fréquence des comportements sans entraînement

            5.2.2.3.2. Renforts Secondaires ou Conditionnés : sont associés à un renforçateur primaire et à un autre renforçateur conditionné

            5.2.2.3.3. Renforceurs généralisés : renforcements sociaux et manipulations des environnements physiques

            5.2.2.3.4. Renforcement positif : ajout d'un nouveau stimulus où la réponse produit un nouveau stimulus

            5.2.2.3.5. Renforcement négatif : suppression d'un objet ou d'un stimulus discriminant

            5.2.2.3.6. Punition : suppression d'un renforcement positif ou ajout d'un renforcement négatif

            5.3. Façonner

            5.3.1. Étapes d'un programme utilisant un calendrier de renforcement menant à la séquence comportementale suivante alors qu'une étape est une approximation successive de renforcement

            5.3.1.1. Types de calendrier de renforcement

            5.3.1.1.1. Barème à ratio variable : échelle de renforcement graduée fréquente puis décroissante

            5.3.1.1.2. Utilité négative : renforcement périodique

            5.3.1.2. Exemples de comportement de mise en forme

            5.3.1.3. Comportement gouverné par les contingences : les comportements appris sont plus précis grâce à des tests dans plusieurs contingences et conduisent à d'autres comportements

            5.3.1.4. Comportement régi par des règles : les conseils et les instructions fonctionnent comme des stimuli verbaux

            5.4. Stimuli discriminants

            5.4.1. Stimulus discriminant : stimuli qui sont constamment présents lors du renforcement de la réponse

            5.4.1.1. Objectif des stimuli discriminants :

            5.4.1.1.1. Induction ou généralisation des stimuli : lorsque plusieurs stimuli acquièrent le contrôle d'une réponse

            5.4.1.1.2. Utilisez en sélectionnant des stimuli discriminants pour devenir un signal pour le comportement souhaité.

            5.4.2. Transfert du contrôle des stimuli : dans le modèle scolaire traditionnel, l'échec de l'éducation réside dans l'incapacité de l'élève à transférer ce qui est appris

            5.4.2.1. La discrimination des stimuli doit précéder la généralisation des stimuli

            5.4.3. Pour éliminer un comportement indésirable, la brume développe un comportement avec des réponses incompatibles.

            5.4.4. Renforcements naturels : l'utilisation du comportement sert de renforcement afin qu'il n'y ait pas de rétroaction aversive. Cependant, le renforcement naturel seul ne suffit pas avec certaines compétences telles que la lecture et l'écriture.

            5.4.5. Renforcement artificiel : l'exemple de l'économie symbolique. Doit être progressivement éliminé une fois le comportement développé et soutenu par des renforçateurs naturels.

            5.4.6. renforçateurs de synchronisation : soutient l'ignorance planifiée, mais les enseignants doivent également surveiller le renforcement involontaire.


            Généralisation des repères

            Il a généralement été reconnu que la mémoire de la peur dépendante des signaux et du contexte est régulée par des mécanismes neurobiologiques qui se chevauchent, mais différents (Phillips et LeDoux, 1992 Frankland et al., 1998 Maren et Holt, 2004 Fanselow, 2010). Plus précisément, l'amygdale est essentielle dans l'acquisition, la consolidation et l'extinction de la peur contextuelle et dépendante des signaux, alors que l'hippocampe est généralement considéré comme essentiel dans la régulation de la peur contextuelle (Kim et al., 1993 Fanselow et Kim, 1994 Helmstetter et Bellgowan, 1994 Maren, 1999 Davis et Aggleton, 2000 Schafe et al., 2001 Walker et al., 2002 Phelps et al., 2004 Myers, 2006). Plusieurs études récentes ont examiné les mécanismes sous-jacents à la généralisation de la peur indicée à l'aide d'un entraînement à la discrimination indicée. Ces études montrent que les souris dépourvues de la forme 65 kD de l'acide glutamique décarboxylase (souris GAD65 −/−) qui est l'enzyme biosynthétique de l'acide γ-aminobutyrique (GABA), présentent une congélation réduite par rapport à leur type sauvage. frères et sœurs, suggérant une mémoire de peur réduite. Fait intéressant, les souris GAD65 −/− n'ont pas été en mesure de distinguer le CS− du CS+ lors des tests à 24 h ou 14 jours, ce qui suggère que la synthèse de GABA est non seulement critique pour une mémoire de peur appropriée, mais aussi pour le stimulus mémoire de peur spécifique (Bergado-Acosta et al., 2008). En plus de la synthèse du GABA, le GABA présynaptiqueB Les récepteurs semblent également jouer un rôle important dans la généralisation de la peur. Blocage pharmacologique du GABAB Les récepteurs de l'amygdale latérale permettent l'induction d'une LTP homosynaptique au niveau des afférences corticales lors de l'utilisation de protocoles de stimulation qui ne provoquent normalement pas de LTP (Shaban et al., 2006). Deux GABAB(1) les isoformes de sous-unités sont exprimées dans le cerveau, GABAB1(a), qui est sélectivement associé aux terminaisons présynaptiques, et GABAB1(b) qui est associée aux membranes postsynaptiques (Vigot et al., 2006). Dans l'amygdale latérale, GABAB1(a) Les récepteurs semblent être spécifiquement responsables de la LTP présynaptique au niveau des afférences cortico-amygdales, alors que GABAB1(b) Les récepteurs sont responsables de la LTP au niveau des afférences thalamiques, suggérant une régulation spécifique de la voie de la LTP dans l'amygdale latérale (Shaban et al., 2006). De plus, GABAB1(a) Les souris −/− affichent une généralisation de la peur dépendante de l'intensité du stimulus aux signaux CS− lorsqu'elles sont testées après un entraînement à la discrimination. Ces données suggèrent que l'inhibition présynaptique dans la voie cortico-amygdale est importante pour préserver la discrimination des stimuli pendant l'entraînement à la discrimination. De plus, l'absence d'inhibition présynaptique peut déplacer le seuil de généralisation de la peur vers des intensités américaines plus faibles.

            En plus de l'amygdale latérale et de l'amygdale basolatérale, le noyau central de l'amygdale (CeA) a été identifié comme une structure essentielle subissant une plasticité à l'appui de l'apprentissage de la peur (Jasnow et Huhman, 2001 Samson et Pare, 2005 Wilensky et al., 2006 ). Le CeA est principalement composé de neurones inhibiteurs GABA-ergiques, dont la subdivision médiale du CeA (Cem) est sous inhibition tonique par le CeA latéral/capsulaire (Cel Cassell et al., 1986 Sun et Cassell, 1993 Ciocchi et al. ., 2010 Haubensak et al., 2010). Utiliser une tâche de discrimination et in vivo enregistrements électrophysiologiques, Ciocchi et al. (2010) ont montré qu'une diminution de l'activité tonique des neurones Cem était associée à une généralisation au CS−. L'inverse était vrai pour le Cel, une augmentation de l'activité tonique était associée à une généralisation. De plus, les changements dans l'activité tonique du Cel étaient plus élevés chez les souris généralisantes. Ces données suggèrent que la spécificité des réponses de peur peut être partiellement régulée par des changements d'activité au sein des circuits neuronaux inhibiteurs de la CeA. Les changements d'activité entre ces sous-noyaux peuvent réguler le rapport signal/bruit des stimuli de peur, et ainsi jouer un rôle dans la sortie comportementale spécifique au stimulus (Ciocchi et al., 2010). La généralisation à des signaux effrayants peut également recruter l'activité de régions cérébrales supplémentaires, y compris le noyau du lit de la strie terminale (BNST). Les rats lésés par le BNST se sont moins figés sur le CS− et ont pu faire la distinction entre un CS+ et un CS−, tandis que les rats simulés affichent un continuum de réponses, allant d'une généralisation élevée à faible (Duvarci et al., 2009). Sur la base des données limitées disponibles, il semble que le réseau inhibiteur au sein de l'amygdale joue un rôle essentiel dans la régulation des réponses comportementales spécifiques au stimulus et limite finalement la généralisation. De plus, le recrutement du BNST, impliqué dans la régulation de l'anxiété, peut contribuer à la généralisation de la peur. Ceci est également vrai pour la généralisation des réponses comportementales suite à une défaite sociale. Dans les modèles de défaite sociale, les animaux sont vaincus dans un contexte par un individu conspécifique puis testés dans un autre contexte avec un nouveau stimulus conspécifique (Huhman et al., 2003 Jasnow et al., 2004). La modulation de l'activité du BNST conduit à une réduction des effets comportementaux de la défaite lorsque les animaux sont testés dans un contexte alternatif et avec un nouvel animal stimulus (Jasnow et al., 2004). Il faut noter que bon nombre de ces études discutées ci-dessus ont utilisé une formation à la discrimination, qui n'aborde pas la question de la généralisation à de nouveaux indices. Cependant, il est probable que la généralisation à de nouveaux indices implique des mécanismes neurobiologiques similaires à ceux décrits dans les études ci-dessus.

            La généralisation de la peur contextuelle implique probablement la transformation d'informations contextuelles spécifiques dans l'hippocampe en informations schématiques ou de type essentiel dans le néocortex. Les souvenirs de peur signalés subissent-ils une transformation similaire à mesure que la trace mémorielle passe d'une représentation spécifique à une représentation générale, comme c'est le cas pour les souvenirs contextuels ? Si oui, les mêmes régions cérébrales néocorticales (ACC, infralimbique et prélimbique) sont-elles impliquées dans la mémoire généralisée ? L'amygdale est une structure de type corticale avec des circuits intrinsèques similaires mais sans organisation laminaire (McDonald, 1989, 1996 McDonald et Pearson, 1989 McDonald et Mascagni, 2001, 2002 Mascagni et McDonald, 2003 Jasnow et al., 2009). Plusieurs éléments de preuve suggèrent que le complexe latéral et/ou basolatéral de l'amygdale peut être le lieu de stockage de la mémoire de la peur (Schafe et al., 2005 Kwon et Choi, 2009 Poulos et al., 2009). Alternativement, l'amygdale peut moduler des souvenirs qui sont stockés dans le cortex (McGaugh, 2004 Chavez et al., 2009). Une autre possibilité est que les souvenirs de peur signalés se généralisent à mesure que se produit une perte d'inhibition anticipée sur les interneurones exprimant la parvalbumine, similaire à ce qui a été observé dans l'hippocampe (Ruediger et al., 2011). Ainsi, il est possible que les souvenirs de peur signalés subissent une transformation d'une représentation spécifique à un signal à une représentation générale au sein de la même région et puissent se produire à un rythme plus rapide que les souvenirs contextuels. Alternativement, la généralisation de la peur signalée peut être due à des changements dans les structures afférentes ou efférentes avec des connexions directes avec l'amygdale, telles que le thalamus auditif ou le cortex auditif (Weinberger, 2007). Dans le cas du thalamus auditif, une généralisation accrue de la peur à des tons alternatifs qui n'étaient pas auparavant associés à un choc a été observée à la suite d'une surexpression accrue de la protéine de liaison à l'élément de réponse à l'AMPc (CREB) dans le noyau genouillé médian (Han et al., 2008 ). Cela permettrait une généralisation relativement rapide des réponses de peur à des signaux alternatifs, car l'élargissement du réglage du thalamus auditif peut se produire pendant ou peu de temps après le conditionnement.


            Le rôle de la nature dans le conditionnement classique

            Comme nous l'avons vu au chapitre 1 « Introduction à la psychologie », les scientifiques associés à l'école comportementaliste ont soutenu que tout apprentissage est guidé par l'expérience et que la nature ne joue aucun rôle. Le conditionnement classique, basé sur l'apprentissage par l'expérience, représente un exemple de l'importance de l'environnement. Mais le conditionnement classique ne peut pas être entièrement compris en termes d'expérience. La nature joue également un rôle, car notre histoire évolutive nous a permis d'apprendre certaines associations mieux que d'autres.

            Les psychologues cliniciens utilisent le conditionnement classique pour expliquer l'apprentissage d'une phobie —une peur forte et irrationnelle d'un objet, d'une activité ou d'une situation spécifique. Par exemple, conduire une voiture est un événement neutre qui ne provoquerait normalement pas de réaction de peur chez la plupart des gens. Mais si une personne subit une attaque de panique au cours de laquelle elle ressent soudainement de fortes émotions négatives en conduisant, elle peut apprendre à associer la conduite à la réaction de panique. La conduite est devenue la CS qui crée désormais la réaction de peur.

            Les psychologues ont également découvert que les gens ne développent pas de phobies pour n'importe quoi. Bien que les gens puissent dans certains cas développer une phobie de la conduite, ils sont plus susceptibles de développer des phobies envers les objets (tels que les serpents, les araignées, les hauteurs et les espaces ouverts) qui ont été dangereux pour les gens dans le passé. Dans la vie moderne, il est rare que les humains soient mordus par des araignées ou des serpents, qu'ils tombent d'arbres ou de bâtiments, ou qu'ils soient attaqués par un prédateur dans un espace ouvert. Être blessé en conduisant une voiture ou être coupé par un couteau est beaucoup plus probable.Mais dans notre passé évolutif, le potentiel d'être mordu par des serpents ou des araignées, de tomber d'un arbre ou d'être piégé dans un espace ouvert étaient des préoccupations évolutives importantes, et donc les humains sont toujours prêts à apprendre ces associations par rapport aux autres (Öhman & Mineka, 2001 LoBue & DeLoache, 2010).

            Un autre type de conditionnement important sur le plan de l'évolution est le conditionnement lié à la nourriture. Dans ses importantes recherches sur le conditionnement des aliments, John Garcia et ses collègues (Garcia, Kimeldorf, & Koelling, 1955 Garcia, Ervin, & Koelling, 1966) ont tenté de conditionner les rats en présentant soit un goût, une vue ou un son comme un stimulus avant que les rats reçoivent des médicaments (aux États-Unis) qui les rendent nauséeux. Garcia a découvert que le conditionnement du goût était extrêmement puissant : le rat a appris à éviter le goût associé à la maladie, même si la maladie survenait plusieurs heures plus tard. Mais conditionner la réponse comportementale de la nausée à une vue ou à un son était beaucoup plus difficile. Ces résultats contredisaient l'idée que le conditionnement se produit entièrement à la suite d'événements environnementaux, de sorte qu'il se produirait également pour tout type de stimulus inconditionné qui suivrait tout type de stimulus conditionné. Au contraire, les recherches de Garcia ont montré que la génétique compte : les organismes sont préparés de manière évolutive à apprendre certaines associations plus facilement que d'autres. Vous pouvez voir que la capacité d'associer les odeurs à la maladie est un mécanisme de survie important, permettant à l'organisme d'apprendre rapidement à éviter les aliments toxiques.

            Le conditionnement classique a également été utilisé pour aider à expliquer l'expérience du trouble de stress post-traumatique (TSPT), comme dans le cas de P. K. Philips décrit dans l'ouverture du chapitre. Le TSPT est un trouble anxieux grave qui peut se développer après une exposition à un événement effrayant, comme la menace de mort (American Psychiatric Association, 1994). Le TSPT survient lorsque l'individu développe une forte association entre les facteurs situationnels qui ont entouré l'événement traumatique (par exemple, les uniformes militaires ou les sons ou les odeurs de la guerre) et les États-Unis (le traumatisme effrayant lui-même). En raison du conditionnement, le fait d'être exposé à, ou même de penser à la situation dans laquelle le traumatisme s'est produit (la SC), devient suffisant pour produire le RC d'anxiété sévère (Keane, Zimering, & Caddell, 1985).

            Le trouble de stress post-traumatique (TSPT) représente un cas de conditionnement classique à un traumatisme grave qui ne s'éteint pas facilement. Dans ce cas, la réaction de peur originelle, ressentie pendant le combat, est devenue conditionnée à un bruit fort. Lorsque la personne atteinte du SSPT entend un bruit fort, elle éprouve une réaction de peur même si elle est maintenant loin du site du traumatisme initial.

            Marc Wathieu – Luigi Coppola – CC BY-NC 2.0.

            Le SSPT se développe parce que les émotions vécues pendant l'événement ont produit une activité neuronale dans l'amygdale et créé un apprentissage conditionné fort. En plus du fort conditionnement que subissent les personnes atteintes du TSPT, ils présentent également une extinction plus lente dans les tâches de conditionnement classiques (Milad et al., 2009). En bref, les personnes atteintes du SSPT ont développé des associations très fortes avec les événements entourant le traumatisme et sont également lentes à montrer l'extinction du stimulus conditionné.

            Points clés à retenir

            • Dans le conditionnement classique, une personne ou un animal apprend à associer un stimulus neutre (le stimulus conditionné, ou CS) à un stimulus (le stimulus inconditionné, ou US) qui produit naturellement un comportement (la réponse inconditionnée, ou UR). À la suite de cette association, le stimulus auparavant neutre en vient à susciter la même réponse (la réponse conditionnée, ou CR).
            • L'extinction se produit lorsque le CS est présenté à plusieurs reprises sans les États-Unis, et le CR disparaît finalement, bien qu'il puisse réapparaître plus tard dans un processus connu sous le nom de récupération spontanée.
            • La généralisation du stimulus se produit lorsqu'un stimulus similaire à un stimulus déjà conditionné commence à produire la même réponse que le stimulus original.
            • La discrimination des stimuli se produit lorsque l'organisme apprend à faire la différence entre le CS et d'autres stimuli similaires.
            • Dans le conditionnement de second ordre, un stimulus neutre devient un CS après avoir été associé à un CS préalablement établi.
            • Certains stimuli - des paires de réponses, comme celles entre l'odorat et la nourriture - sont plus facilement conditionnés que d'autres car ils ont été particulièrement importants dans notre passé évolutif.

            Exercices et pensée critique

            1. Un enseignant place des étoiles dorées au tableau lorsque les élèves sont calmes et attentifs. Finalement, les élèves commencent à devenir silencieux et attentifs chaque fois que l'enseignant s'approche du tableau. Pouvez-vous expliquer le comportement des élèves en termes de conditionnement classique ?
            2. Rappelez-vous un moment de votre vie, peut-être quand vous étiez enfant, où vos comportements étaient influencés par le conditionnement classique. Décrivez en détail la nature des stimuli inconditionnés et conditionnés et la réponse, en utilisant les termes psychologiques appropriés.
            3. Si le trouble de stress post-traumatique (TSPT) est un type de conditionnement classique, comment les psychologues pourraient-ils utiliser les principes du conditionnement classique pour traiter le trouble ?

            La généralisation des stimuli est-elle acquise en raison de l'incapacité à discriminer les stimuli ? - Psychologie

            Résumé

            De nombreuses études, tant en éthologie qu'en psychologie comparée, ont montré que les animaux réagissent à des modifications de stimuli familiers. Ce phénomène est souvent qualifié de généralisation. La plupart des modifications conduisent à une diminution de la réponse, mais à certains nouveaux stimuli une augmentation de la réponse est observée. Cela vaut à la fois pour le comportement inné et appris. Nous proposons ici une approche heuristique du contrôle des stimuli, ou sélection des stimuli, dans le but d'expliquer ces phénomènes. Le modèle comporte deux éléments clés. Premièrement, nous choisissons le niveau du récepteur comme espace de stimulus fondamental. Chaque stimulus est représenté par le schéma d'activation qu'il induit dans les organes des sens. Deuxièmement, dans cet espace, nous introduisons une mesure simple de « similarité » entre les stimuli en calculant comment les modèles d'activation se chevauchent. Le principal avantage que nous reconnaissons dans cette approche est que la généralisation des réponses acquises émerge de quelques principes simples qui sont fondés sur la reconnaissance de la façon dont les animaux perçoivent réellement les stimuli. De nombreux problèmes traditionnels auxquels sont confrontées les théories du contrôle des stimuli (par exemple la théorie de Spence-Hull de l'interaction de gradient ou les théories éthologiques de la sommation des stimuli) ne se posent pas dans le présent cadre. Ces problèmes incluent la quantité de généralisation selon différentes dimensions, les phénomènes de décalage de pic (en ce qui concerne à la fois les décalages positifs et négatifs), la généralisation de l'intensité et la généralisation après conditionnement sur deux stimuli positifs.

            Pour soumettre une demande de mise à jour ou de retrait de ce document, veuillez soumettre une demande de mise à jour/correction/suppression.

            Articles suggérés

            Citations

            1. (1975). Une évaluation de l'hypothèse du conflit comme principe explicatif de l'évolution des affichages. Dans Fonction et évolution du comportement (Ed.
            2. (1970). Comportement des animaux. Tokyo : McGraw-Hill Kogakusha, Ltd., 2e édition.
            3. (1999). Les réseaux de neurones artificiels comme modèles de contrôle des stimuli.
            4. (1987). Processus d'attention et d'apprentissage dans l'identification et la catégorisation des stimuli intégraux.
            5. (1977). Généralisation de l'intensité auditive après entraînement à la différenciation CER.
            6. (1956). Discriminabilité et généralisation des stimuli.
            7. (1968). L'entraînement à la discrimination comme la somme de l'excitation et de l'inhibition.
            8. (1960). Effet de la formation à la discrimination sur la généralisation auditive.
            9. (1965). Effets de la formation de discrimination sur la généralisation à partir du taux de référence positif.
            10. (1959). Effets de la formation à la discrimination sur la généralisation des stimuli.
            11. (1980). Enquist : La géométrie du contrôle du stimulus
            12. (1962). Gradients de généralisation de l'inhibition suite à un entraînement à la discrimination auditive.
            13. (1976). Formation aux étiquettes et généralisation auditive.
            14. (1973). Décalage de pointe: un examen.
            15. (1973). Gradients post-discrimination de sujets humains sur un continuum de tons.
            16. (1978). Décalage post-discrimination du poisson rouge (Carassius Auratus) sur un continuum de longueur d'onde visuelle.
            17. (1972). Prédiction du décalage de pic chez les pigeons à partir des gradients d'excitation et d'inhibition.
            18. (1943). Principes de comportement.
            19. (1989). Sensation et perception.
            20. (1994). Similarité et discrimination : un examen sélectif et un modèle connexionniste.
            21. (1975). Quelques effets du renforcement indépendant de la réponse dans les gradients de généralisation auditive.
            22. (1975). Données à l'état d'équilibre et modèle quantitatif de généralisation et de discrimination opérantes.
            23. (1973). Contrôle du stimulus du comportement d'évitement chez les rats après un entraînement pavlovien différentiel ou non différentiel le long des dimensions du stimulus conditionné.
            24. (1957). Généralisation des stimuli après un entraînement égal sur deux stimuli.
            25. (1959). Généralisation des stimuli après entraînement sur trois stimuli : un test de l'hypothèse de sommation.
            26. (1949). Généralisation du stimulus des réponses conditionnées.
            27. (1963). Théorie de l'échantillonnage de stimulus.
            28. (1973). Sélection de stimulation.
            29. (1982). Le goéland argenté et son œuf.
            30. (1974). La psychologie de l'apprentissage des animaux.

            Liens utiles

            Vous écrivez sur CORE ?

            Découvrez nos résultats de recherche et citez nos travaux.

            CORE est un service à but non lucratif fourni par l'Open University et Jisc.


            Discussion

            La confiance est une composante fondamentale de la vie sociale humaine (45). Cependant, on comprend peu de choses sur les mécanismes cognitifs et neuronaux qui soutiennent l'apprentissage de la confiance en l'absence d'informations explicites sur la réputation. Ici, nous démontrons qu'un mécanisme lié à la généralisation de la valeur associative - un processus documenté à travers les espèces - est également déployé chez l'homme dans des environnements de prise de décision sociale très complexes. Nous constatons que l'on fait davantage confiance aux étrangers ressemblant davantage à des personnes antérieurement connues pour être dignes de confiance et que ceux qui ressemblent à des personnes précédemment connues pour être indignes de confiance sont moins dignes de confiance. Ces profils d'ajustement comportemental sont déployés de manière asymétrique, de sorte que les individus sont davantage méfiés lorsqu'ils ressemblent même un peu à quelqu'un qui était auparavant associé à des résultats peu fiables et aversifs. Une généralisation plus large dans le domaine aversif s'accorde avec l'idée qu'identifier incorrectement un stimulus dangereux comme sûr est plus coûteux que de traiter un stimulus sûr comme une menace (46). Ces profils de réglage comportemental se sont reflétés au niveau neuronal. Dans le domaine perceptuel, le rôle fonctionnel de l'amygdale dans le suivi du manque de confiance était soutenu à la fois par l'augmentation de l'activité BOLD univariée et par la similarité du modèle d'activation multivariée, de sorte que les modèles de représentation neuronale étaient induits de manière graduée le long du gradient non digne de confiance.

            Ces résultats prolongent les travaux antérieurs liant l'amygdale au traitement des menaces et aux jugements de fiabilité (32 ⇓ -34), révélant que non seulement son activité hémodynamique reflète l'implication dans l'extraction d'informations sur le manque de confiance d'un individu (20), mais qu'elle code également fonctionnellement des informations sur manque de confiance au niveau de la représentation. Cette analyse fonctionnelle de niveau supérieur permet une approche fine pour déduire les états mentaux, démontrant que l'amygdale représente des informations critiques sur les individus potentiellement menaçants. Lorsqu'elle perçoit un étranger qui ressemble à un individu du passé indigne de confiance, l'amygdale évoque un modèle de représentations BOLD similaires aux représentations qui soutiennent l'apprentissage initial. La preuve d'un profil d'accord neuronal retraçant la similitude perceptive de manière graduée (15) implique que l'amygdale code sélectivement le transfert de valeur sociale négative entre des individus qui se ressemblent perceptuellement.

            Nous avons en outre observé que les profils de réglage neuronal dans le caudé et le vmPFC suivent les schémas comportementaux pour choisir des partenaires qui pourraient obtenir des résultats positifs et éviter les partenaires qui pourraient produire des résultats négatifs, respectivement. Ces résultats indiquent qu'en l'absence d'informations directes et explicites sur la réputation d'un individu, les décisions adaptatives de faire confiance ou de refuser la confiance reposent sur des modèles d'activation similaires à ceux suscités lors de l'apprentissage d'autres individus non apparentés, mais perceptuellement familiers. Ces profils de réglage neuronal de choix capturent le comportement au-delà du simple suivi de la similitude perceptive, révélant qu'au niveau neuronal, un mécanisme d'apprentissage associatif déploie efficacement les informations morales encodées à partir d'expériences passées pour guider les choix futurs.

            Ensemble, ces résultats suggèrent que pour décider à qui faire confiance, les humains s'appuient sur une heuristique d'apprentissage efficace, bien que rudimentaire, qui facilite l'engagement adaptatif. Un mécanisme de généralisation basé sur la similitude peut être hautement adaptatif car il permet à de nombreux stimuli - dans ce cas, des individus inconnus - d'acquérir de la valeur à partir d'un apprentissage minimal. Même sans aucune expérience directe du manque de confiance, les individus implicitement considérés comme potentiellement non dignes de confiance sont systématiquement évités. Des travaux futurs visant à déterminer si les taux d'apprentissage initiaux biaisent l'efficacité de la généralisation seraient une prochaine étape importante pour comprendre si des contextes spécifiques facilitent un apprentissage rapide. Il est important de noter que notre tâche s'écarte des tâches de généralisation de stimulus canoniques dans lesquelles les nouveaux stimuli sont souvent perçus comme se chevauchant explicitement avec le stimulus initial. Les sujets de nos expériences pensaient qu'ils sélectionnaient de vrais partenaires pour le prochain jeu et traitaient donc chaque partenaire potentiel comme unique. Cela indique que même en l'absence de conscience, l'apprentissage social s'appuie sur des processus neuronaux qui font des comparaisons entre les expériences actuelles et passées pour biaiser les décisions quant à savoir à qui faire confiance. En fin de compte, la découverte que les choix sociaux complexes et dyadiques semblent être soutenus par des mécanismes comportementaux et neuronaux qui opèrent à travers les domaines et les espèces suggère qu'un système de domaine général régit de nombreux types d'apprentissage émotionnel.


            Procédures de conditionnement classiques et paradigme de Shipley-Lumsdaine

            En 1935, Walter C. Shipley a publié un article empirique sur ce qu'il a appelé le conditionnement indirect qui aurait une grande influence sur la recherche sur la généralisation médiatisée. Dans cet article, Shipley a utilisé la terminologie et les procédures du conditionnement classique ou répondant, le comportement étant conceptualisé comme des préparations suscitées et expérimentales mises en place pour établir une réponse conditionnée par l'appariement de stimuli. L'étude cible de l'article, par Shipley appelée Groupe A, est illustrée dans la partie supérieure gauche du tableau ​ Tableau1. 1 . Dans cette étude, des étudiants de sexe masculin ont été exposés à une procédure établissant un clin d'œil comme réponse conditionnée à un son de sonnerie et à une lumière clignotante. Cela a été fait en associant ces deux stimuli initialement neutres au stimulus inconditionnel consistant à frapper la joue du participant avec une petite tige métallique. Le flash a ensuite été associé à un léger choc électrique au doigt du participant&# x02019s, ce dernier étant un stimulus inconditionnel provoquant le retrait du doigt. À la suite de ces appariements de stimulus, le flash a suscité à la fois le clignement de réponse conditionné et le retrait de la réponse conditionnée du doigt, tandis que le bourdonnement a suscité un clignement. Shipley a ensuite recherché si le retrait du doigt s'était produit en présence du bourdonnement, un stimulus qui n'avait jamais été associé au choc. Six des 10 participants ont retiré leur doigt sur présentation du buzz. Shipley a qualifié le phénomène de conditionnement indirect, car il supposait que le buzz provoquait la réponse de retrait non pas à cause d'un historique d'apprentissage l'associant directement à un stimulus inconditionné, mais en raison de sa relation avec un autre stimulus, le flash, qui avait été associé à un stimulus inconditionné. , le choc.

            Tableau 1

            Groupe A et groupe C dans Shipley (1935) illustrés avec et sans variables médiatrices non observées

            ProcédureInterprétation de la généralisation médiatisée
            CSnousRCSnous[Médiateur R][Médiateur S]R
            Groupeਊ
              Phase 1BourdonnerFrapperClin d'œilBourdonnerFrapperClin d'œil
              Phase 2ÉclatFrapperClin d'œilÉclatFrapperClin d'œil
              Phase 3ÉclatChocRetraitÉclatChoc[Clin d'œil][Clin d'œil]Retrait
              TestBourdonnerRetraitBourdonner[Clin d'œil][Clin d'œil]Retrait
            Groupe C
              Phase 1BourdonnerFrapperClin d'œilBourdonnerFrapperClin d'œil
              Phase 2FrapperClin d'œilFrapperClin d'œil
              Phase 3ÉclatChocRetraitÉclatChoc[Clin d'œil][Clin d'œil]Retrait
              TestBourdonnerRetraitBourdonner[Clin d'œil][Clin d'œil]Retrait

            Le côté gauche du tableau montre la procédure et les résultats, tandis que le côté droit montre la procédure et les résultats avec les variables médiatrices non observées indiquées entre parenthèses. CS stimulus conditionné, nous stimulus inconditionnel, R réponse, S stimulus

            Au début, Shipley ne considérait pas les résultats du groupe A comme particulièrement déroutants, et il n'a pas non plus conclu que les résultats étaient difficiles à expliquer en utilisant le cadre théorique dans lequel il travaillait. Il a proposé que la réponse dérivée observée lorsque le bourdonnement a provoqué le retrait du doigt se produisait parce que (a) deux stimuli (flash et bourdonnement) étaient entrés dans la même classe lors de l'acquisition de la même fonction (clin d'œil), et (b) qu'une fonction (retrait du doigt ) établi plus tard pour un membre d'une telle classe de stimulus a entraîné une propagation de contrôle de stimulus similaire à d'autres membres de cette classe. Cette explication est pratiquement identique aux définitions de l'équivalence fonctionnelle ou acquise dans la littérature contemporaine sur le contrôle des stimuli (Dougher & Markham, 1994 Urcuioli, 2006). Après la production réussie de conditionnement indirect dans le groupe A, Shipley a continué à étudier le comportement d'autres participants dans plusieurs conditions de contrôle. Ces conditions de contrôle ont eu pour résultat que peu de participants ont répondu d'une manière indicative d'un conditionnement indirect, mais une condition s'est avérée être une exception. Dans cette condition, appelée Groupe C et illustrée dans la partie inférieure gauche du Tableau ​ Tableau1, 1 , une frappe à la joue était associée à un bourdonnement, suivi d'un jumelage d'un flash avec un choc. Pour rendre la procédure aussi similaire que possible au groupe A, elle comprenait également des présentations de la frappe seule sans l'associer à un autre stimulus. La procédure a abouti, comme prévu, au clignotement de la réponse conditionnée provoqué par le bourdonnement et au retrait du doigt de la réponse conditionnée par le flash. Comme pour le groupe A, le retrait du doigt a ensuite été évalué lors de la présentation du buzz. Contrairement aux attentes de Shipley,ਇ des 10 participants ont retiré leur doigt lorsque le buzz a été présenté. Cette découverte ne pouvait pas être expliquée par l'équivalence fonctionnelle, car le buzz et le flash n'ont jamais été établis comme membres de la même classe de stimulus.

            Pour expliquer les résultats du groupe C, Shipley a proposé que le choc ait provoqué non seulement le retrait du doigt, mais aussi un clin d'œil non observé en tant que réponse inconditionnée. En outre, inspiré par la réflexion de Hull&# x02019s sur les effets comportementaux de la stimulation kinesthésique ou proprioceptive (Hull, 1931), Shipley a suggéré que le clin d'œil en tant que réponse était également un stimulus capable de susciter une réponse supplémentaire et est venu à arbitrer la réponse en présence de la bourdonner. La procédure de conditionnement et les réponses qui en résultent, y compris le clin d'œil médiateur invoqué, sont illustrées dans la partie inférieure droite du tableau ​ Tableau1. 1 . Selon Shipley, la présentation du choc dans l'appariement flash a entraîné un clin d'œil non observé en réponse. Comme le clin d'œil non observé était également considéré comme un stimulus kinesthésique, son appariement avec le choc lui a également donné la fonction de provoquer le retrait du doigt par le conditionnement classique. L'appariement ultérieur du buzz-strike a entraîné, comme prévu, le clin d'œil provoqué par le buzz, mais une fois qu'il s'est produit, le clin d'œil provoquerait alors comme stimulus le retrait du doigt. En somme, le retrait du doigt en présence du buzz a été expliqué par Shipley comme médiatisé par un événement non observé, le clin d'œil.

            Shipley a ensuite réinterprété les résultats du groupe A en utilisant le clin d'œil médiateur comme variable explicative. Cette interprétation est illustrée dans la partie supérieure droite du tableau ​ Tableau1. 1 . Comme décrit ci-dessus, la procédure pour le groupe A impliquait l'appariement d'un flash et d'un bourdonnement à une frappe, entraînant le déclenchement d'un clin d'œil en présence des deux stimuli. Cela a été suivi par l'appariement d'un flash à un choc, entraînant le retrait du doigt en présence du flash. Une réponse dérivée a ensuite été observée lorsque le bourdonnement a provoqué le retrait du doigt. Selon la réinterprétation de Shipley, le choc dans l'appariement de choc flash, comme dans le groupe C, a suscité un clin d'œil non observé en tant que réponse inconditionnée au choc. Lorsque, dans le test de réponse dérivée, le bourdonnement a suscité le clin d'œil en raison de son appariement précédent avec la frappe, le clin d'œil en tant que stimulus a davantage suscité la réponse de retrait du doigt. Encore une fois, le retrait du doigt en présence du bourdonnement a été expliqué comme médié par le clin d'œil non observé.

            Comme l'interprétation de la médiation pouvait expliquer à la fois la réponse dérivée des participants du groupe A et du groupe C, Shipley a conclu que cette explication avait une plus grande généralité que celle basée sur l'équivalence fonctionnelle et devrait être préférée. Contrairement à une explication basée sur l'équivalence fonctionnelle, cependant, cette explication incluait une variable médiatrice qui n'était pas observée. Une réplication de l'étude Shipley&# x02019s par Lumsdaine (1939), cependant, a rapporté des observations de clins d'œil pendant l'appariement flash&# x02013shock et la réponse dérivée. L'étude de Lumsdaine&# x02019, cependant, n'a été rapportée que comme un résumé des actes d'une conférence, de sorte que les données réelles semblent être perdues. Quoi qu'il en soit, le dispositif expérimental et le mécanisme de médiation proposé rapportés dans Shipley (1935) et Lumsdaine (1939) sont devenus connus sous le nom de paradigme Shipley-Lumsdaine.


            Procédures de conditionnement classiques et paradigme de Shipley-Lumsdaine

            En 1935, Walter C. Shipley a publié un article empirique sur ce qu'il a appelé le conditionnement indirect qui aurait une grande influence sur la recherche sur la généralisation médiatisée. Dans cet article, Shipley a utilisé la terminologie et les procédures du conditionnement classique ou répondant, le comportement étant conceptualisé comme des préparations suscitées et expérimentales mises en place pour établir une réponse conditionnée par l'appariement de stimuli. L'étude cible de l'article, par Shipley appelée Groupe A, est illustrée dans la partie supérieure gauche du tableau ​ Tableau1. 1 . Dans cette étude, des étudiants de sexe masculin ont été exposés à une procédure établissant un clin d'œil comme réponse conditionnée à un son de sonnerie et à une lumière clignotante. Cela a été fait en associant ces deux stimuli initialement neutres au stimulus inconditionnel consistant à frapper la joue du participant avec une petite tige métallique. Le flash a ensuite été associé à un léger choc électrique au doigt du participant&# x02019s, ce dernier étant un stimulus inconditionnel provoquant le retrait du doigt. À la suite de ces appariements de stimulus, le flash a suscité à la fois le clignement de réponse conditionné et le retrait de la réponse conditionnée du doigt, tandis que le bourdonnement a suscité un clignement. Shipley a ensuite recherché si le retrait du doigt s'était produit en présence du bourdonnement, un stimulus qui n'avait jamais été associé au choc. Six des 10 participants ont retiré leur doigt sur présentation du buzz. Shipley a qualifié le phénomène de conditionnement indirect, car il supposait que le buzz provoquait la réponse de retrait non pas à cause d'un historique d'apprentissage l'associant directement à un stimulus inconditionné, mais en raison de sa relation avec un autre stimulus, le flash, qui avait été associé à un stimulus inconditionné. , le choc.

            Tableau 1

            Groupe A et groupe C dans Shipley (1935) illustrés avec et sans variables médiatrices non observées

            ProcédureInterprétation de la généralisation médiatisée
            CSnousRCSnous[Médiateur R][Médiateur S]R
            Groupeਊ
              Phase 1BourdonnerFrapperClin d'œilBourdonnerFrapperClin d'œil
              Phase 2ÉclatFrapperClin d'œilÉclatFrapperClin d'œil
              Phase 3ÉclatChocRetraitÉclatChoc[Clin d'œil][Clin d'œil]Retrait
              TestBourdonnerRetraitBourdonner[Clin d'œil][Clin d'œil]Retrait
            Groupe C
              Phase 1BourdonnerFrapperClin d'œilBourdonnerFrapperClin d'œil
              Phase 2FrapperClin d'œilFrapperClin d'œil
              Phase 3ÉclatChocRetraitÉclatChoc[Clin d'œil][Clin d'œil]Retrait
              TestBourdonnerRetraitBourdonner[Clin d'œil][Clin d'œil]Retrait

            Le côté gauche du tableau montre la procédure et les résultats, tandis que le côté droit montre la procédure et les résultats avec les variables médiatrices non observées indiquées entre parenthèses. CS stimulus conditionné, nous stimulus inconditionnel, R réponse, S stimulus

            Au début, Shipley ne considérait pas les résultats du groupe A comme particulièrement déroutants, et il n'a pas non plus conclu que les résultats étaient difficiles à expliquer en utilisant le cadre théorique dans lequel il travaillait. Il a proposé que la réponse dérivée observée lorsque le bourdonnement a provoqué le retrait du doigt se produisait parce que (a) deux stimuli (flash et bourdonnement) étaient entrés dans la même classe lors de l'acquisition de la même fonction (clin d'œil), et (b) qu'une fonction (retrait du doigt ) établi plus tard pour un membre d'une telle classe de stimulus a entraîné une propagation de contrôle de stimulus similaire à d'autres membres de cette classe. Cette explication est pratiquement identique aux définitions de l'équivalence fonctionnelle ou acquise dans la littérature contemporaine sur le contrôle des stimuli (Dougher & Markham, 1994 Urcuioli, 2006). Après la production réussie de conditionnement indirect dans le groupe A, Shipley a continué à étudier le comportement d'autres participants dans plusieurs conditions de contrôle. Ces conditions de contrôle ont eu pour résultat que peu de participants ont répondu d'une manière indicative d'un conditionnement indirect, mais une condition s'est avérée être une exception. Dans cette condition, appelée Groupe C et illustrée dans la partie inférieure gauche du Tableau ​ Tableau1, 1 , une frappe à la joue était associée à un bourdonnement, suivi d'un jumelage d'un flash avec un choc. Pour rendre la procédure aussi similaire que possible au groupe A, elle comprenait également des présentations de la frappe seule sans l'associer à un autre stimulus. La procédure a abouti, comme prévu, au clignotement de la réponse conditionnée provoqué par le bourdonnement et au retrait du doigt de la réponse conditionnée par le flash. Comme pour le groupe A, le retrait du doigt a ensuite été évalué lors de la présentation du buzz. Contrairement aux attentes de Shipley,ਇ des 10 participants ont retiré leur doigt lorsque le buzz a été présenté. Cette découverte ne pouvait pas être expliquée par l'équivalence fonctionnelle, car le buzz et le flash n'ont jamais été établis comme membres de la même classe de stimulus.

            Pour expliquer les résultats du groupe C, Shipley a proposé que le choc ait provoqué non seulement le retrait du doigt, mais aussi un clin d'œil non observé en tant que réponse inconditionnée. En outre, inspiré par la réflexion de Hull&# x02019s sur les effets comportementaux de la stimulation kinesthésique ou proprioceptive (Hull, 1931), Shipley a suggéré que le clin d'œil en tant que réponse était également un stimulus capable de susciter une réponse supplémentaire et est venu à arbitrer la réponse en présence de la bourdonner. La procédure de conditionnement et les réponses qui en résultent, y compris le clin d'œil médiateur invoqué, sont illustrées dans la partie inférieure droite du tableau ​ Tableau1. 1 . Selon Shipley, la présentation du choc dans l'appariement flash a entraîné un clin d'œil non observé en réponse. Comme le clin d'œil non observé était également considéré comme un stimulus kinesthésique, son appariement avec le choc lui a également donné la fonction de provoquer le retrait du doigt par le conditionnement classique. L'appariement ultérieur du buzz-strike a entraîné, comme prévu, le clin d'œil provoqué par le buzz, mais une fois qu'il s'est produit, le clin d'œil provoquerait alors comme stimulus le retrait du doigt. En somme, le retrait du doigt en présence du buzz a été expliqué par Shipley comme médiatisé par un événement non observé, le clin d'œil.

            Shipley a ensuite réinterprété les résultats du groupe A en utilisant le clin d'œil médiateur comme variable explicative. Cette interprétation est illustrée dans la partie supérieure droite du tableau ​ Tableau1. 1 . Comme décrit ci-dessus, la procédure pour le groupe A impliquait l'appariement d'un flash et d'un bourdonnement à une frappe, entraînant le déclenchement d'un clin d'œil en présence des deux stimuli. Cela a été suivi par l'appariement d'un flash à un choc, entraînant le retrait du doigt en présence du flash. Une réponse dérivée a ensuite été observée lorsque le bourdonnement a provoqué le retrait du doigt. Selon la réinterprétation de Shipley, le choc dans l'appariement de choc flash, comme dans le groupe C, a suscité un clin d'œil non observé en tant que réponse inconditionnée au choc. Lorsque, dans le test de réponse dérivée, le bourdonnement a suscité le clin d'œil en raison de son appariement précédent avec la frappe, le clin d'œil en tant que stimulus a davantage suscité la réponse de retrait du doigt. Encore une fois, le retrait du doigt en présence du bourdonnement a été expliqué comme médié par le clin d'œil non observé.

            Comme l'interprétation de la médiation pouvait expliquer à la fois la réponse dérivée des participants du groupe A et du groupe C, Shipley a conclu que cette explication avait une plus grande généralité que celle basée sur l'équivalence fonctionnelle et devrait être préférée. Contrairement à une explication basée sur l'équivalence fonctionnelle, cependant, cette explication incluait une variable médiatrice qui n'était pas observée. Une réplication de l'étude Shipley&# x02019s par Lumsdaine (1939), cependant, a rapporté des observations de clins d'œil pendant l'appariement flash&# x02013shock et la réponse dérivée. L'étude de Lumsdaine&# x02019, cependant, n'a été rapportée que comme un résumé des actes d'une conférence, de sorte que les données réelles semblent être perdues. Quoi qu'il en soit, le dispositif expérimental et le mécanisme de médiation proposé rapportés dans Shipley (1935) et Lumsdaine (1939) sont devenus connus sous le nom de paradigme Shipley-Lumsdaine.


            • Acquisition
              • Période pendant laquelle une réponse est apprise
              • CS est associé à UCS pour établir un solide CR
              • Le plus rapide : jumelage de trace avant (CS apparaît avant UCS)
              • Plus lent : appairage simultané (CS apparaît avec UCS)
              • Le plus lent : appariement en amont (CS apparaît après UCS)
              • Généralement plus fort lorsque les appariements répétés, UCS intense et séquence impliquent un appariement avant avec une courte pause entre CS et UCS
              • Extinction – si CS est présenté à plusieurs reprises sans UCS, CR s'affaiblira et disparaîtra
                • Des essais d'extinction répétés accéléreront l'extinction
                • La RC issue de la récupération spontanée est généralement plus faible
                • L'extinction se produit plus rapidement
                • Généralisation des stimuli – une fois la CR acquise, l'organisme répondra à d'autres stimuli similaires à la CS d'origine
                  • Plus de chances de CR dans des CS plus similaires
                  • Conditionnement d'ordre supérieur - un stimulus neutre devient un CS après avoir été associé à un autre CS (plutôt que l'UCS d'origine)
                    • En règle générale, le nouveau CS est plus faible et s'éteint plus tôt
                    • Acquérir et surmonter la peur
                      • La plupart des peurs sont conditionnées
                      • Thérapie d'exposition - technique conçue pour éteindre les réponses d'anxiété en exposant les clients à des stimuli ou à des situations anxiogènes, permettant à l'extinction de se produire
                      • Désensibilisation systématique - le patient apprend des techniques de relaxation puis est progressivement exposé au stimulus provoquant la peur
                      • Inondations – expose immédiatement la personne au stimulus phobique
                      • Thérapie d'aversion - tente de conditionner une aversion à un stimulus qui déclenche un comportement indésirable en l'associant à un UCS nocif

                      Apprentissage prédictif et potentiel humain

                      La psychologie étudie comment l'hérédité (la nature) et l'expérience (l'éducation) interagissent pour influencer le comportement. Dans le chapitre précédent, nous avons lié la hiérarchie des besoins humains de Maslow à des conditions humaines très différentes. Que nous grandissions dans la forêt tropicale ou dans un environnement urbain technologiquement amélioré, le bas de la pyramide reste le même. Nous avons besoin de manger et de boire et avons besoin de protection contre les éléments. La privation de nourriture ou d'eau nous rendra plus actifs à mesure que nous recherchons la substance nécessaire. Des conditions météorologiques désagréables nous obligeront à devenir plus actifs pour éliminer la source de désagréments. Nos sens nous permettent de détecter les stimuli appétitifs et aversifs dans nos environnements internes et externes. Notre structure physique nous permet de déplacer, saisir et manipuler des objets. Notre système nerveux relie nos systèmes sensoriel et moteur.

                      Les êtres humains héritent de certaines connexions sensori-motrices améliorant la probabilité de notre survie. Les nourrissons héritent de deux réflexes qui augmentent les chances de réussite de l'allaitement. Un réflexe est un comportement héréditaire simple caractéristique des membres d'une espèce. Les nourrissons humains héritent des réflexes d'enracinement et de succion. Si un mamelon est placé dans le coin de la bouche d'un nourrisson, il centrera le mamelon (c'est-à-dire la racine). Le nourrisson sucera alors un mamelon au centre de sa bouche. Les seins des mères biologiques se remplissent de lait et gonflent, ce qui entraîne une gêne qui est soulagée par l'allaitement du nourrisson. Cela augmente la probabilité que la mère tente d'allaiter l'enfant. Cette heureuse combinaison de caractéristiques héritées a permis aux nourrissons humains de survivre tout au long des millénaires.

                      Les mères humaines finissent par arrêter de produire du lait et les nourrissons humains finissent par avoir besoin de nutriments supplémentaires pour survivre. Cela crée la nécessité d'identifier et de localiser les sources de nutriments. Les humains ont commencé en Afrique et ont migré vers pratiquement tous les endroits de la Terre. Compte tenu de la variabilité des types d'aliments et de leurs emplacements, il serait impossible pour les humains de dépendre du processus d'évolution biologique très lent pour identifier et localiser les nutriments. On ne peut pas hériter de réflexes pour aborder toutes les possibilités. Un autre type plus rapide et flexible de mécanisme sensori-moteur adaptatif doit être impliqué.

                      Nous avons décrit des voyages de recherche de nourriture menés par des membres de la tribu Nukak. Les aliments se composaient de fruits et de miel et de petits animaux sauvages, notamment des poissons et des oiseaux. Les Nukak changeaient d'emplacement tous les quelques jours afin de localiser de nouvelles réserves de nourriture. Où ils se sont installés et ont changé avec les saisons. La chasse et la cueillette comprenaient l'utilisation d'outils assemblés avec des éléments naturels. De toute évidence, l'expérience antérieure (c'est-à-dire l'éducation) a affecté leur comportement. C'est ce que nous entendons par apprentissage.

                      Définition opérationnelle de l'apprentissage

                      Toutes les sciences s'appuient sur des définitions opérationnelles afin d'établir une certaine cohérence dans l'utilisation de la terminologie. Les définitions opérationnelles décrivent les procédures utilisées pour mesurer le terme particulier. On n'observe pas directement l'apprentissage. Il doit être déduit des observations du comportement. La définition opérationnelle décrit comment on détermine objectivement si une observation comportementale est un exemple du processus.

                      Les définitions opérationnelles les plus courantes de l'apprentissage sont des variantes de celle fournie dans la révision de Kimble de Hilgard et Marquis. Conditionnement et apprentissage (1961). Selon Kimble, « l'apprentissage est un changement relativement permanent du potentiel comportemental qui se produit à la suite de la pratique ». Analysons cette définition. Premièrement, il convient de noter que l'apprentissage n'est inféré que lorsque nous voyons un changement de comportement résultant d'une expérience appropriée. Sont exclues d'autres causes possibles de changement de comportement, y compris la maturation, qui n'est pas expérientielle. La fatigue et les médicaments ne produisent pas de changements « relativement permanents ». Kimble inclut le mot « potentiel » après le comportement pour souligner le fait que même si l'apprentissage a eu lieu, cela ne garantit pas un changement de comportement correspondant.

                      Le fait que l'apprentissage antérieur puisse ne pas être reflété dans les performances est basé sur une expérience classique menée par Tolman et Honzik en 1930. Ils ont étudié des rats de laboratoire dans des conditions ressemblant à la chasse et à la cueillette des Nukak. Trois groupes différents ont été placés dans un labyrinthe complexe et le nombre d'erreurs (c'est-à-dire de mauvais virages) a été enregistré (voir la figure 5.1).

                      Graphique 5.1. Labyrinthe utilisé dans l'étude de Tolman et Honzik dans les années 1930 avec des rats (Jensen, 2006).

                      Un groupe Hungry No Reward (HNR) a simplement été placé dans la zone de départ et retiré du labyrinthe après avoir atteint la fin. Un groupe Hungry Reward (HR) a reçu de la nourriture à la fin et a été autorisé à manger avant d'être retiré. Le troisième, No Reward -> Reward groupe, a commencé de la même manière que le groupe No Reward et est passé à être traité de la même manière que le groupe Regular Reward après dix jours (HNR-R).

                      Avant de considérer le troisième groupe, voyons comment les résultats des deux premiers nous permettent de conclure que l'apprentissage a eu lieu dans le groupe Récompense régulière (voir Figure 5.2). Les groupes HNR et HR ont été traités de la même manière à une exception près, le second a reçu de la nourriture à la fin. Par conséquent, si les résultats diffèrent, nous pouvons conclure que ce doit être cette expérience qui a fait la différence. Le nombre moyen d'erreurs n'a pas chuté de manière significative en dessous des performances aléatoires au cours de l'expérience pour le groupe HNR. En comparaison, le groupe RH a démontré une baisse constante et substantielle des erreurs, exactement le modèle auquel on s'attendrait si l'apprentissage se produisait. Cette baisse des erreurs par l'expérience répond à la définition opérationnelle de l'apprentissage. Il ne serait pas possible de conclure que l'expérience a fait une différence dans le groupe HR sans la condition de contrôle HNR. On pourrait soutenir que quelque chose d'autre était responsable du déclin en cours (par exemple, un changement dans les conditions de laboratoire, la maturation, etc.).

                      Graphique 5.2. Résultats de l'étude Tolman & Honzik’s (Jensen, 2006).

                      Il est possible de conclure que le groupe récompensé a appris le labyrinthe sur la base d'une comparaison de ses résultats avec le groupe sans récompense.Une conclusion connexe, apparemment logique, serait que le groupe ne recevant pas de nourriture n'a pas réussi à apprendre le labyrinthe. Le troisième groupe de Tolman et Honzik était comme le groupe sans récompense pour les 10 premiers jours et comme le groupe récompensé pour les jours restants. Ce groupe a permis de tester si l'absence de nourriture entraînait ou non l'absence d'apprentissage. Il est important de comprendre la raison de cette condition. Si le groupe HNR-R n'avait rien appris sur le labyrinthe au cours des 10 premiers jours, le nombre d'erreurs devrait diminuer progressivement à partir de là, le modèle démontré dès le début par la condition HR. Cependant, si le groupe HNR-R avait appris le labyrinthe, une baisse plus spectaculaire des erreurs serait attendue une fois la nourriture introduite. C'est en effet ce déclin dramatique des erreurs qui s'est produit, conduisant à la conclusion que les rats avaient appris le labyrinthe malgré le fait que cela n'était pas évident dans leur comportement. Ce résultat a été décrit comme un « apprentissage latent » (c'est-à-dire un apprentissage qui ne se reflète pas dans les performances). L'apprentissage n'est qu'un des nombreux facteurs qui influent sur le comportement d'un individu. Les résultats de Tolman et Honzik impliquent que la motivation incitative (la nourriture dans ce cas) était nécessaire pour que les animaux montrent ce qu'ils avaient appris. Ainsi, nous voyons la nécessité d'inclure le mot « potentiel » dans la définition opérationnelle de l'apprentissage. Au cours des 10 premiers essais, les rats ont clairement acquis le potentiel de négocier le labyrinthe. Ces résultats peuvent vous rappeler ceux cités au chapitre 1 avec de jeunes enfants. Vous vous souviendrez peut-être que certains ont obtenu de meilleurs résultats aux tests de QI lorsqu'ils ont reçu des récompenses extrinsèques pour des réponses correctes. Tout comme les rats de Tolman et Honzik, ils avaient le potentiel de mieux performer mais avaient besoin d'une incitation.

                      1. Énoncez la définition opérationnelle de l'apprentissage, en décrivant pourquoi chacun des termes est inclus.
                      2. Décrivez les procédures, la justification, les résultats et les implications de l'étude de Tolman et Honzik démontrant que l'on ne peut conclure à l'absence d'apprentissage de l'absence de performance.

                      L'apprentissage en tant que processus adaptatif

                      La définition opérationnelle nous dit comment mesurer l'apprentissage mais ne nous dit pas ce qui est appris ou pourquoi c'est important. J'ai tenté d'y parvenir en définissant l'apprentissage comme un adaptatif traiter où les individus acquièrent la capacité de prévoir et de contrôler l'environnement (Levy, 2013). Il n'y a rien que les Nukak puissent faire pour provoquer ou empêcher la pluie. Au fil du temps, cependant, ils peuvent être en mesure d'utiliser des indices environnementaux tels que le ciel sombre ou peut-être même des indices liés au passage du temps pour prédire l'occurrence de la pluie. Les Nukak peuvent contrôler la probabilité de découvrir de la nourriture en explorant leur environnement. Ils peuvent obtenir des fruits des arbres en les attrapant et en les saisissant. Les capacités de prédire la pluie et d'obtenir de la nourriture augmentent certainement les chances de survie des Nukak. Autrement dit, ces capacités sont adaptatives.

                      La définition de l'apprentissage adaptatif nous permet d'apprécier pourquoi il est nécessaire de porter notre attention sur deux chercheurs célèbres dont les contributions ont énormément influencé l'étude de l'apprentissage pendant des décennies, Ivan Pavlov et B. F. Skinner. Les procédures de Pavlov, appelées conditionnement classique, étudiaient l'apprentissage dans des circonstances où il était possible de prédire les événements mais pas de les contrôler. Skinner a étudié l'apprentissage dans des circonstances où le contrôle était possible. Ces deux chercheurs ont créé des appareils et des procédures expérimentales pour étudier les détails de l'apprentissage adaptatif. Ils ont identifié de nombreux phénomènes d'apprentissage importants et introduit des vocabulaires techniques qui ont résisté à l'épreuve du temps. Nous décrirons les contributions de Pavlov à l'étude de l'apprentissage prédictif dans ce chapitre et les contributions de Skinner à l'étude de l'apprentissage du contrôle dans le chapitre suivant.

                      On ne saurait trop insister sur l'importance des contributions d'Ivan Pavlov à l'étude de l'apprentissage prédictif. Pavlov a introduit un niveau de rigueur et de précision de mesure des variables indépendantes et dépendantes dans l'apprentissage des animaux qui n'existait pas à l'époque. En 1904, Pavlov, un physiologiste, a reçu le prix Nobel de médecine pour ses recherches sur le processus digestif chez le chien. Il est devenu fasciné par une observation que lui et ses assistants de laboratoire ont faite lors de cette recherche. L'un des processus digestifs étudiés était la salivation. La salive contient des enzymes qui initient le processus de décomposition de ce que l'on mange en nutriments de base nécessaires pour alimenter et réparer le corps. Les sujets ont fréquemment commencé à saliver avant d'être placés dans l'appareil expérimental. Pavlov a décrit cette salivation comme une "sécrétion psychique" car elle n'était pas directement provoquée par la nourriture. Il considérait le phénomène si important qu'en quelques années il abandonna son programme de recherche en digestion et consacra le reste de sa carrière professionnelle à étudier systématiquement les détails de ce processus d'apprentissage de base.

                      C'est un merveilleux exemple de ce qui a été décrit comme un heureux hasard, ou une découverte accidentelle en science. Les chiens sont domestiqués depuis des milliers d'années. Un nombre incalculable de personnes ont probablement observé des chiens semblant prédire (c'est-à-dire anticiper ou s'attendre) à la nourriture. Pavlov, cependant, a reconnu l'importance de l'observation en tant qu'exemple d'un processus d'apprentissage fondamental. Nous pensons souvent à la science comme nécessitant de nouvelles observations. La « découverte » par Pavlov du processus de conditionnement classique est un exemple de la façon dont ce n'est pas nécessairement le cas. L'une des caractéristiques d'un scientifique exceptionnel est de reconnaître l'importance des observations courantes.

                      Nous allons maintenant passer en revue l'appareil, les méthodes et la terminologie que Pavlov a développés pour étudier l'apprentissage prédictif. Il a adapté un appareil expérimental conçu pour un domaine de recherche scientifique (la physiologie de la digestion) à un domaine entièrement différent (l'apprentissage adaptatif). Pavlov a pratiqué une petite incision chirurgicale dans la joue du chien et implanté un tube permettant de recueillir directement la salive dans un tube à essai gradué. La quantité de salive pourrait alors être mesurée avec précision et représentée graphiquement comme le montre la figure 5.3. L'apprentissage prédictif a été déduit lorsque la salivation s'est produite à un stimulus auparavant neutre à la suite d'une expérience appropriée.

                      Vidéo

                      Regardez la vidéo suivante décrivant Pavlov et le conditionnement classique :

                      Les animaux héritent de la tendance à faire des réponses simples (réflexes) à des types spécifiques de stimulation. La recherche de Pavlov sur la salivation était basée sur le déclenchement réflexif de la salivation par la nourriture (par exemple, la poudre de viande). Cette recherche a été adaptée à l'étude de l'apprentissage prédictif en incluant un stimulus neutre. Par neutre, nous entendons simplement que ce stimulus n'a initialement suscité aucun comportement lié à la nourriture. Pavlov a démontré que si un stimulus neutre précédait un stimulus biologiquement significatif à plusieurs reprises, on verrait une nouvelle réponse se produire au stimulus précédemment neutre. La figure 5.4 utilise la traduction la plus populaire de la terminologie de Pavlov (qui a écrit en russe). Le comportement réflexif a été appelé la réponse inconditionnée (UR). Le stimulus qui a suscité par réflexe cette réponse a été appelé stimulus inconditionné (US). Un nouveau stimulus, en raison de son association dans une relation prédictive avec la nourriture (US), acquiert la capacité de susciter une réponse conditionnée (CR) liée à la nourriture. Une fois cette capacité acquise, le nouveau stimulus est considéré comme un stimulus conditionné (CS).

                      Figure 5.4 Procédures de conditionnement classiques et terminologie de Pavlov.

                      De base Phénomènes d'apprentissage prédictif

                      Au chapitre 1, nous avons discuté de l'hypothèse du déterminisme telle qu'elle s'appliquait à la discipline de la psychologie. Si l'apprentissage prédictif est un processus licite, une enquête empirique contrôlée a le potentiel d'établir des relations de cause à effet fiables. Nous verrons que c'est le cas en passant en revue plusieurs phénomènes de conditionnement classiques de base. Beaucoup de ces phénomènes ont été découverts et nommés par Pavlov lui-même, en commençant par le processus d'acquisition décrit ci-dessus.

                      Acquisition

                      Le terme acquisition fait référence à une procédure ou à un processus par lequel un stimulus est présenté dans une relation prédictive avec un autre stimulus. L'apprentissage prédictif (conditionnement classique) est déduit de l'apparition d'une nouvelle réponse au premier stimulus. En gardant à l'esprit que les termes mentalistes sont des inférences basées sur des observations comportementales, c'est comme si l'individu apprenait à prédire si cela se produit, alors cela se produit.

                      Le terme extinction fait référence à une procédure ou un processus par lequel un stimulus prédictif précédemment établi n'est plus suivi par le second stimulus. Cela se traduit généralement par un affaiblissement de la force de la réponse apprise antérieurement. C'est comme si l'individu apprenait ce qui se passait n'arrive plus. L'extinction est couramment utilisée à mauvais escient comme terme décrivant uniquement le résultat de la procédure ou du processus. C'est-à-dire qu'il est souvent utilisé comme le terme schizophrénie, qui est défini exclusivement du côté de la variable dépendante (symptôme). L'extinction ressemble en fait plus à la grippe, en ce sens qu'il s'agit d'une véritable explication de la relation entre une variable indépendante spécifique (la procédure) et une variable dépendante (le changement de comportement).

                      Vidéo

                      Regardez la vidéo suivante décrivant l'acquisition et l'extinction du conditionnement classique :

                      Récupération spontannée

                      Le terme récupération spontanée fait référence à une augmentation de la force de la réponse apprise antérieurement après qu'une période de temps prolongée s'est écoulée entre les essais d'extinction. L'individu agit comme si, peut-être que ce qui se passait, le fait toujours.

                      L'extinction est-elle un désapprentissage ou un apprentissage inhibiteur ?

                      Pavlov était un excellent exemple de quelqu'un qui serait aujourd'hui considéré comme un neuroscientifique du comportement. En fait, le titre complet de son livre classique (1927) est Réflexes conditionnés : une enquête sur l'activité physiologique du cortex cérébral. Les neuroscientifiques comportementaux étudient le comportement afin d'en déduire les mécanismes cérébraux sous-jacents. Ainsi, Pavlov ne s'est pas perçu comme passant d'un physiologiste à un psychologue lorsqu'il a abandonné son étude de la digestion pour explorer les subtilités du conditionnement classique. Comme le laisse entendre sa métaphore de la «sécrétion psychique», il croyait qu'il continuait à étudier la physiologie, détournant son attention de l'étude du système digestif pour étudier le cerveau.

                      Une question d'intérêt pour Pavlov était la nature du processus d'extinction. Pavlov a supposé que l'acquisition produisait une connexion entre un neurone sensoriel représentant le stimulus conditionné et un motoneurone provoquant la salivation. La réduction de la réponse résultant de la procédure d'extinction pourrait résulter de la rupture de ce lien (c'est-à-dire du désapprentissage) ou de sa neutralisation par une réponse concurrente. Le fait qu'une récupération spontanée se produise indique que le lien n'est pas rompu pendant le processus d'extinction. L'extinction doit impliquer l'apprentissage d'une réponse inhibitrice contrecarrant la réponse conditionnée. L'individu semble apprendre qu'un stimulus n'en prédit plus un autre. La conclusion que l'extinction n'élimine pas de façon permanente une association précédemment apprise a d'importantes implications pratiques et cliniques. Cela signifie qu'une personne qui a reçu un traitement pour un problème et s'est améliorée n'est pas la même chose qu'une personne n'ayant jamais besoin de traitement en premier lieu (cf., Bouton, 2000 Bouton et Nelson, 1998). Par exemple, même si quelqu'un a arrêté de fumer, il y a une plus grande probabilité que cette personne rechute qu'un non-fumeur n'en acquiert l'habitude.

                      Décrivez la base pour conclure que l'extinction est un processus inhibiteur par opposition à un processus de désapprentissage.

                      Généralisation des stimuli et discrimination

                      Imaginez si vous deviez apprendre à faire la même réponse encore et encore à chaque nouvelle situation. Heureusement, ce n'est souvent pas nécessaire. La généralisation des stimuli fait référence au fait qu'une réponse précédemment acquise se produira en présence de stimuli autres que l'original, la probabilité étant fonction du degré de similitude. Dans la figure 5.5, nous voyons qu'une réponse apprise à une fréquence de 500 Hz se produit à d'autres stimuli, le pourcentage de fois dépendant de la proximité de la fréquence à 500. C'est comme si l'individu prédisait ce qui se passe après un événement se produira après des événements similaires.

                      Figure 5.5 Gradient de généralisation du stimulus.

                      Le fait que la généralisation se produise augmente considérablement l'efficacité des expériences d'apprentissage individuelles. Cependant, il y a généralement des limites à la pertinence de faire la même réponse dans différentes situations. Par exemple, les nouveaux pères rayonnent souvent la première fois qu'ils entendent leur bébé dire « papa ». Ils sont moins ravis lorsqu'ils entendent leur enfant appeler le facteur « papa ! Habituellement, il est nécessaire de mener un enseignement supplémentaire pour que l'enfant ne dise « papa » qu'en présence du père. La discrimination de stimulus se produit lorsqu'un stimulus (le S+, p. ex. un ton ou le père) est prédictif d'un deuxième stimulus (p. mailman) n'est jamais suivi de ce deuxième stimulus. Finalement, l'individu répond au S+ (ton ou père) et non au S- (lumière ou facteur) comme s'il apprenait si cela se produit, cela se produit, mais si cette autre chose se produit, cela ne se produit pas.

                      1. Définir et donner des exemples des phénomènes de conditionnement classiques suivants : acquisition, extinction, récupération spontanée, généralisation des stimuli et discrimination.
                      2. Expliquez comment le fait que la récupération spontanée se produise indique que le lien entre un stimulus conditionné et une réponse conditionnée n'est pas rompu pendant le processus d'extinction.

                      Modèle de substitution de stimulus de Pavlov du conditionnement classique

                      Pendant la majeure partie du 20e siècle, le modèle de substitution de stimulus proposé à l'origine par Pavlov du conditionnement classique a été largement accepté. Pavlov considérait le conditionnement comme un résultat mécaniste (automatique) de l'appariement d'événements neutres et biologiquement significatifs dans le temps. Il croyait que le stimulus conditionné établi devenait un substitut au stimulus inconditionnel d'origine. Il y avait quatre hypothèses sous-jacentes à ce modèle de substitution de stimulus :

                      • Le conditionnement classique nécessite un stimulus biologiquement significatif (c'est-à-dire US)
                      • La contiguïté temporelle entre un stimulus neutre et un stimulus inconditionné est nécessaire pour que le stimulus neutre devienne un stimulus conditionné
                      • La contiguïté temporelle entre un stimulus neutre et un stimulus inconditionné est suffisant pour que le stimulus neutre devienne un stimulus conditionné
                      • La réponse conditionnée ressemblera toujours sinon être identique à la réponse inconditionnée.

                      Le conditionnement classique nécessite-t-il un stimulus biologiquement significatif ?

                      Le conditionnement d'ordre supérieur est une procédure ou un processus par lequel un stimulus auparavant neutre est présenté dans une relation prédictive avec un second stimulus prédictif préalablement établi. L'apprentissage est déduit de l'apparition d'une nouvelle réponse en présence de ce stimulus auparavant neutre. Par exemple, après avoir associé le ton avec de la nourriture, il est possible de placer le ton dans la position des États-Unis en présentant une lumière juste avant qu'il ne se produise. La recherche indique qu'une réponse conditionnée (la salivation dans ce cas) se produira à la lumière même si elle n'était pas associée à un stimulus biologiquement significatif (nourriture).

                      Vidéo

                      Regardez la vidéo suivante pour une démonstration de conditionnement d'ordre supérieur :

                      La contiguïté temporelle est-elle nécessaire au conditionnement ?

                      Les êtres humains ont spéculé sur le processus d'apprentissage depuis au moins l'époque des premiers philosophes grecs. Aristote, au IVe siècle av. J.-C., a proposé trois lois d'association qu'il croyait appliquées à la pensée et à la mémoire humaines. La loi de contiguïté stipulait que des objets ou des événements se produisant à proximité dans le temps (contiguïté temporelle) ou dans l'espace (contiguïté spatiale) devenaient associés. La loi de similitude stipulait que nous avions tendance à associer des objets ou des événements ayant des caractéristiques en commun de telle sorte que l'observation d'un événement incite à se souvenir d'événements similaires. La loi de fréquence stipulait que plus nous expérimentions des objets ou des événements, plus nous serions susceptibles de nous en souvenir. En un sens, Pavlov a créé une méthodologie permettant de tester empiriquement les lois d'Aristote. La loi qui s'applique dans cette section est la loi de contiguïté temporelle. Les effets de temps, comme de nombreuses variables étudiées scientifiquement, se prêtent à des études paramétriques dans lesquelles la variable indépendante est constituée de différentes valeurs sur une dimension. Il a été démontré que dans le conditionnement des paupières humaines dans lequel une lumière est suivie d'une bouffée d'air vers l'œil est la plus forte lorsque la bouffée se produit environ 500 millisecondes (½ seconde) après la lumière. La force du conditionnement à des intervalles plus ou moins longs diminue en quelques dixièmes de seconde. Ainsi, la contiguïté temporelle semble critique dans le conditionnement des paupières humaines, conformément à la deuxième hypothèse de Pavlov.

                      Une exception – a acquis une aversion pour le goût

                      L'aversion gustative acquise est la seule exception apparente à la nécessité de la contiguïté temporelle dans l'apprentissage prédictif (conditionnement classique). Cette exception peut être comprise comme une adaptation évolutive pour protéger les animaux des intoxications alimentaires. Imaginez si des membres des Nukak tombaient malades après avoir mangé un aliment particulier et continuaient à manger la même substance. Il y a de fortes chances que les membres de la tribu (et la tribu !) ne survivent pas longtemps. Il serait avantageux d'éviter les aliments consommés avant de tomber malade, même si les symptômes n'apparaissent pas avant plusieurs minutes, voire plusieurs heures. Le phénomène d'aversion gustative acquise a été largement étudié. Les intervalles de temps utilisés diffèrent parfois en heures plutôt qu'en secondes ou en dixièmes de secondes. Par exemple, des rats sont tombés malades en étant exposés aux rayons X après avoir bu de l'eau douce (Smith & Roll, 1967). Les rats ont une forte préférence pour l'eau douce, la buvant environ 80 pour cent du temps lorsqu'ils ont le choix avec de l'eau du robinet ordinaire. Si le rat tombait malade en moins d'une demi-heure, la consommation d'eau douce était totalement éliminée. Avec des intervalles de 1 à 6 heures, il a été réduit de 80 à 10 pour cent. Il y avait même des preuves d'un effet après un délai de 24 heures ! Les chiens de Pavlov n'associeraient pas un ton à la présentation de la nourriture une heure plus tard, et encore moins 24 heures. L'aversion acquise pour l'eau douce peut être interprétée soit comme une exception à la loi de contiguïté temporelle, soit comme la contiguïté doit être considérée sur une échelle de temps de différents ordres de grandeur (heures plutôt que secondes).

                      La contiguïté temporelle est-elle suffisante pour le conditionnement ?

                      Pavlov croyait non seulement que la contiguïté temporelle entre CS et US était nécessaire pour que le conditionnement se produise, il croyait également que c'était tout c'est nécessaire (c'est-à-dire que c'était suffisant). Rescorla (1966, 1968, 1988) a démontré que la corrélation entre CS et US (c'est-à-dire la mesure dans laquelle le CS a prédit les US) était plus importante que la contiguïté temporelle.Par exemple, si le seul moment où l'on est choqué est en présence du son, alors le son est en corrélation avec le choc (c'est-à-dire qu'il est prédictif du choc). Si une personne est choquée de la même quantité, que le ton soit présent ou non, le ton n'est pas corrélé avec le choc (c'est-à-dire qu'il ne fournit aucune information prédictive). Rescorla a démontré que malgré la contiguïté temporelle entre le tonus et le choc dans les deux cas, le conditionnement classique serait fort dans le premier cas et ne se produirait pas dans le second.

                      Un autre exemple du manque d'apprentissage prédictif malgré la contiguïté temporelle entre deux événements est fourni dans une étude de Léon Kamin (1969). Un groupe bloquant a reçu une tonalité (CS 1) suivie d'un choc (US) dans la première phase et un groupe témoin a été simplement placé dans la chambre (voir figure 5.13). Les groupes sont désormais identiques. Au cours de la deuxième phase, un stimulus composé composé de la lumière et d'un ton (CS 2) a été suivi d'un choc. Lors d'une phase de test, chaque composant a été présenté seul pour déterminer l'étendue du conditionnement.

                      Dans le groupe bloquant, le conditionnement s'est produit au niveau du ton et non de la lumière. Le conditionnement s'est produit pour les deux éléments du composé dans le groupe témoin. C'est comme si l'expérience préalable avec le ton avait fait en sorte que les sujets du groupe de blocage ne prêtaient pas attention à la lumière dans la deuxième phase. La lumière était redondante. Il n'a pas fourni d'informations supplémentaires.

                      Une démonstration originale et amusante de blocage chez des étudiants universitaires impliquait un jeu vidéo informatisé (Arcediano, Matute et Miller, 1997). Les sujets ont essayé de protéger la terre de l'invasion par les martiens avec un pistolet laser (la barre d'espace). Malheureusement, les martiens entreprenants avaient développé un bouclier anti-laser. Si le sujet tirait alors que le bouclier était en place, leur pistolet laser serait inefficace, permettant à un groupe de martiens d'atterrir et de faire leur mal. Une lumière clignotante a précédé la mise en place du bouclier laser pour les sujets du groupe de blocage. Un groupe témoin n'a pas ressenti de stimulus prédictif pour le bouclier laser. Par la suite, les deux groupes ont subi un stimulus composé composé d'une lumière clignotante et d'un ton complexe. Le groupe témoin associait la tonalité à l'activation du bouclier laser alors que, en raison de leurs antécédents avec la lumière, le groupe bloquant ne l'avait pas fait. Pour eux, le ton était redondant.

                      Vidéo

                      Regardez la vidéo suivante pour une démonstration de blocage :

                      La procédure de blocage démontre que la contiguïté temporelle entre les événements, même dans une relation prédictive, n'est pas suffisante pour que l'apprentissage se produise. Dans la deuxième phase de la procédure de blocage, le stimulus composé précède les États-Unis. Selon Pavlov, étant donné que les deux composantes sont contiguës aux États-Unis, les deux devraient s'y associer et éventuellement susciter des RC. La combinaison des résultats de Rescorla (1966) et de Kamin (1969) conduit à la conclusion que l'apprentissage se produit lorsque les individus obtiennent Nouveau informations leur permettant de prédire des événements qu'ils n'étaient pas en mesure de prévoir auparavant. Kamin a suggéré que cela ne se produit que lorsque nous sommes surpris. C'est-à-dire que tant que les événements se déroulent comme prévu, nous n'apprenons pas. Une fois que quelque chose d'inattendu se produit, les individus recherchent des informations pertinentes. Beaucoup de nos activités peuvent être décrites comme « habituelles » (Kirsch, Lynn, Vigorito et Miller, 2004) ou « automatiques » (Aarts et Dijksterhuis, (2000). Nous avons tous eu l'expérience de faire du vélo ou de conduire comme si nous sommes sur "pilote automatique". Nous ne sommes pas consciemment engagés dans le pilotage tant que les événements se déroulent normalement. Une fois que quelque chose d'inattendu se produit, nous attirons notre attention et nous nous concentrons sur les circonstances environnementales immédiates. Cela offre la possibilité d'acquérir de nouvelles informations. C'est une compréhension beaucoup plus active et adaptative de l'apprentissage prédictif que celle fournie par le modèle de substitution de stimulus de Pavlov (voir Rescorla, 1988).

                      La réponse conditionnée doit-elle ressembler à la réponse inconditionnée ?

                      Nous allons maintenant examiner la quatrième hypothèse de ce modèle, à savoir que la réponse conditionnée ressemble toujours à la réponse inconditionnée. La poudre de viande provoque par réflexe la salivation et Pavlov a observé la même réaction à un stimulus conditionné prédictif de la poudre de viande. Les bouffées d'air provoquent par réflexe des clignements des yeux et des tapes sur le genou provoquent des secousses du genou. Les réponses conditionnées sont similaires aux réponses non conditionnées dans la recherche impliquant des bouffées d'air et des coups de genou comme stimuli non conditionnés. Il est compréhensible que Pavlov et d'autres aient cru pendant si longtemps que la réponse conditionnée doit ressembler sinon être identique à la réponse inconditionnée. Cependant, Zener (1937) a filmé des chiens soumis à un conditionnement salivaire et n'était pas d'accord avec cette conclusion. Il a observé : « Malgré les affirmations de Pavlov, le chien ne semble pas manger une nourriture imaginaire. C'est une réponse différente, anthropomorphiquement descriptible comme la recherche, l'attente, la chute de la nourriture avec une volonté d'adopter le comportement alimentaire qui se produira lorsque la nourriture tombera.

                      Kimble (1961, p. 54) a proposé l'interprétation possible que « la fonction de la réponse conditionnée est de préparer l'organisme à l'apparition du stimulus inconditionné ». Les recherches de Shepard Siegel (1975, 1977, 1984, 2005) ont fait basculer le pendule vers une large acceptation de cette interprétation de la nature de la réponse conditionnée. La recherche de Siegel impliquait l'administration d'un médicament comme stimulus inconditionné. Par exemple, des rats ont reçu une injection d'insuline en présence d'un nouveau stimulus (Siegel, 1975). L'insuline est un médicament qui abaisse le taux de sucre dans le sang et est souvent utilisé pour traiter les diabétiques. Finalement, une réponse conditionnée a été développée au nouveau stimulus (maintenant un CS). Cependant, plutôt que d'abaisser le taux de sucre dans le sang, le taux de sucre dans le sang augmenté au CS. Siegel a décrit cette augmentation comme une réponse compensatoire en préparation de l'effet de l'insuline. Il a fait valoir qu'il était similaire à d'autres mécanismes homéostatiques conçus pour maintenir des niveaux optimaux de processus biologiques (par exemple, la température, le nombre de globules blancs, les niveaux de liquide, etc.). Des réponses compensatoires similaires ont été démontrées avec la morphine, un médicament ayant des propriétés analgésiques (Siegel, 1977) et avec la caféine (Siegel, 2005). Siegel (2008) est allé jusqu'à suggérer que « le chercheur en apprentissage est un chercheur en homéostasie ».

                      Siegel a développé un modèle fascinant et influent de tolérance aux médicaments et d'effets de surdosage basé sur ses découvertes concernant l'acquisition de réponses compensatoires (Siegel, 1983). Il a suggéré que de nombreuses surdoses d'héroïne sont en fait le résultat de la même dose consommée différemment ou dans un environnement différent. Un tel effet a en effet été démontré expérimentalement chez le rat. Alors que 34 pour cent des rats ayant reçu une dose d'héroïne plus élevée que d'habitude dans la même cage sont morts, 64 pour cent des rats ayant reçu la même dose dans une cage différente sont morts (Siegel, Hinson, Krank, & McCully, 1982). À titre expérimental, cette étude a une validité interne élevée mais n'a évidemment pas pu être répliquée avec des sujets humains. Dans une étude à haute validité externe, Siegel a interrogé des survivants d'overdoses d'héroïne présumées. La plupart ont insisté sur le fait qu'ils avaient pris la quantité habituelle mais ont indiqué qu'ils avaient utilisé une technique différente ou consommé la drogue dans un environnement différent (Siegel, 1984). Cette combinaison de résultats à validité externe élevée et à validité interne élevée constitue un argument convaincant en faveur du modèle d'apprentissage de Siegel sur la tolérance aux médicaments et les effets de surdosage.

                      Les réponses compensatoires induites par les médicaments sont cohérentes avec l'interprétation selon laquelle la réponse conditionnée constitue une préparation au stimulus inconditionné. La combinaison de cette interprétation avec les conclusions tirées concernant la nécessité de la prédictivité pour que le conditionnement classique se produise conduit à l'alternative suivante au modèle de substitution de stimulus de Pavlov : Le conditionnement classique est un processus adaptatif par lequel les individus acquièrent la capacité de prédire les événements futurs et de se préparer à leur apparition..


                      5. Composants clés, éléments, principes

                      5.1. Analyse expérimentale du comportement

                      5.1.1. Réponses suscitées : réflexes à un stimulus

                      5.1.2. Réponses émises : comportements non associés à un stimulus

                      5.1.2.1. Analyse expérimentale du comportement : manipulation d'événements observables dans un cadre contrôlé

                      5.2. Conditionnement opérant

                      5.2.1. Hypothèses du conditionnement opérant

                      5.2.2. Principes de renforcement

                      5.2.2.1. Caractéristiques du renforcement

                      5.2.2.1.1. Le renforcement doit se produire immédiatement après l'opérant et est lié au comportement

                      5.2.2.1.2. Le renforcement ne renforce pas la réponse mais augmente plutôt la probabilité de la réponse à l'avenir

                      5.2.2.2. Facteurs affectant le renforcement :

                      5.2.2.2.1. Niveau de compétence : la capacité de l'apprenant

                      5.2.2.2.2. Histoire de renforcement : expériences antérieures des apprenants

                      5.2.2.2.3. Dotation génétique : caractéristiques héritées de l'apprenant

                      5.2.2.3. Types de renfort

                      5.2.2.3.1. Renforceurs primaires : stimuli qui peuvent augmenter la fréquence des comportements sans entraînement

                      5.2.2.3.2. Renforts Secondaires ou Conditionnés : sont associés à un renforçateur primaire et à un autre renforçateur conditionné

                      5.2.2.3.3. Renforceurs généralisés : renforcements sociaux et manipulations des environnements physiques

                      5.2.2.3.4. Renforcement positif : ajout d'un nouveau stimulus où la réponse produit un nouveau stimulus

                      5.2.2.3.5. Renforcement négatif : suppression d'un objet ou d'un stimulus discriminant

                      5.2.2.3.6. Punition : suppression d'un renforcement positif ou ajout d'un renforcement négatif

                      5.3. Façonner

                      5.3.1. Étapes d'un programme utilisant un calendrier de renforcement menant à la séquence comportementale suivante alors qu'une étape est une approximation successive de renforcement

                      5.3.1.1. Types de calendrier de renforcement

                      5.3.1.1.1. Barème à ratio variable : échelle de renforcement graduée fréquente puis décroissante

                      5.3.1.1.2. Utilité négative : renforcement périodique

                      5.3.1.2. Exemples de comportement de mise en forme

                      5.3.1.3. Comportement gouverné par les contingences : les comportements appris sont plus précis grâce à des tests dans plusieurs contingences et conduisent à d'autres comportements

                      5.3.1.4. Comportement régi par des règles : les conseils et les instructions fonctionnent comme des stimuli verbaux

                      5.4. Stimuli discriminants

                      5.4.1. Stimulus discriminant : stimuli qui sont constamment présents lors du renforcement de la réponse

                      5.4.1.1. Objectif des stimuli discriminants :

                      5.4.1.1.1. Induction ou généralisation des stimuli : lorsque plusieurs stimuli acquièrent le contrôle d'une réponse

                      5.4.1.1.2. Utilisez en sélectionnant des stimuli discriminants pour devenir un signal pour le comportement souhaité.

                      5.4.2. Transfert du contrôle des stimuli : dans le modèle scolaire traditionnel, l'échec de l'éducation réside dans l'incapacité de l'élève à transférer ce qui est appris

                      5.4.2.1. La discrimination des stimuli doit précéder la généralisation des stimuli

                      5.4.3. Pour éliminer un comportement indésirable, la brume développe un comportement avec des réponses incompatibles.

                      5.4.4. Renforcements naturels : l'utilisation du comportement sert de renforcement afin qu'il n'y ait pas de rétroaction aversive. Cependant, le renforcement naturel seul ne suffit pas avec certaines compétences telles que la lecture et l'écriture.

                      5.4.5. Renforcement artificiel : l'exemple de l'économie symbolique. Doit être progressivement éliminé une fois le comportement développé et soutenu par des renforçateurs naturels.

                      5.4.6. renforçateurs de synchronisation : soutient l'ignorance planifiée, mais les enseignants doivent également surveiller le renforcement involontaire.


                      La généralisation des stimuli est-elle acquise en raison de l'incapacité à discriminer les stimuli ? - Psychologie

                      Résumé

                      De nombreuses études, tant en éthologie qu'en psychologie comparée, ont montré que les animaux réagissent à des modifications de stimuli familiers. Ce phénomène est souvent qualifié de généralisation. La plupart des modifications conduisent à une diminution de la réponse, mais à certains nouveaux stimuli une augmentation de la réponse est observée. Cela vaut à la fois pour le comportement inné et appris. Nous proposons ici une approche heuristique du contrôle des stimuli, ou sélection des stimuli, dans le but d'expliquer ces phénomènes. Le modèle comporte deux éléments clés. Premièrement, nous choisissons le niveau du récepteur comme espace de stimulus fondamental. Chaque stimulus est représenté par le schéma d'activation qu'il induit dans les organes des sens. Deuxièmement, dans cet espace, nous introduisons une mesure simple de « similarité » entre les stimuli en calculant comment les modèles d'activation se chevauchent. Le principal avantage que nous reconnaissons dans cette approche est que la généralisation des réponses acquises émerge de quelques principes simples qui sont fondés sur la reconnaissance de la façon dont les animaux perçoivent réellement les stimuli. De nombreux problèmes traditionnels auxquels sont confrontées les théories du contrôle des stimuli (par exemple la théorie de Spence-Hull de l'interaction de gradient ou les théories éthologiques de la sommation des stimuli) ne se posent pas dans le présent cadre. Ces problèmes incluent la quantité de généralisation selon différentes dimensions, les phénomènes de décalage de pic (en ce qui concerne à la fois les décalages positifs et négatifs), la généralisation de l'intensité et la généralisation après conditionnement sur deux stimuli positifs.

                      Pour soumettre une demande de mise à jour ou de retrait de ce document, veuillez soumettre une demande de mise à jour/correction/suppression.

                      Articles suggérés

                      Citations

                      1. (1975). Une évaluation de l'hypothèse du conflit comme principe explicatif de l'évolution des affichages. Dans Fonction et évolution du comportement (Ed.
                      2. (1970). Comportement des animaux. Tokyo : McGraw-Hill Kogakusha, Ltd., 2e édition.
                      3. (1999). Les réseaux de neurones artificiels comme modèles de contrôle des stimuli.
                      4. (1987). Processus d'attention et d'apprentissage dans l'identification et la catégorisation des stimuli intégraux.
                      5. (1977). Généralisation de l'intensité auditive après entraînement à la différenciation CER.
                      6. (1956). Discriminabilité et généralisation des stimuli.
                      7. (1968). L'entraînement à la discrimination comme la somme de l'excitation et de l'inhibition.
                      8. (1960). Effet de la formation à la discrimination sur la généralisation auditive.
                      9. (1965). Effets de la formation de discrimination sur la généralisation à partir du taux de référence positif.
                      10. (1959). Effets de la formation à la discrimination sur la généralisation des stimuli.
                      11. (1980). Enquist : La géométrie du contrôle du stimulus
                      12. (1962). Gradients de généralisation de l'inhibition suite à un entraînement à la discrimination auditive.
                      13. (1976). Formation aux étiquettes et généralisation auditive.
                      14. (1973). Décalage de pointe: un examen.
                      15. (1973). Gradients post-discrimination de sujets humains sur un continuum de tons.
                      16. (1978). Décalage post-discrimination du poisson rouge (Carassius Auratus) sur un continuum de longueur d'onde visuelle.
                      17. (1972). Prédiction du décalage de pic chez les pigeons à partir des gradients d'excitation et d'inhibition.
                      18. (1943). Principes de comportement.
                      19. (1989). Sensation et perception.
                      20. (1994). Similarité et discrimination : un examen sélectif et un modèle connexionniste.
                      21. (1975). Quelques effets du renforcement indépendant de la réponse dans les gradients de généralisation auditive.
                      22. (1975). Données à l'état d'équilibre et modèle quantitatif de généralisation et de discrimination opérantes.
                      23. (1973). Contrôle du stimulus du comportement d'évitement chez les rats après un entraînement pavlovien différentiel ou non différentiel le long des dimensions du stimulus conditionné.
                      24. (1957). Généralisation des stimuli après un entraînement égal sur deux stimuli.
                      25. (1959). Généralisation des stimuli après entraînement sur trois stimuli : un test de l'hypothèse de sommation.
                      26. (1949). Généralisation du stimulus des réponses conditionnées.
                      27. (1963). Théorie de l'échantillonnage de stimulus.
                      28. (1973). Sélection de stimulation.
                      29. (1982). Le goéland argenté et son œuf.
                      30. (1974). La psychologie de l'apprentissage des animaux.

                      Liens utiles

                      Vous écrivez sur CORE ?

                      Découvrez nos résultats de recherche et citez nos travaux.

                      CORE est un service à but non lucratif fourni par l'Open University et Jisc.


                      Généralisation des repères

                      Il a généralement été reconnu que la mémoire de la peur dépendante des signaux et du contexte est régulée par des mécanismes neurobiologiques qui se chevauchent, mais différents (Phillips et LeDoux, 1992 Frankland et al., 1998 Maren et Holt, 2004 Fanselow, 2010). Plus précisément, l'amygdale est essentielle dans l'acquisition, la consolidation et l'extinction de la peur contextuelle et dépendante des signaux, alors que l'hippocampe est généralement considéré comme essentiel dans la régulation de la peur contextuelle (Kim et al., 1993 Fanselow et Kim, 1994 Helmstetter et Bellgowan, 1994 Maren, 1999 Davis et Aggleton, 2000 Schafe et al., 2001 Walker et al., 2002 Phelps et al., 2004 Myers, 2006). Plusieurs études récentes ont examiné les mécanismes sous-jacents à la généralisation de la peur indicée à l'aide d'un entraînement à la discrimination indicée. Ces études montrent que les souris dépourvues de la forme 65 kD de l'acide glutamique décarboxylase (souris GAD65 −/−) qui est l'enzyme biosynthétique de l'acide γ-aminobutyrique (GABA), présentent une congélation réduite par rapport à leur type sauvage. frères et sœurs, suggérant une mémoire de peur réduite. Fait intéressant, les souris GAD65 −/− n'ont pas été en mesure de distinguer le CS− du CS+ lors des tests à 24 h ou 14 jours, ce qui suggère que la synthèse de GABA est non seulement critique pour une mémoire de peur appropriée, mais aussi pour le stimulus mémoire de peur spécifique (Bergado-Acosta et al., 2008). En plus de la synthèse du GABA, le GABA présynaptiqueB Les récepteurs semblent également jouer un rôle important dans la généralisation de la peur. Blocage pharmacologique du GABAB Les récepteurs de l'amygdale latérale permettent l'induction d'une LTP homosynaptique au niveau des afférences corticales lors de l'utilisation de protocoles de stimulation qui ne provoquent normalement pas de LTP (Shaban et al., 2006). Deux GABAB(1) les isoformes de sous-unités sont exprimées dans le cerveau, GABAB1(a), qui est sélectivement associé aux terminaisons présynaptiques, et GABAB1(b) qui est associée aux membranes postsynaptiques (Vigot et al., 2006). Dans l'amygdale latérale, GABAB1(a) Les récepteurs semblent être spécifiquement responsables de la LTP présynaptique au niveau des afférences cortico-amygdales, alors que GABAB1(b) Les récepteurs sont responsables de la LTP au niveau des afférences thalamiques, suggérant une régulation spécifique de la voie de la LTP dans l'amygdale latérale (Shaban et al., 2006). De plus, GABAB1(a) Les souris −/− affichent une généralisation de la peur dépendante de l'intensité du stimulus aux signaux CS− lorsqu'elles sont testées après un entraînement à la discrimination. Ces données suggèrent que l'inhibition présynaptique dans la voie cortico-amygdale est importante pour préserver la discrimination des stimuli pendant l'entraînement à la discrimination. De plus, l'absence d'inhibition présynaptique peut déplacer le seuil de généralisation de la peur vers des intensités américaines plus faibles.

                      En plus de l'amygdale latérale et de l'amygdale basolatérale, le noyau central de l'amygdale (CeA) a été identifié comme une structure essentielle subissant une plasticité à l'appui de l'apprentissage de la peur (Jasnow et Huhman, 2001 Samson et Pare, 2005 Wilensky et al., 2006 ). Le CeA est principalement composé de neurones inhibiteurs GABA-ergiques, dont la subdivision médiale du CeA (Cem) est sous inhibition tonique par le CeA latéral/capsulaire (Cel Cassell et al., 1986 Sun et Cassell, 1993 Ciocchi et al. ., 2010 Haubensak et al., 2010). Utiliser une tâche de discrimination et in vivo enregistrements électrophysiologiques, Ciocchi et al. (2010) ont montré qu'une diminution de l'activité tonique des neurones Cem était associée à une généralisation au CS−. L'inverse était vrai pour le Cel, une augmentation de l'activité tonique était associée à une généralisation.De plus, les changements dans l'activité tonique du Cel étaient plus élevés chez les souris généralisantes. Ces données suggèrent que la spécificité des réponses de peur peut être partiellement régulée par des changements d'activité au sein des circuits neuronaux inhibiteurs de la CeA. Les changements d'activité entre ces sous-noyaux peuvent réguler le rapport signal/bruit des stimuli de peur, et ainsi jouer un rôle dans la sortie comportementale spécifique au stimulus (Ciocchi et al., 2010). La généralisation à des signaux effrayants peut également recruter l'activité de régions cérébrales supplémentaires, y compris le noyau du lit de la strie terminale (BNST). Les rats lésés par le BNST se sont moins figés sur le CS− et ont pu faire la distinction entre un CS+ et un CS−, tandis que les rats simulés affichent un continuum de réponses, allant d'une généralisation élevée à faible (Duvarci et al., 2009). Sur la base des données limitées disponibles, il semble que le réseau inhibiteur au sein de l'amygdale joue un rôle essentiel dans la régulation des réponses comportementales spécifiques au stimulus et limite finalement la généralisation. De plus, le recrutement du BNST, impliqué dans la régulation de l'anxiété, peut contribuer à la généralisation de la peur. Ceci est également vrai pour la généralisation des réponses comportementales suite à une défaite sociale. Dans les modèles de défaite sociale, les animaux sont vaincus dans un contexte par un individu conspécifique puis testés dans un autre contexte avec un nouveau stimulus conspécifique (Huhman et al., 2003 Jasnow et al., 2004). La modulation de l'activité du BNST conduit à une réduction des effets comportementaux de la défaite lorsque les animaux sont testés dans un contexte alternatif et avec un nouvel animal stimulus (Jasnow et al., 2004). Il faut noter que bon nombre de ces études discutées ci-dessus ont utilisé une formation à la discrimination, qui n'aborde pas la question de la généralisation à de nouveaux indices. Cependant, il est probable que la généralisation à de nouveaux indices implique des mécanismes neurobiologiques similaires à ceux décrits dans les études ci-dessus.

                      La généralisation de la peur contextuelle implique probablement la transformation d'informations contextuelles spécifiques dans l'hippocampe en informations schématiques ou de type essentiel dans le néocortex. Les souvenirs de peur signalés subissent-ils une transformation similaire à mesure que la trace mémorielle passe d'une représentation spécifique à une représentation générale, comme c'est le cas pour les souvenirs contextuels ? Si oui, les mêmes régions cérébrales néocorticales (ACC, infralimbique et prélimbique) sont-elles impliquées dans la mémoire généralisée ? L'amygdale est une structure de type corticale avec des circuits intrinsèques similaires mais sans organisation laminaire (McDonald, 1989, 1996 McDonald et Pearson, 1989 McDonald et Mascagni, 2001, 2002 Mascagni et McDonald, 2003 Jasnow et al., 2009). Plusieurs éléments de preuve suggèrent que le complexe latéral et/ou basolatéral de l'amygdale peut être le lieu de stockage de la mémoire de la peur (Schafe et al., 2005 Kwon et Choi, 2009 Poulos et al., 2009). Alternativement, l'amygdale peut moduler des souvenirs qui sont stockés dans le cortex (McGaugh, 2004 Chavez et al., 2009). Une autre possibilité est que les souvenirs de peur signalés se généralisent à mesure que se produit une perte d'inhibition anticipée sur les interneurones exprimant la parvalbumine, similaire à ce qui a été observé dans l'hippocampe (Ruediger et al., 2011). Ainsi, il est possible que les souvenirs de peur signalés subissent une transformation d'une représentation spécifique à un signal à une représentation générale au sein de la même région et puissent se produire à un rythme plus rapide que les souvenirs contextuels. Alternativement, la généralisation de la peur signalée peut être due à des changements dans les structures afférentes ou efférentes avec des connexions directes avec l'amygdale, telles que le thalamus auditif ou le cortex auditif (Weinberger, 2007). Dans le cas du thalamus auditif, une généralisation accrue de la peur à des tons alternatifs qui n'étaient pas auparavant associés à un choc a été observée à la suite d'une surexpression accrue de la protéine de liaison à l'élément de réponse à l'AMPc (CREB) dans le noyau genouillé médian (Han et al., 2008 ). Cela permettrait une généralisation relativement rapide des réponses de peur à des signaux alternatifs, car l'élargissement du réglage du thalamus auditif peut se produire pendant ou peu de temps après le conditionnement.


                      Possibilités d'accès

                      Acheter un seul article

                      Accès instantané à l'intégralité de l'article PDF.

                      Le calcul des taxes sera finalisé lors du paiement.

                      Abonnez-vous à la revue

                      Accès en ligne immédiat à tous les numéros à partir de 2019. L'abonnement se renouvellera automatiquement chaque année.

                      Le calcul des taxes sera finalisé lors du paiement.


                      Le rôle de la nature dans le conditionnement classique

                      Comme nous l'avons vu au chapitre 1 « Introduction à la psychologie », les scientifiques associés à l'école comportementaliste ont soutenu que tout apprentissage est guidé par l'expérience et que la nature ne joue aucun rôle. Le conditionnement classique, basé sur l'apprentissage par l'expérience, représente un exemple de l'importance de l'environnement. Mais le conditionnement classique ne peut pas être entièrement compris en termes d'expérience. La nature joue également un rôle, car notre histoire évolutive nous a permis d'apprendre certaines associations mieux que d'autres.

                      Les psychologues cliniciens utilisent le conditionnement classique pour expliquer l'apprentissage d'une phobie —une peur forte et irrationnelle d'un objet, d'une activité ou d'une situation spécifique. Par exemple, conduire une voiture est un événement neutre qui ne provoquerait normalement pas de réaction de peur chez la plupart des gens. Mais si une personne subit une attaque de panique au cours de laquelle elle ressent soudainement de fortes émotions négatives en conduisant, elle peut apprendre à associer la conduite à la réaction de panique. La conduite est devenue la CS qui crée désormais la réaction de peur.

                      Les psychologues ont également découvert que les gens ne développent pas de phobies pour n'importe quoi. Bien que les gens puissent dans certains cas développer une phobie de la conduite, ils sont plus susceptibles de développer des phobies envers les objets (tels que les serpents, les araignées, les hauteurs et les espaces ouverts) qui ont été dangereux pour les gens dans le passé. Dans la vie moderne, il est rare que les humains soient mordus par des araignées ou des serpents, qu'ils tombent d'arbres ou de bâtiments, ou qu'ils soient attaqués par un prédateur dans un espace ouvert. Être blessé en conduisant une voiture ou être coupé par un couteau est beaucoup plus probable. Mais dans notre passé évolutif, le potentiel d'être mordu par des serpents ou des araignées, de tomber d'un arbre ou d'être piégé dans un espace ouvert étaient des préoccupations évolutives importantes, et donc les humains sont toujours prêts à apprendre ces associations par rapport aux autres (Öhman & Mineka, 2001 LoBue & DeLoache, 2010).

                      Un autre type de conditionnement important sur le plan de l'évolution est le conditionnement lié à la nourriture. Dans ses importantes recherches sur le conditionnement des aliments, John Garcia et ses collègues (Garcia, Kimeldorf, & Koelling, 1955 Garcia, Ervin, & Koelling, 1966) ont tenté de conditionner les rats en présentant soit un goût, une vue ou un son comme un stimulus avant que les rats reçoivent des médicaments (aux États-Unis) qui les rendent nauséeux. Garcia a découvert que le conditionnement du goût était extrêmement puissant : le rat a appris à éviter le goût associé à la maladie, même si la maladie survenait plusieurs heures plus tard. Mais conditionner la réponse comportementale de la nausée à une vue ou à un son était beaucoup plus difficile. Ces résultats contredisaient l'idée que le conditionnement se produit entièrement à la suite d'événements environnementaux, de sorte qu'il se produirait également pour tout type de stimulus inconditionné qui suivrait tout type de stimulus conditionné. Au contraire, les recherches de Garcia ont montré que la génétique compte : les organismes sont préparés de manière évolutive à apprendre certaines associations plus facilement que d'autres. Vous pouvez voir que la capacité d'associer les odeurs à la maladie est un mécanisme de survie important, permettant à l'organisme d'apprendre rapidement à éviter les aliments toxiques.

                      Le conditionnement classique a également été utilisé pour aider à expliquer l'expérience du trouble de stress post-traumatique (TSPT), comme dans le cas de P. K. Philips décrit dans l'ouverture du chapitre. Le TSPT est un trouble anxieux grave qui peut se développer après une exposition à un événement effrayant, comme la menace de mort (American Psychiatric Association, 1994). Le TSPT survient lorsque l'individu développe une forte association entre les facteurs situationnels qui ont entouré l'événement traumatique (par exemple, les uniformes militaires ou les sons ou les odeurs de la guerre) et les États-Unis (le traumatisme effrayant lui-même). En raison du conditionnement, le fait d'être exposé à, ou même de penser à la situation dans laquelle le traumatisme s'est produit (la SC), devient suffisant pour produire le RC d'anxiété sévère (Keane, Zimering, & Caddell, 1985).

                      Le trouble de stress post-traumatique (TSPT) représente un cas de conditionnement classique à un traumatisme grave qui ne s'éteint pas facilement. Dans ce cas, la réaction de peur originelle, ressentie pendant le combat, est devenue conditionnée à un bruit fort. Lorsque la personne atteinte du SSPT entend un bruit fort, elle éprouve une réaction de peur même si elle est maintenant loin du site du traumatisme initial.

                      Marc Wathieu – Luigi Coppola – CC BY-NC 2.0.

                      Le SSPT se développe parce que les émotions vécues pendant l'événement ont produit une activité neuronale dans l'amygdale et créé un apprentissage conditionné fort. En plus du fort conditionnement que subissent les personnes atteintes du TSPT, ils présentent également une extinction plus lente dans les tâches de conditionnement classiques (Milad et al., 2009). En bref, les personnes atteintes du SSPT ont développé des associations très fortes avec les événements entourant le traumatisme et sont également lentes à montrer l'extinction du stimulus conditionné.

                      Points clés à retenir

                      • Dans le conditionnement classique, une personne ou un animal apprend à associer un stimulus neutre (le stimulus conditionné, ou CS) à un stimulus (le stimulus inconditionné, ou US) qui produit naturellement un comportement (la réponse inconditionnée, ou UR). À la suite de cette association, le stimulus auparavant neutre en vient à susciter la même réponse (la réponse conditionnée, ou CR).
                      • L'extinction se produit lorsque le CS est présenté à plusieurs reprises sans les États-Unis, et le CR disparaît finalement, bien qu'il puisse réapparaître plus tard dans un processus connu sous le nom de récupération spontanée.
                      • La généralisation du stimulus se produit lorsqu'un stimulus similaire à un stimulus déjà conditionné commence à produire la même réponse que le stimulus original.
                      • La discrimination des stimuli se produit lorsque l'organisme apprend à faire la différence entre le CS et d'autres stimuli similaires.
                      • Dans le conditionnement de second ordre, un stimulus neutre devient un CS après avoir été associé à un CS préalablement établi.
                      • Certains stimuli - des paires de réponses, comme celles entre l'odorat et la nourriture - sont plus facilement conditionnés que d'autres car ils ont été particulièrement importants dans notre passé évolutif.

                      Exercices et pensée critique

                      1. Un enseignant place des étoiles dorées au tableau lorsque les élèves sont calmes et attentifs. Finalement, les élèves commencent à devenir silencieux et attentifs chaque fois que l'enseignant s'approche du tableau. Pouvez-vous expliquer le comportement des élèves en termes de conditionnement classique ?
                      2. Rappelez-vous un moment de votre vie, peut-être quand vous étiez enfant, où vos comportements étaient influencés par le conditionnement classique. Décrivez en détail la nature des stimuli inconditionnés et conditionnés et la réponse, en utilisant les termes psychologiques appropriés.
                      3. Si le trouble de stress post-traumatique (TSPT) est un type de conditionnement classique, comment les psychologues pourraient-ils utiliser les principes du conditionnement classique pour traiter le trouble ?

                      La généralisation des stimuli est-elle acquise en raison de l'incapacité à discriminer les stimuli ? - Psychologie

                      Skinner s'intéressait aux comportements qui ont des effets sur l'environnement et sur les comportements eux-mêmes. Les comportements qui agissent ou « opèrent » sur des environnements physiques et sociaux sont appelés opérants. Le conditionnement opérant est un changement de comportement, tel qu'une augmentation ou une diminution de la fréquence d'occurrence, en raison des conséquences de ces comportements (Nye, 1992).
                      La notion de sélection naturelle de Charles Darwin, la « loi de l'effet » d'Edward Thorndike et la théorie de l'apprentissage opérant de Skinner sont basées sur la même idée : Si la conséquence est favorable, la probabilité que la cause de la conséquence se produise augmente. (Lefrancois, 2000).

                      Skinner a construit une petite chambre insonorisée, appelée chambre opérante, pour observer, manipuler et enregistrer le comportement des animaux (Carlson & Buskist, 1997)

                      La boîte à écorcher

                      Les conditions environnementales dans la boîte peuvent être manipulées pour observer comment elles affectent le taux de réponse de l'animal.

                      Une étude typique de Skinner impliquait l'observation de rats appuyant sur un levier ou de pigeons picorant un disque dans une chambre opérante, ce qui déclencherait un distributeur pour libérer de la nourriture. Le principal intérêt de Skinner n'était pas le comportement réel (picage ou pression), mais la vitesse à laquelle ces comportements se produisent dans différentes conditions. Il est important de comprendre les conditions dans lesquelles un comportement augmente ou diminue car nous basons nos hypothèses sur les attributs des personnes sur des observations de la fréquence d'apparition de certains comportements (Nye, 1992).

                      La contingence à trois termes est la relation entre l'événement précédent (stimulus discriminant), la réponse (comportement opérant) et l'événement suivant (conséquence) (Carlson & Buskist, 1997).

                      Le scénario suivant est représentatif de l'éventualité à trois termes :

                      • Vous marchez dans le parc et il commence à pleuvoir.
                      • Vous ouvrez votre parapluie et le tenez au-dessus de votre tête.
                      • Vous restez au sec.
                      • Le stimulus discriminant est la pluie.
                      • Le comportement opérant utilise le parapluie.
                      • La conséquence est de rester sec.

                      Une réponse opérante agit comme un renforçateur s'il produit une conséquence favorable. Il existe deux classes de renforçateurs :

                        Un renforçateur positif - L'apparition d'un stimulus appétitif, suite à une réponse, qui agit pour augmenter la fréquence de cette réponse (Milhollan & Forisha, 1972).

                      Si un élève est félicité pour avoir levé la main en classe et que le fait de lever la main augmente en fréquence, la louange peut être considérée comme un renforcement positif.


                      Un stimulus aversif, suite à une réponse, qui agit pour diminuer la fréquence de cette réponse, est appelé un punisseur .

                      Si un enfant se fait mordre après avoir tiré la queue d'un chien, il est probable que le comportement de tirer la queue diminuera en fréquence. La morsure est le punisseur.

                      L'utilisation de la punition a plusieurs effets secondaires négatifs, y compris le risque de causer des dommages physiques graves, d'induire la peur ou l'hostilité (l'enfant peut développer une peur de tous les chiens après avoir été mordu) et l'incapacité d'apprendre la bonne réponse dans la situation particulière ( Carlson & Buskist, 1997).

                      La suppression d'un stimulus appétitif est aussi une forme de punition. Un exemple bien connu de cette forme de punition, appelée coût de réponse, est le « time out ». Retirer un enfant d'une activité stimulante sert de punition pour un comportement indésirable.


                      Lorsqu'une réponse n'est plus suivie d'un renforçateur, cette réponse précédemment renforcée diminue en fréquence. C'est appelé extinction . Par exemple, un enfant arrêtera de faire des crises de colère s'il ne les renforce plus en y prêtant attention. Cela se produit non pas parce que l'enfant a oublié comment donner des coups de pied et crier, mais parce qu'un tel comportement ne produit pas l'effet souhaité. L'extinction est différente de l'oubli (Carlson & Buskist, 1997).

                      Les renforçateurs primaires, tels que la nourriture, l'eau et les températures extrêmes, sont liés à notre fonctionnement biologique de base. Les renforçateurs secondaires, ou conditionnés, sont des stimuli qui sont à l'origine neutres, mais deviennent des renforçateurs par leur association avec des renforçateurs primaires. Un puissant renforçateur secondaire est l'argent. Il a été associé à de nombreux renforçateurs primaires. Les renforçateurs généralisés sont des renforçateurs secondaires associés à plusieurs renforçateurs primaires. L'affection est un exemple de renforçateur généralisé. Il a été associé à un contact sexuel et à l'obtention de ressources telles que la chaleur et la protection (Nye, 1992).

                      Le renforcement accidentel d'une réponse peut conduire à un comportement superstitieux. Skinner a démontré le conditionnement d'un tel comportement en utilisant des pigeons. Il a réglé le distributeur pour livrer de la nourriture aux animaux dans une chambre opérante à des intervalles de temps fixes, par exemple toutes les 15 minutes. Les pigeons associaient tout comportement dans lequel ils se livraient au moment de la distribution de la nourriture à la livraison de la nourriture. La probabilité que ces comportements se produisent a ensuite augmenté. Skinner a conditionné les pigeons à tourner en rond, à hocher la tête ou à faire des mouvements de balancement. (Nyé, 1992)

                      Renforcement continu : Chaque réponse est renforcée. Par exemple, chaque fois qu'un pigeon picore le disque dans une chambre opérante, de la nourriture est distribuée.

                      • Calendrier à ratio fixe : Le renforcement est livré après qu'un nombre fixe de réponses ait été effectué. Par exemple, chaque cinquième fois qu'un pigeon picore le disque dans une chambre opérante, la nourriture est distribuée.
                      • Programme de ration variable : Le nombre de réponses requises pour qu'un renforçateur soit délivré varie pour chaque essai. Par exemple, une machine à sous nécessite un nombre variable de réponses après chaque essai pour payer.
                      • Programme à intervalle fixe : un renforçateur est administré après un laps de temps déterminé. Par exemple, la nourriture est distribuée à intervalles de 15 minutes.
                      • Horaire à intervalle variable : Un renforçateur est administré après un laps de temps moyen. Par exemple, la nourriture peut être distribuée après 30 secondes lors du premier essai et après 90 secondes lors du deuxième essai, mais la moyenne reste de 60 secondes (Carlson et Buskist, 1997).

                      La mise en forme consiste à renforcer les approximations successives d'un comportement souhaité. Il est largement utilisé par les dresseurs d'animaux pour apprendre aux animaux à faire des tours.

                      L'enchaînement implique une réponse conduisant à l'apparition d'une autre réponse. La plupart des comportements se produisent dans les chaînes. Un exemple de base d'enchaînement consiste à dire les lettres de l'alphabet. La lettre A agit comme le stimulus discriminant pour produire la réponse suivante, en disant la lettre B, et ainsi de suite (Milhollan & Forisha, 1972).

                      La généralisation implique l'obtention d'une réponse à un stimulus qui ressemble au stimulus discriminant. La généralisation est utile dans la mesure où elle facilite le transfert de comportement dans des situations similaires. Par exemple, une secrétaire qui peut taper sur une machine à écrire peut également taper sur un clavier d'ordinateur.

                      La discrimination implique le déclenchement d'une réponse uniquement en présence d'un stimulus discriminant spécifique, et non en présence de stimuli similaires. La discrimination est utile lorsqu'une réponse particulière n'est pas appropriée dans des situations similaires. Par exemple, un comportement approprié dans un restaurant de restauration rapide, comme manger avec les mains, peut ne pas être approprié dans un restaurant français. (Carlson & Buskist, 1997)


                      Discussion

                      La confiance est une composante fondamentale de la vie sociale humaine (45). Cependant, on comprend peu de choses sur les mécanismes cognitifs et neuronaux qui soutiennent l'apprentissage de la confiance en l'absence d'informations explicites sur la réputation. Ici, nous démontrons qu'un mécanisme lié à la généralisation de la valeur associative - un processus documenté à travers les espèces - est également déployé chez l'homme dans des environnements de prise de décision sociale très complexes. Nous constatons que l'on fait davantage confiance aux étrangers ressemblant davantage à des personnes antérieurement connues pour être dignes de confiance et que ceux qui ressemblent à des personnes précédemment connues pour être indignes de confiance sont moins dignes de confiance. Ces profils d'ajustement comportemental sont déployés de manière asymétrique, de sorte que les individus sont davantage méfiés lorsqu'ils ressemblent même un peu à quelqu'un qui était auparavant associé à des résultats peu fiables et aversifs.Une généralisation plus large dans le domaine aversif s'accorde avec l'idée qu'identifier incorrectement un stimulus dangereux comme sûr est plus coûteux que de traiter un stimulus sûr comme une menace (46). Ces profils de réglage comportemental se sont reflétés au niveau neuronal. Dans le domaine perceptuel, le rôle fonctionnel de l'amygdale dans le suivi du manque de confiance était soutenu à la fois par l'augmentation de l'activité BOLD univariée et par la similarité du modèle d'activation multivariée, de sorte que les modèles de représentation neuronale étaient induits de manière graduée le long du gradient non digne de confiance.

                      Ces résultats prolongent les travaux antérieurs liant l'amygdale au traitement des menaces et aux jugements de fiabilité (32 ⇓ -34), révélant que non seulement son activité hémodynamique reflète l'implication dans l'extraction d'informations sur le manque de confiance d'un individu (20), mais qu'elle code également fonctionnellement des informations sur manque de confiance au niveau de la représentation. Cette analyse fonctionnelle de niveau supérieur permet une approche fine pour déduire les états mentaux, démontrant que l'amygdale représente des informations critiques sur les individus potentiellement menaçants. Lorsqu'elle perçoit un étranger qui ressemble à un individu du passé indigne de confiance, l'amygdale évoque un modèle de représentations BOLD similaires aux représentations qui soutiennent l'apprentissage initial. La preuve d'un profil d'accord neuronal retraçant la similitude perceptive de manière graduée (15) implique que l'amygdale code sélectivement le transfert de valeur sociale négative entre des individus qui se ressemblent perceptuellement.

                      Nous avons en outre observé que les profils de réglage neuronal dans le caudé et le vmPFC suivent les schémas comportementaux pour choisir des partenaires qui pourraient obtenir des résultats positifs et éviter les partenaires qui pourraient produire des résultats négatifs, respectivement. Ces résultats indiquent qu'en l'absence d'informations directes et explicites sur la réputation d'un individu, les décisions adaptatives de faire confiance ou de refuser la confiance reposent sur des modèles d'activation similaires à ceux suscités lors de l'apprentissage d'autres individus non apparentés, mais perceptuellement familiers. Ces profils de réglage neuronal de choix capturent le comportement au-delà du simple suivi de la similitude perceptive, révélant qu'au niveau neuronal, un mécanisme d'apprentissage associatif déploie efficacement les informations morales encodées à partir d'expériences passées pour guider les choix futurs.

                      Ensemble, ces résultats suggèrent que pour décider à qui faire confiance, les humains s'appuient sur une heuristique d'apprentissage efficace, bien que rudimentaire, qui facilite l'engagement adaptatif. Un mécanisme de généralisation basé sur la similitude peut être hautement adaptatif car il permet à de nombreux stimuli - dans ce cas, des individus inconnus - d'acquérir de la valeur à partir d'un apprentissage minimal. Même sans aucune expérience directe du manque de confiance, les individus implicitement considérés comme potentiellement non dignes de confiance sont systématiquement évités. Des travaux futurs visant à déterminer si les taux d'apprentissage initiaux biaisent l'efficacité de la généralisation seraient une prochaine étape importante pour comprendre si des contextes spécifiques facilitent un apprentissage rapide. Il est important de noter que notre tâche s'écarte des tâches de généralisation de stimulus canoniques dans lesquelles les nouveaux stimuli sont souvent perçus comme se chevauchant explicitement avec le stimulus initial. Les sujets de nos expériences pensaient qu'ils sélectionnaient de vrais partenaires pour le prochain jeu et traitaient donc chaque partenaire potentiel comme unique. Cela indique que même en l'absence de conscience, l'apprentissage social s'appuie sur des processus neuronaux qui font des comparaisons entre les expériences actuelles et passées pour biaiser les décisions quant à savoir à qui faire confiance. En fin de compte, la découverte que les choix sociaux complexes et dyadiques semblent être soutenus par des mécanismes comportementaux et neuronaux qui opèrent à travers les domaines et les espèces suggère qu'un système de domaine général régit de nombreux types d'apprentissage émotionnel.


                      Voir la vidéo: Comment votre cerveau répond-il à la douleur? - Karen D. Davis (Juin 2022).


Commentaires:

  1. Tawil

    Bien sûr. C'était avec moi aussi. Nous pouvons communiquer sur ce thème. Ici ou en MP.

  2. Fassed

    Je conseille à tout le monde)



Écrire un message