WARNING:
JavaScript is turned OFF. None of the links on this concept map will
work until it is reactivated.
If you need help turning JavaScript On, click here.
Cette carte de concepts créée avec IHMC CmapTools traite de: Plans de Renforcement Bloc8, Nature de l’association apprise S - R? - La loi de l’effet de Thorndike: « suivi » donc serait-il cas de l’apprentissage par la contiguïté? - Mais déjà en 1928, Tinklepaugh démontre que les organismes apprennent à s’attendre à recevoir des renforçateurs particuliers: des singes à qui on donne une feuille de salade se montrèrent déçus quand ils “s’attendaient” à un morceau de banane., Plan à ratio : basé sur le nombre de réponses ratio fixe (FR) ratio variable (VR) Plan à intervalle ou plan fenētre: basé sur le délai depuis le dernier renforcement ou plan FRÉQUENCE intervalle fixe (FI) intervalle variable (VI) Chaque type de plan produit une courbe de réponses caractéristique Plans à ratio variable on ne sait combien de réponses qu'il faut mais on sait qu'une récompense s'en vient "MACHINES A SOUS" Ratio: l’obtention du renforcement est conditionnel à la production d’un nombre déterminé de réponses répétitives Variable: le nombre de réponses nécessaires varie d’un renforcement à l’autre Exemple: une machine à sous, VLT de Loto-Québec Comportement observé: effort élevé et constant PAS DE PAUSE, PLANS DE RENFORCEMENT NOTIONS DE RENFORCATEUR Notion de renforçateur selon Pavlov “Les renforçateurs sont des SI qui sont pairés avec des SC” selon Thorndike “Les renforçateurs fournissent de la satisfaction et ceci établit des connexions entre les stimuli” selon Skinner “Un renforçateur est tout stimulus qui augmente la réponse qui le précède”, Plan à ratio : basé sur le nombre de réponses ratio fixe (FR) ratio variable (VR) Plan à intervalle ou plan fenētre: basé sur le délai depuis le dernier renforcement ou plan FRÉQUENCE intervalle fixe (FI) intervalle variable (VI) Chaque type de plan produit une courbe de réponses caractéristique Plans à intervalle fixe LE POSTIER, ON SAIT QUIL PASSE UNE SEULE FOIS Intervalle: le renforcement est disponible (pour être obtenu) seulement après une période de temps déterminée - une seule réponse est alors suffisante Fixe: la durée de l’intervalle ne change pas d’un renforcement à un autre Exemple: vérifier si le courrier est passé Comportement observé: des réponses isolées et espacées dans le temps, Plans de renforcement il y a toujours une égle de base qui vas le structurer Plans de renforcement simples Plan à ratio : basé sur le nombre de réponses ratio fixe (FR) ratio variable (VR) Plan à intervalle ou plan fenētre: basé sur le délai depuis le dernier renforcement ou plan FRÉQUENCE intervalle fixe (FI) intervalle variable (VI) Chaque type de plan produit une courbe de réponses caractéristique, Nature de l’association apprise R - SR ? ou meme S - R - SR ? C’est que propose Colwill et Rescorla dans leur modèle de la contingence., Plan à ratio : basé sur le nombre de réponses ratio fixe (FR) ratio variable (VR) Plan à intervalle ou plan fenētre: basé sur le délai depuis le dernier renforcement ou plan FRÉQUENCE intervalle fixe (FI) intervalle variable (VI) Chaque type de plan produit une courbe de réponses caractéristique Plans à intervalle variable UN PEU COMME LES MACHINES A SOUS il y a une probabilité de gagner encore, trés minime, mais probable Intervalle variable: court et moyen le renforcement est disponible(pour être obtenu) seulement après une période de temps déterminée - une seule réponse est alors suffisante Variable: la durée de l ’intervalle varie d’un renforcement à un autre Exemple: recomposer un numéro de téléphone occupé Comportement observé: rythme de réponses lent mais constant, Plans de renforcement il y a toujours une égle de base qui vas le structurer Renforcement continu vs renforcement partiel Le renforcement continu: chaque réponse appropriée est suivi d’un renforcement PAVLOV toujours suivi de la nourriture contingence 100% cepedant lors de la phase d'instinction on retrouve une réponse inconditionnelle innée dans la reaction qui suit l'arret de récompense qui se nome la réponse de frustration qui peut fonctionner pour ravoir la rcompense et plus elle etait bonne la récompense plus la RI apres instinction sera forte. Le renforcement partiel: chaque réponse appropriée n’est pas nécessairement suivi d’un renforcement RESCORLA 99%et moins de contingence à 1% L’effet du renforcement partiel (trés mauvais pour ce qu'on veut se débarasser) ralentissement de la courbe d’apprentissage résistance à l’extinction leur force car il peut etre un conditionnement plus résistant car il y a plus de RI de frustration avant la phase d'instinction mais dans la phase d'acquisition SIMILAIREMENT par discrimination il choisit celle qui marche de temps en temps . Ainsi, la phase d'instinction vas déclancher le RI, PLANS DE RENFORCEMENT NOTIONS DE RENFORCATEUR Principe de Premack 1 heure au choix: 28 min de recherche de racines 17 min de repos Newt préfère la recherche de racines la recherche de racine peut renforcer Newt, PLANS DE RENFORCEMENT NOTIONS DE RENFORCATEUR Principe de Premack David Premack (1925-) est un chercheur aujourd’hui spécialisée dans le domaine de l’intelligence des primates Il vas terster la mermanence de l'objet chez les primates par la substitution des bananes avec la salade. Mais plutôt dans sa carrière, il a proposé une conception différente de ce qui constitue ou peut constituer un renforçateur suite à une série d’observations faites chez le cochon., Nature de l’association apprise Hammond: contiguïté vs. contingence - R et SR sont-ils associés car ils sont contiguë ou contingent? - L ’expérience de contingence d’Hammond (1980): Phase 1: renforcement de 5% des réponses seulement - Résultat: 3000 pression de levier par heure; Phase 2: continuation du renforcement de la phase 1, mais ajout de récompenses dans 5% des cas où aucune pression n ’a été faite - Résultat: Le taux de réponse diminue graduellement presque à zéro Phases 3 & 4 répétition de 1 & 2 (design ABAB), PLANS DE RENFORCEMENT NOTIONS DE RENFORCATEUR Principe de Premack Application de Premack Tout comportement en dessous de son optimum peut être un renforçateur; Ainsi, si le niveau optimale de préférence d’un individu est d’étudier 20% du temps et qu’il ne peut étudier que 10%, alors pouvoir étudier plus que 10% pourra servir à renforcer un autre comportement;, Plan à ratio : basé sur le nombre de réponses ratio fixe (FR) ratio variable (VR) Plan à intervalle ou plan fenētre: basé sur le délai depuis le dernier renforcement ou plan FRÉQUENCE intervalle fixe (FI) intervalle variable (VI) Chaque type de plan produit une courbe de réponses caractéristique Plans à ratio fixe Ratio: l’obtention du renforcement est conditionnel à la production d’un nombre déterminé de réponses répétitives toujours invariables au niveau du nombre. Fixe: le nombre de réponses nécessaires ne changent pas Exemple: le travail payé à l’unité produite Comportement observé: réponse à haute fréquence mais suivie d’une pause “post-renforcement” pour les ratio élevés