Operant Konditionierung Definition, Merkmale und Beispiele



Die operante Konditionierung o Instrumentelle Konditionierung ist eine Art des Lernens, bei der das Verhalten mit Konsequenzen kontrolliert wird.

Es basiert auf der Idee, dass verstärkende Verhaltensweisen bei mehr Gelegenheiten auftreten, während Verhaltensweisen, die bestraft werden, ausgelöscht werden.

Was ist der Unterschied zwischen operanter Konditionierung und klassischer Konditionierung? In der operanten Konditionierung folgt auf eine freiwillige Antwort ein Verstärker. Auf diese Weise wird die freiwillige Antwort (zum Beispiel für eine Prüfung) in der Zukunft eher auftreten. Im Gegensatz dazu aktiviert ein Stimulus in der klassischen Konditionierung automatisch eine unfreiwillige Reaktion.

Operantenkonditionierung kann als ein Prozess beschrieben werden, der versucht, das Verhalten durch die Verwendung positiver und negativer Verstärkung zu modifizieren. Durch operante Konditionierung macht ein Individuum einen Zusammenhang zwischen einem bestimmten Verhalten und einer Konsequenz. Beispiele:

  • Eltern belohnen gute Noten für ein Kind mit Süßigkeiten oder anderen Belohnungen.
  • Ein Lehrer belohnt jene Studenten, die ruhig und gebildet sind. Die Schüler erkennen, dass sie dadurch mehr Punkte erhalten.
  • Jedes Mal, wenn ein Hebel gedrückt wird, wird einem Tier ein Futter gegeben.

B. F. Skinner (1938) prägte den Begriff der operanten Konditionierung. Skinner hat drei Arten von Antworten oder Operanden identifiziert, die dem Verhalten folgen können:

  • Neutrale Betreiber: Antworten aus der Umgebung, die die Wahrscheinlichkeit eines wiederholten Verhaltens nicht erhöhen oder verringern.
  • Verstärkungen: Antworten aus der Umgebung, die die Wahrscheinlichkeit der Wiederholung eines Verhaltens erhöhen. Verstärkungen können positiv oder negativ sein.
  • Bestrafungen: Antworten aus der Umgebung, die die Wahrscheinlichkeit verringern, dass sich ein Verhalten wiederholt. Bestrafung schwächt das Verhalten.

Vorläufer der operanten Konditionierung

Thorndike erkannte als Erster, dass diese Konditionierung mehr als nur eine Antwort und einen Verstärker beinhaltet. Die Antwort wird in Anwesenheit bestimmter Reize gegeben, wobei drei Ereignisse berücksichtigt werden: der Reiz, die Antwort und die Konsequenz der Antwort oder des Verstärkers.

Diese Struktur erleichtert die Entwicklung verschiedener Verbindungen, wie der Zusammenhang zwischen dem Reiz und der Antwort, die für Thorndike Schlüssel zur Formulierung des Gesetzes der Wirkung war. Damit bekräftigte er, dass die Antworten, die von verstärkenden Konsequenzen gefolgt werden, wahrscheinlicher auftreten werden, wenn der Reiz wieder erscheint.

Im Gegenteil, die Antworten, denen negative Folgen folgen, haben eine geringere Wahrscheinlichkeit, dass der Reiz wieder auftritt. Das Gesetz der Wirkung ist das Voranschreiten der operativen Konditionierung oder instrumentellen Konditionierung, wie es von Thorndike benannt wurde.

Aber für Skinner, den Verhaltenspsychologen, war die Konditionierung die Stärkung der Verhaltensweisen entsprechend den Konsequenzen, die früher erreicht worden wären.

In dieser Linie gibt es zwei Formen der Konditionierung:

  • Der Klassiker oder Pawlowian: Es beruht auf der Verbindung von unbedingten und konditionierten Stimuli, wobei es sich um die Reaktionen handelt, die von vorangegangenen Stimuli gesteuert werden.
  • Operante Konditionierung: Die konsequenten oder verstärkenden Stimuli bewirken, dass ein bestimmtes Verhalten ausgelöst wird. Skinner erklärt, dass, wenn das Verhalten von einem positiven Verstärker gefolgt wird, es die Wahrscheinlichkeit erhöhen würde, dass ein solches Verhalten in der Zukunft ausgegeben wird. Im Gegenteil, wenn eine Antwort nicht von einem Verstärker gefolgt wird oder dass der Verstärker negativ ist, wird die Wahrscheinlichkeit, dieses Verhalten in der Zukunft auszugeben, niedriger sein.

Grundlegende Konzepte der operanten Konditionierung

Verstärkung

Es ist verantwortlich für die Ausgabe von Antworten, dh die Wahrscheinlichkeit ihres Auftretens, ob sie in Zukunft größer oder kleiner ist. Es ist ein verstärkender und konsistenter Stimulus, da er auftritt, sobald die Reaktion stattgefunden hat.

Es ist unmöglich zu wissen, ob ein bestimmter Verstärker das Verhalten beeinflusst, bis er kontingent mit einer Antwort dargestellt wird und dass sich das Verhalten als Folge des Verstärkers ändert.

Es gibt zwei Arten von Verstärkungen: Positiv und Negativ. Beide haben den gleichen Zweck, die Wahrscheinlichkeit zu erhöhen, dass die Antwort in zukünftigen Situationen ausgegeben wird. Darüber hinaus werden Verstärker für Skinner durch Verhaltensweisen definiert, die beobachtbar und messbar sind.

Positive Verstärkung

Positive Verstärkung verstärkt ein Verhalten, indem es eine Konsequenz liefert, die eine Person als lohnend empfindet.

Negative Verstärkung

Die Entfernung eines unangenehmen Verstärkers kann auch ein Verhalten verstärken. Dies wird negative Verstärkung genannt, weil es die Beseitigung eines negativen Reizes ist, der für das Tier oder die Person "lohnend" ist. Negative Verstärkung verstärkt das Verhalten, weil es eine unangenehme Erfahrung stoppt oder beseitigt.

Hauptverstärker

Sie wären all diese grundlegenden Verstärker, die keine Geschichte der vorherigen Konditionierung brauchen, um als solche zu funktionieren. Einige Beispiele wären Wasser, Essen und Sex.

Sekundäre Verstärker

Die sekundären Verstärker würden aufgrund der Assoziation mit unkonditionierten Stimuli auf früheren Konditionierungsgeschichten basieren.Einige Beispiele wären Geld und Qualifikationen.

Kontingenz von drei Begriffen

Es ist das Grundmodell der operanten Konditionierung und besteht aus drei Komponenten: dem diskriminativen Reiz, der Antwort und dem verstärkenden Reiz.

Ein diskriminierender Stimulus wäre derjenige, der dem Subjekt anzeigt, dass der Verstärker verfügbar ist, was anzeigt, dass er, wenn er ein bestimmtes Verhalten ausführt, diesen Verstärker erhalten kann. Im Gegensatz dazu haben wir den Delta-Stimulus oder Stimuli, die anzeigen, dass das Verhalten nicht dazu führt, irgendeine Art von Verstärker zu erhalten.

Die Antwort wäre das Verhalten, das das Subjekt ausführen wird, dessen Ausführung den verstärkenden Stimulus erhalten wird oder nicht.

Ein verstärkender Stimulus, wie oben erwähnt, ist für die Emission des Verhaltens verantwortlich, da die Wahrscheinlichkeit, dass eine Antwort ausgegeben wird, in Zukunft zunehmen oder abnehmen wird.

Konzepte zur Kenntnis über operante Konditionierung

Bestrafung

Die Bestrafung wird auch an den Auswirkungen auf das Verhalten des Probanden gemessen. Auf der anderen Seite ist im Gegensatz zur Verstärkung die Reduktion oder Unterdrückung eines bestimmten Verhaltens beabsichtigt.

Eine Bestrafung reduziert die Wahrscheinlichkeit, in späteren Situationen ein Verhalten auszugeben. Es beseitigt jedoch nicht die Antwort, denn wenn die Bedrohung der Bestrafung abnimmt, kann das Verhalten wieder auftreten.

In der Bestrafung gibt es auch zwei verschiedene Arten oder Verfahren, positive Bestrafung und negative Bestrafung.

positive Strafe

Dies beinhaltet die Präsentation eines aversiven Stimulus nach der Ausführung eines bestimmten Verhaltens. Es wird kontingent der vom Subjekt gegebenen Antwort gegeben.

negative Strafe

Es besteht in der Beseitigung eines Reizes als Folge eines bestimmten Verhaltens, dh es besteht in der Zurücknahme eines positiven Reizes nach der Ausführung eines bestimmten Verhaltens.

Aussterben

In der Auslöschung wird eine Antwort gestoppt, weil der Verstärker nicht mehr erscheint. Dieser Prozess beruht darauf, dass der entsprechende Verstärker, der erwartungsgemäß erreicht werden soll, nicht zur Verfügung steht und dass dieses Verhalten im Laufe der Zeit aufrechterhalten wurde.

Wenn eine Antwort ausgelöscht wird, wird der diskriminierende Stimulus ein Extinktionsstimulus. Dieser Prozess sollte nicht mit dem Vergessen verwechselt werden, das gegeben wird, wenn die Kraft eines Verhaltens abnimmt, wenn es nicht in einem Zeitraum ausgegeben wurde.

Generalisierung

Bei einer bestimmten Situation oder einem spezifischen Reiz ist eine Reaktion bedingt, die vor anderen Reizen oder ähnlichen Situationen auftreten kann.

Diskriminierung

Dieser Prozess ist das Gegenteil der Verallgemeinerung, er reagiert je nach Reiz und Kontext unterschiedlich.

Verstärkungsprogramme

Skinner richtete auch mehrere Verstärkungsprogramme ein, einschließlich kontinuierlicher Verstärkungsprogramme und intermittierender Verstärkungsprogramme.

Kontinuierliche Verstärkungsprogramme

Sie basieren auf der beständigen Verstärkung der Reaktion bei jeder Präsentation, dh jedes Mal, wenn das Subjekt das gewünschte Verhalten zeigt, erhält es einen verstärkenden oder positiven Stimulus.

Intermittierende Verstärkungsprogramme

Im Gegensatz dazu erhält das Subjekt hier nicht immer den Verstärker, wenn das gewünschte Verhalten ausgeführt wird. Diese werden auf der Grundlage der Anzahl der gegebenen Antworten oder des Zeitintervalls zwischen den Antworten definiert, was zu unterschiedlichen Verfahren führt.

Feste Verhältnisprogramme

In diesen Programmen wird der Verstärker bereitgestellt, wenn das Subjekt feste und konstante Antworten erzeugt. Zum Beispiel erhält die Person in einem Programm mit dem Verhältnis 10 den Verstärker, nachdem sie zehn Antworten gemacht hat, wenn der Reiz präsentiert wird.

Programme mit variablem Verhältnis

Dies ist wie der vorherige aufgebaut, aber in diesem Fall ist die Anzahl der Antworten, die das Subjekt geben muss, um den Verstärker zu erhalten, variabel.

Der Verstärker würde weiterhin von der Anzahl der Antworten abhängen, die von der Person emittiert werden, aber mit einem variablen Grund, dank dessen die Person verhindert wird, vorherzusagen, wann der Verstärker erhalten wird.

Feste Intervallprogramme

In Intervallprogrammen hängt das Erhalten des Verstärkers nicht von der Anzahl der Antworten ab, die das Subjekt gibt, sondern wird durch die verstrichene Zeit bestimmt. Folglich wird die erste Antwort, die nach Ablauf einer bestimmten Zeitspanne erzeugt wird, verstärkt.

In Festintervallprogrammen ist die Zeit zwischen Verstärker und Verstärker immer gleich.

Variable Intervallprogramme

In diesen Programmen wird der Verstärker nach einer Weile erhalten, obwohl die Zeit für jeden empfangenen Verstärker unterschiedlich ist.

Verhaltensänderung

Aufeinander folgende Annäherungen oder Formen

Das Formen besteht aus der Verhaltensänderung durch das Formen von Verhaltensweisen oder die differentielle Verstärkung von aufeinanderfolgenden Ansätzen.

Eine Reihe von Schritten folgt, um ein konkretes Verhalten zu formen. Zunächst wird das anfängliche Verhalten, das geformt werden soll, identifiziert, um zu wissen, welches man erreichen möchte.

Dann werden die möglichen Verstärker, die verwendet werden sollen, abgegrenzt und der Prozess wird in Schritten oder Stufen getrennt, um zu dem endgültigen Verhalten zu kommen, wobei jeder Schritt oder jeder nachfolgende Ansatz verstärkt wird, bis der letzte erreicht wird.

Mit diesem dynamischen Verfahren werden sowohl Verhaltensweisen als auch deren Konsequenzen transformiert. In diesem Sinne werden die aufeinander folgenden Annäherungen an ein objektives Verhalten verstärkt.

Um jedoch ausgeführt zu werden, ist es notwendig, von einem früheren Verhalten, das das Subjekt bereits ausführt, auszugehen, um sein Verhalten allmählich zu verstärken, bis sie das Ziel erreichen.

Kette

Mit ihm wird ein neues Verhalten aus der Zerlegung in einfachere Schritte oder Sequenzen gebildet, wobei jede Antwort, die in jedem der Schritte gegeben wird, verstärkt wird, um zur Etablierung einer komplexeren Antwort im Verhaltensrepertoire der Person zu führen.

Lange Ketten von Reaktionen können unter Verwendung von konditionierten Verstärkern gebildet werden, die eine funktionelle Einheit annehmen, deren Aufbau zur Erfassung und Definition einer bestimmten Fähigkeit führt.

Referenzen

  1. Operante Konditionierung. Von wikipedia.org abgerufen
  2. Operante Konditionierung. Von e-torredebabel.com abgerufen.
  3. Von biblio3.url abgerufen.
  4. Gesetz der Wirkung. Von wikipedia.org abgerufen.
  5. Aussterben Von wikipedia.org.
  6. Domjan, M. Prinzipien des Lernens und des Verhaltens. Paraninfo. 5. Ausgabe.