Quadranten-Lese der operanten Konditionierung — die ethisch-praktische Bewertung jenseits der Aversiv-Polarisierung
Vier Quadranten, drei Trainer-Verbände, ein § 3 TierSchG. Eine systematische Lese der operanten Konditionierung in der gegenwärtigen DACH-Hundeschul-Praxis.
Die operante Konditionierung gehört zu den am häufigsten zitierten und am seltensten präzise verstandenen Konzepten der gegenwärtigen Hunde-Erziehungs-Debatte. Wer in DACH-Hundeschulen mitliest, dem begegnet das Vier-Quadranten-Modell beinahe wöchentlich — meist als Argument, mal als Begründung, oft als Etikett. Apport hat sich vorgenommen, die Quadranten so zu beschreiben, wie sie sich in der gegenwärtigen veterinär-verhaltensmedizinischen Literatur tatsächlich ausnehmen, und so zu bewerten, wie sie sich in der trainingspraktischen Anwendung tatsächlich verhalten.
Das Quadranten-Modell — eine kurze Vergewisserung
Burrhus Frederic Skinner formulierte das operante Konditionierungs-Modell in den späten 1930er-Jahren. Die vier Quadranten entstehen aus zwei Dimensionen: ob ein Stimulus hinzugefügt (positiv, +) oder entzogen (negativ, −) wird, und ob die Konsequenz das Verhalten verstärkt (Reinforcement, R) oder abschwächt (Punishment, P).
- R+ (positive Verstärkung): Ein angenehmer Stimulus wird hinzugefügt — der Hund sitzt, bekommt ein Stück Käse, sitzt häufiger.
- R− (negative Verstärkung): Ein unangenehmer Stimulus wird entzogen — der Hund weicht dem Leinen-Zug aus, der Zug lässt nach, das Ausweichen wird häufiger.
- P+ (positive Bestrafung): Ein unangenehmer Stimulus wird hinzugefügt — der Hund springt hoch, bekommt einen Leinenruck, das Hochspringen wird seltener.
- P− (negative Bestrafung): Ein angenehmer Stimulus wird entzogen — der Hund springt hoch, das Spiel wird abgebrochen, das Hochspringen wird seltener.
So weit die lehrbuchmäßige Grundordnung. Sie ist seit Karen Pryors Don’t Shoot the Dog (1984, deutsch 2003) Allgemeingut der modernen Hundetrainer-Ausbildung; sie ist trotzdem in der praktischen Anwendung Gegenstand erheblicher methodischer Differenzen.
Die Markersignal-Tradition nach Pryor — R+ als Leitlinie
Pryors entscheidende Übertragungs-Leistung war nicht die Theorie selbst — sondern die Verbindung der R+-Quadranten-Anwendung mit dem Markersignal (Clicker, akustisches Marker-Wort), das die zeitliche Lücke zwischen Verhalten und Verstärkung präzise überbrückt. Pryor hatte das Konzept aus der Meeressäuger-Dressur (Delphine, Orcas) übernommen, bei der körperliche Korrektur schlicht nicht möglich war.
Die zeitgenössische deutsche Markersignal-Schule — vertreten durch Trainer:innen wie Viviane Theby, Mirjam Cordt und das Umfeld der Tierärztlichen Hochschule Hannover — versteht R+ als methodische Erstwahl, nicht als ideologische Ausschließlichkeit. Adam Miklósi vom Department of Ethology der ELTE Budapest und James Serpell von der University of Pennsylvania School of Veterinary Medicine haben in mehreren Übersichtsarbeiten (Miklósi 2014, Serpell 2017) die wissenschaftliche Robustheit dieser Position dokumentiert: R+-basiertes Training erzeugt nachweislich geringere Stress-Indikatoren (Speichel-Cortisol, Lippenlecken-Frequenz) als gemischtes Training und ist in der Erlernensgeschwindigkeit gleichwertig bis überlegen.
„Die Frage ist nicht, ob Hunde durch P+ lernen können — sie können. Die Frage ist, ob das Lernen, das wir damit erzeugen, das Lernen ist, das wir wollen.” — Patricia McConnell, in The Other End of the Leash (deutsche Ausgabe 2008)
Die Turid-Rugaas-Tradition — Beschwichtigungs-Signale als Lese-Schlüssel
Eine zweite, in DACH überaus präsente Schul-Linie ist die der norwegischen Hundetrainerin Turid Rugaas. Rugaas formulierte in den 1990er-Jahren das Konzept der calming signals — etwa dreißig Verhaltens-Mikro-Marker, die Hunde in Stress-Situationen zeigen (Kopf-Abwenden, Schnüffeln, Gähnen, Lippenlecken, Bogen-Laufen). Die Rugaas-Tradition ist methodisch nicht primär operant-konditionierend gedacht, sondern kommunikativ-ethologisch — die Trainer:in beobachtet, was der Hund signalisiert, und passt ihr eigenes Verhalten an. Operante Quadranten werden in dieser Tradition vor allem skeptisch betrachtet: P+ und R− gelten als kommunikative Störung, R+ als zweite Wahl nach der eigentlich vorrangigen Situations-Vermeidung.
Der TBT (Turid Rugaas Behaviour-Trainers) zertifiziert in DACH gegenwärtig etwa 180 aktive Trainer:innen, die diese Schule vertreten. Ihre methodische Differenz zur Markersignal-Schule ist nicht ideologisch, sondern eine andere Priorisierung: Beobachten vor Trainieren, Vermeiden vor Verstärken.
Die Mech/Bradshaw-Wende — vom Dominanz-Modell zur Sozial-Lese
Eine dritte Tradition, die im deutschen Sprachraum lange Zeit dominierte und heute differenziert wird, ist die Dominanz-Lese, die historisch auf David Mechs Wolfs-Studien der 1970er-Jahre zurückgeht. Mech selbst hat seit den frühen 2000er-Jahren mehrfach öffentlich klargestellt, dass das Alpha-Wolf-Modell aus Gehege-Beobachtungen stammt und auf Wildwolf-Rudel — und erst recht auf Hund-Mensch-Beziehungen — nicht übertragbar ist. John Bradshaw hat in Dog Sense (2011) die wissenschaftliche Demontage dieses Modells für die breitere Leser:innenschaft besorgt; In Defence of Dogs erschien in einer deutschen Übersetzung 2013.
Die Dominanz-Tradition lebt in der DACH-Hundeschul-Landschaft trotzdem nach — meist in Mischformen, die P+ (Leinenruck, körperliche Korrektur, Rütteldosen) als „klare Kommunikation” rationalisieren. Diese Rationalisierung ist veterinär-verhaltensmedizinisch nicht haltbar.
P+ und § 3 TierSchG — die rechtlich-ethische Grenze
§ 3 des Tierschutzgesetzes verbietet, „einem Tier außer in Notfällen Leistungen abzuverlangen, denen es wegen seines Zustandes offensichtlich nicht gewachsen ist oder die offensichtlich seine Kräfte übersteigen”, sowie „ein Tier zu einer Filmaufnahme, einer Schaustellung, einer Werbung oder einer ähnlichen Veranstaltung heranzuziehen, sofern damit Schmerzen, Leiden oder Schäden für das Tier verbunden sind”. § 3 Nr. 5 verbietet ausdrücklich, „ein Tier auszubilden oder zu trainieren, sofern damit erhebliche Schmerzen, Leiden oder Schäden für das Tier verbunden sind”.
Das BMEL hat in der Tierschutz-Hundeverordnung (TierSchHuV, zuletzt geändert 2021) konkretisiert: Stachelhalsbänder, Würger ohne Stopp und elektrische Reizgeräte (E-Halsbänder) sind ausnahmslos verboten. Das Verwaltungsgericht Karlsruhe (Urteil v. 10.03.2014, 6 K 2020/12) hat dies in der Auslegung bestätigt; das BVerwG (Beschluss v. 23.02.2018, 3 B 67.17) hat die Linie bekräftigt.
Die methodische Konsequenz: P+ als Trainings-Quadrant ist nicht pauschal verboten — ein abgebrochenes „Nein”, ein Augenkontakt-Entzug, ein körperliches Blockieren bewegen sich in einem Graubereich, der einzelfallabhängig zu bewerten ist. P+ mit aversiven Hilfsmitteln hingegen ist seit der TierSchHuV-Novelle rechtlich klar verbotswürdig.
Die drei DACH-Trainer-Verbände und ihre methodischen Differenzen
- BHV (Berufsverband der Hundeerzieher:innen und Verhaltensberater:innen) — gegründet 2002, etwa 1.100 Mitglieder in DACH. Methodisch breit, mit klarer Positionierung gegen aversive Hilfsmittel; R+ als methodische Erstwahl, P+ ohne Hilfsmittel als Einzelfall-Option im Verhaltens-Therapie-Kontext.
- IBH (Internationaler Berufsverband der Hundetrainer:innen) — seit 2008, etwa 600 Mitglieder. Methodisch enger an der Markersignal-Schule; explizit gewaltfrei.
- TBT (Turid Rugaas Behaviour-Trainers) — seit 2003, etwa 180 aktive Trainer:innen in DACH. Methodisch der Beschwichtigungs-Signal-Tradition verpflichtet.
Die Zertifikats-Differenzen sind nicht trivial: BHV-Zertifizierte schließen mit einer 200-stündigen Theorie- und Praxis-Prüfung ab; IBH verlangt zusätzlich Video-Dokumentationen aus der eigenen Trainings-Praxis; TBT verlangt zusätzliche Hospitations-Nachweise bei rugaas-zertifizierten Trainer:innen. Wer eine:n Trainer:in wählt, wählt damit nicht nur eine Person — er oder sie wählt eine methodische Schul-Linie mit erkennbaren Praxis-Konsequenzen.
Die R−-Diskussion — der oft übersehene Quadrant
Die Polarisierung der gegenwärtigen Debatte konzentriert sich beinahe ausschließlich auf R+ versus P+. Der R−-Quadrant — negative Verstärkung — bleibt dabei oft unerwähnt, obwohl er in der praktischen Anwendung allgegenwärtig ist. Jeder Leinen-Druck, der nachlässt, sobald der Hund nachgibt, ist R−. Jedes körperliche Blockieren, das endet, sobald der Hund sich setzt, ist R−.
Bradshaw hat in Dog Sense darauf hingewiesen, dass R− in der wissenschaftlichen Wirkungs-Analyse häufig schlechter abschneidet als R+, weil der unangenehme Ausgangs-Reiz Stress-Korrelate erzeugt, die das Lernen verzögern. In der Trainings-Praxis ist die Vermeidung von R− jedoch deutlich schwieriger als die Vermeidung von P+ — schon weil viele Halter:innen R− im Alltag unbewusst anwenden.
Eine Praxis-Lese aus der Apport-Redaktion
Wer die gegenwärtige DACH-Hundeschul-Landschaft beobachtet, sieht eine stille methodische Konvergenz. Die Mehrheit der professionellen Trainer:innen arbeitet de facto R+-priorisiert, mit gelegentlichen P−-Anwendungen (Spiel-Abbruch, Aufmerksamkeits-Entzug) und einer wachsenden Sensibilität für R−-Vermeidung. Die ideologischen Lagerkämpfe der 2010er-Jahre — „Pryor versus Cesar Millan” — sind weitgehend verstummt; was bleibt, ist die methodisch differenzierte Frage, wann welcher Quadrant unter welchen Voraussetzungen angemessen ist.
Friederike Range und Zsófia Virányi vom Wolf Science Center Ernstbrunn haben in mehreren vergleichenden Studien (publiziert u. a. in Animal Behaviour 2018, 2021) dokumentiert, dass Hunde — anders als Wölfe — durch soziales Lernen im Mensch-Hund-Setting ungewöhnlich aufnahmefähig sind. Die Konsequenz: Was wir den Hund lehren, lernt er auch dann, wenn wir es nicht beabsichtigen. Trainings-Methodik ist immer auch Beziehungs-Methodik.
Was wir lesen, wenn wir Trainings-Methoden lesen
Wer eine:n Trainer:in wählt, kann drei Fragen stellen, die mehr verraten als jede Zertifikat-Liste:
- Welche Quadranten setzen Sie wann ein? Eine fachlich saubere Antwort wird R+ als Erstwahl, P− und gelegentlich kontrollierte R−-Anwendung nennen, P+ allenfalls als Verhaltens-Therapie-Einzelfall ohne aversive Hilfsmittel.
- Welche Stress-Marker beobachten Sie während des Trainings? Eine fachlich saubere Antwort wird Lippen-Lecken, Gähnen, Kopf-Abwenden, Pfoten-Heben, Speichel-Cortisol nennen.
- Wann brechen Sie eine Trainings-Einheit ab? Eine fachlich saubere Antwort wird kumulierte Stress-Marker, Frustrations-Anzeichen, körperliche Erschöpfung nennen — nicht „wenn der Hund sich endlich fügt”.
Die operante Konditionierung ist kein moralisches Schema. Sie ist ein deskriptives Werkzeug zur Beschreibung von Verhaltens-Lern-Prozessen. Was wir mit diesem Werkzeug tun, ist hingegen sehr wohl eine ethische Frage — eine, die § 3 TierSchG für die rechtliche Mindest-Grenze beantwortet, und eine, die jede:r Trainer:in für die methodisch-praktische Hochgrenze täglich neu beantworten muss.
Weiterführende Quellen
- Pryor, K.: Don’t Shoot the Dog. The New Art of Teaching and Training. New York 1984 (dt. Positiv bestärken — sanft erziehen, Stuttgart 2003)
- Miklósi, Á.: Dog Behaviour, Evolution, and Cognition. 2. Aufl., Oxford 2014
- Bradshaw, J.: Dog Sense. How the New Science of Dog Behaviour Can Make You a Better Friend. New York 2011 (dt. Hundeverstand, Stuttgart 2013)
- McConnell, P.: The Other End of the Leash. New York 2002 (dt. Das andere Ende der Leine, Stuttgart 2008)
- Range, F. / Virányi, Z.: „Social learning from humans or conspecifics: differences and similarities between wolves and dogs”, in: Frontiers in Psychology 2014; 5: 1283
- Tierschutz-Hundeverordnung (TierSchHuV) v. 02.05.2001, zuletzt geänd. v. 28.04.2021