Evaluation schärft den Blick und kostet Geld | Quelle: www.pxhere.com | Copyright: CC0 1.0

Ein Plädoyer für gegenstandsangemessene Evaluationsforschung

23. April 2018

Die Herausforderungen durch den islamistischen und rechtsextremistischen Terrorismus führen nicht nur zu verstärkten Bemühungen im Bereich der Radikalisierungsprävention. Damit einher gehen auch Anforderungen an die Evaluationsforschung, die Wirksamkeit von Projekten der Radikalisierungsprävention systematisch zu überprüfen, Wirksamkeitsnachweise zu liefern und evidenzbasiert – so zumindest die Idee – wirksame von unwirksamen Projekten sauber zu trennen. Die komplexe Realität schlägt jedoch solchen Vorstellungen – wie so oft – ein Schnippchen.

Der gesellschaftliche und politische Bedarf nach eindeutigen Wirkungsaussagen ist dabei äußerst verständlich: Islamistische Anschläge wie der auf den Berliner Weihnachtsmarkt (2016) und auf die Redaktion der Satirezeitschrift Charlie Hebdo in Paris (2015) oder die verschiedenen rechtsradikalen Terroranschläge wie die der sogenannten „Gruppe Freital“ seit 2015 verdeutlichen eine wachsende Gefahr durch terroristische Gruppen und Einzelakteure. Sicherheitsbehörden und Politik stehen unter erheblichem Druck, diese Gefahren im Vorfeld zu erkennen und möglichst zu verhindern. Eine wachsende Bedeutung kommt dabei auch Maßnahmen, Projekten und Programmen der Radikalisierungsprävention zu. Jene reichen von eher universell ausgerichteter Demokratieförderung hin zu sehr spezifischen Angeboten indizierter oder selektiver Prävention, wie sie beispielsweise in der Arbeit mit bereits in Radikalisierungs- und Hinwendungsprozessen begriffenen Jugendlicher erfolgt.

Das Dilemma zwischen Vielfalt der Präventionsansätze und dem Wunsch nach einheitlicher Wirkungsmessung

Mit einigem Recht erwartet die Gesellschaft auch, dass solche Präventionsbemühungen möglichst schnelle und nachhaltige Effekte zeigen und beispielsweise die Anzahl der als radikalisiert geltenden Personen reduziert. Bereits ein Blick auf die Vielzahl der unter das Label „Radikalisierungsprävention“ fallenden Angebote und Maßnahmen macht jedoch deutlich, dass einheitliche Indikatoren zur Wirksamkeitsmessung teilweise an Grenzen stoßen: zu nennen sind hier beispielsweise Maßnahmen mit einer hochspezifischen, bereits straffällig gewordenen Klientel in Strafvollzug und Bewährungshilfe, Ausstiegshilfen für bereits in Hinwendung zu Strukturen radikaler Gruppen befindliche Jugendliche; Beratungs- und Unterstützungsangebote für deren Freunde und Angehörige; Unterstützungs- und Aufklärungsangebote für Jugendliche, die erste Zeichen von Hinwendungsprozessen aufweisen; oder auch eine „Breitbandstrategie“ im Rahmen von Demokratieförderung und politischer Bildung, die beispielsweise Kindern und Jugendlichen eine kritische Sicht auf Hate Speech und Propaganda im Netz ermöglichen will. Dementsprechend vielfältig sind auch die angewendeten und zum Einsatz kommenden Mittel: sie reichen von einer breit aufgestellten Demokratiebildung über die aufsuchende Jugendarbeit mit sozialräumlichem Fokus, eine sozialpädagogische Einzelfallarbeit, in der Psychologen, Sozialarbeiter und Fachkräfte der Radikalisierungsprävention mit gefährdeten Jugendlichen arbeiten, bis hin zu systemischen Ansätzen, die Familie, Peergroups und Ideologie einbeziehen. In ihrer überwiegenden Zahl sind Präventionsmaßnahmen und -angebote (sozial-) pädagogisch ausgerichtet.

Der Wunsch nach Vergleichbarkeit und einfachen kausalen Wirksamkeitsvorstellungen hat deshalb oft wenig mit der notwendigerweise vielfältigen Praxis der Deradikalisierungs- und Präventionsarbeit zu tun. Denn die Forderung nach schnellen und messbaren Wirkungen geht nun – idealtypisch gesprochen – oftmals davon aus, dass entsprechende Ansätze nach einem einzigen einfachen kausalen Basismodell funktionieren: ein Ausgangszustand (z.B. „gefährdeter Heranwachsender“) wird durch ein „Treatment“ (z.B. Teilnahme an einem Projekt der Radikalisierungsprävention) in einen Endzustand („nachhaltig deradikalisierter bzw. immunisierter Jugendlicher“) überführt. Evaluationsforschung verfügt nun über ein ausdifferenziertes Set an Methoden, Wirkungen festzustellen. Sogenannte quasi-experimentelle Designs vergleichen „natürliche Gruppen“ (wie z.B. Schulklassen, Jugendgruppen), ob eine bestimmte Intervention eine Wirkung zeitigt oder nicht. Indikator hierfür ist beispielsweise eine veränderte Einstellung zu rechtsradikaler oder islamistischer Ideologie, die sich bei der Versuchsgruppe zeigt, bei einer Kontrollgruppe jedoch nicht. Solche quasi-experimentellen Wirkungsuntersuchungen sind voraussetzungsreich, da sie beispielsweise eine systematische Kontrolle von Einfluss- bzw. „Störfaktoren“ voraussetzen. Auch die eingesetzte Intervention müsste, um die Vergleichbarkeit zwischen verschiedenen Gruppen herzustellen und Zufallseffekte auszuschließen, manualisierbar, d.h. auf strikt standardisierte Weise durchführbar sein.

Grenzen quasi-experimenteller Wirkungsuntersuchungen

Solche Bedingungen für quasi-experimentelle Wirkungsuntersuchungen sind nun allerdings in (sozial-)pädagogischen Settings, den Praxisfeldern der Sozialen Arbeit und der Kinder- und Jugendhilfe kaum vorzufinden und auch nur schwer anzunähern. Jene Settings zeichnen sich vielmehr durch eine hohe Kontextabhängigkeit, individuelle Problemlagen und Lebensweltbezogenheit der Ansätze und Interventionen aus. Eine standardisierte Wirkungsmessung ist (nicht nur) gegenüber einem solchen Forschungs- bzw. Evaluationsgegenstand kein „neutrales“ Instrument, sondern würde in der Herstellung der Messgrundlage quasi en passant den sozialpädagogischen Charakter der Intervention beeinflussen, im schlimmsten Fall gar zerstören. In der turbulenten sozialen Wirklichkeit erweisen sich einfache Kausalitätsannahmen oftmals als unterkomplex, denn „jede kausale Analyse sozialen Handelns muss berücksichtigen, dass Akteure sich in lokalen Kontexten bewegen, dort nach Regeln handeln und auf Wissensvorräte zurückgreifen, die Forschern prima vista nicht bekannt sind und dass sie oft ihre Handlungsziele auf Wegen verfolgen, die die Forscher nicht antizipieren können“ (Kelle 2006, S. 133). Insofern sind auch Evidenzen nicht naturgegeben so Bellmann und Müller (2011). Man könnte das bonmot von Elsbeth Stern über Intelligenztests entsprechend umformulieren: Evidenz ist das, was die evidenzbasierte Forschung misst. Trifft man methodische Vorkehrungen, um die gesellschaftliche Komplexität angemessener einzufangen, so stellen sich auch Evidenzen und Kausalitäten ganz anders dar, wie Kelle und Erzberger (2006) für den Bereich der Kinder- und Jugendhilfeargumentieren. In der Radikalisierungsprävention könnten beispielsweise Wirkungen eines Anti-Aggressionstrainings in einer standardisierten Erhebung kausal auf die Inhalte dieses Trainings zurückführbar sein – in einem flankierenden teilstandardisierten Interview stellt sich dann jedoch heraus, das die vor und nach dem eigentlichen Training ablaufende Beziehungsarbeit der gefährdeten Jugendlichen mit dem Sozialarbeiter der eigentliche Wirkfaktor ist. Dies wäre ohne eine – auch methodisch umgesetzte – Offenheit für neue Erkenntnisse nicht möglich gewesen. So können sich beim methodisch komplexen und mehrdimensionalen Blick manche Kausalitäten als Scheinkausalitäten herausstellen.

Die Notwendigkeit komplexer Evaluationsdesigns

Diese Überlegungen sprechen allerdings nicht dagegen, für Projekte und Ansätze der Radikalisierungsprävention Wirksamkeit zu fordern und Wirkungen festzustellen. Entsprechende Projekte und Maßnahmen kommen nicht umhin, sich selbst, der Gesellschaft und auch der Evaluationsforschung Auskunft darüber zu geben, ob Ziele erreicht wurden, Effekte feststellbar sind oder Zielgruppen angesprochen werden konnten. Jedoch sollte deutlich geworden sein, dass auch die eingesetzten Evaluationsmethoden sich die Frage gefallen lassen müssen, ob sie ein sinnvolles und gegenstandsangemessenes Vorgehen an den Tag legen. So verlangt die Vielfalt der Ansätze im Feld der Radikalisierungsprävention nach methodologischen Reflexionen und methodischen Designs, die eben dieser Vielfalt gerecht werden.

Die Evaluation einer Intervention, die sich auf die Distanzierung Jugendlicher von radikalen Gruppen und Ideologien richtet, erfordert eine andere methodische Herangehensweise, als die Evaluation einer Informationsveranstaltung zu Mobilisierungsstrategien salafistischer Gruppen, die auf einen kurzfristigen Wissensgewinn von Jugendlichen setzt. Während letzterer noch relativ einfach zu ermitteln ist (wobei auch hier Herausforderungen warten: wann handelt es sich um tatsächlich verstandenes und reflektiertes Wissen, wann um bloße Wiederholung von Gehörtem?), sind Distanzierungsprozesse vielschichtig und langfristig. Sie betreffen „formale“ Gruppenzugehörigkeiten ebenso wie emotionale Bindungen und ideologische Weltbilder. Ab wann können in dieser Hinsicht Gruppen oder Einzelpersonen als „deradikalisiert“ gelten? Wann hat eine Präventionsmaßnahme Radikalisierung verhindert?

Die Komplexität dieser Fragestellungen macht deutlich, dass Evaluationsforschung auch die Aufgabe hat, Praktikern und Projekten mit komplexen Evaluationsdesigns methodisch gerecht zu werden, ihre Erwartungen, Annahmen und Expertise einzubeziehen, ohne in ein anything goes zu verfallen oder auf eine externe Beurteilung zu verzichten. Mixed Methods Designs, die gegenstandsangemessene Kombination von standardisierten, teil- und unstandardisierten Methoden wie auch die Erforschung spezifischer Projekt- und Präventionslogiken gehören insofern zu einer an Feld und Adressaten orientierten Evaluation und Wirkungsforschung, da nur so die Vielfalt von Perspektiven, Kontexten und Entwicklungen empirisch erfassbar ist und ein komplexes Bild über das Feld der Radikalisierungsprävention entstehen kann. Evaluationen sollten also möglichst standardisierte Methoden um eine teil- oder unstandardisierte Erhebung der Binnensichten von Praktikern und Adressaten erweitern und Theorien und Annahmen der Akteure über ihr Feld explizieren, beispielsweise mit sogenannten „logischen Modellen“, in die die Wirkannahmen der Akteure einfließen. Solche Evaluationen benötigen Zeit, Finanzierung, entsprechend gut ausgebildetes wissenschaftliches Personal und einen engen, reflexiven und vertrauensvollen Austausch aller Akteure. Effekte und Kausalitäten können so in einer die Komplexität der sozialen Wirklichkeit besser abbildenden Weise erforscht und Interventionen nicht nur angemessener evaluiert, sondern auch die Wirksamkeit von Radikalisierungsprävention erhöht werden.

Literatur

Kelle, Udo 2006: Qualitative Evaluationsforschung und das Kausalitätsparadigma. In Flick, Uwe (Hrsg.), Qualitative Evaluationsforschung. Konzepte, Methoden, Umsetzungen. Reinbek: Rowohlt, S. 117-133.

Kelle, Udo/Erzberger, Christian 2006: Stärken und Probleme qualitativer Evaluationsstudien – ein empirisches Beispiel aus der Jugendhilfeforschung. In Flick, Uwe (Hrsg.), Qualitative Evaluationsforschung. Konzepte, Methoden, Umsetzungen. Reinbek: Rowohlt, S. 284-301.

Björn Milbradt

Björn Milbradt, Dr. phil., ist Soziologe und Leiter der Fachgruppe „Politische Sozialisation und Demokratieförderung“ am Deutschen Jugendinstitut in Halle (Saale). Zuletzt erschienen ist von ihm im Verlag Barbara Budrich die Monographie „Über autoritäre Haltungen in ‚postfaktischen‘ Zeiten". Sein Forschungsinteresse gilt insbesondere Bildungs- und Sozialisationsprozessen, ihren politischen, gesellschaftlichen und institutionellen Hintergründen und Bedingungen sowie methodischen und methodologischen Aspekten ihrer Erforschung.

Latest posts by Björn Milbradt (see all)

Ein Plädoyer für gegenstandsangemessene Evaluationsforschung - 23. April 2018

Publikationssprachen:

Podcast PRIF TALK:

Ein Plädoyer für gegenstandsangemessene Evaluationsforschung

Das Dilemma zwischen Vielfalt der Präventionsansätze und dem Wunsch nach einheitlicher Wirkungsmessung

Grenzen quasi-experimenteller Wirkungsuntersuchungen

Die Notwendigkeit komplexer Evaluationsdesigns

Reihen

Ähnliche Beiträge

Schlagwörter

Autor*in(nen)

Björn Milbradt

Latest posts by Björn Milbradt (see all)