Steffen Zabler, Synthetisches Matching als Evaluations-Tool: Der Effekt des beratenden Sparkommissars auf die Kommunalfinanzen der Stadt Hagen in:

PVS Politische Vierteljahresschrift, page 430 - 454

PVS, Volume 57 (2016), Issue 3, ISSN: 0032-3470, ISSN online: 0032-3470, https://doi.org/10.5771/0032-3470-2016-3-430

Browse Volumes and Issues: PVS Politische Vierteljahresschrift

Bibliographic information
PDF download Citation download Share
430 PVS, 57. Jg., 3/2016, S. 430-454, DOI: 10.5771/0032-3470-2016-3-430 Synthetisches Matching als Evaluations-Tool: Der Effekt des beratenden Sparkommissars auf die Kommunalfinanzen der Stadt Hagen Steffen Zabler The Synthetic Control Approach as a Tool for Evaluation: The Effect of the Austerity Commissioner on Local Public Finances in the City of Hagen Abstract: This paper evaluates the effect of an appointed commissioner for developing consolidation strategies for local public finances. So far, the evaluation concentrates on single-case studies of rare deployments of such a commissioner. The synthetic control approach is employed to expand existing research and to evaluate the causal effect of the commissioner in the city of Hagen in 2008. By using data on predictors of the local financial situation, other cities from North Rhine-Westphalia constitute a synthetic version of Hagen which can impressively reflect its characteristics. The final comparison does not reveal a positive effect of the commissioner on the city’s finances, in contrast to official rhetoric. Keywords: Synthetic control approach, austerity commissioner, local public finance Schlagwörter: Synthetisches Matching, Beauftragtenbestellung, Sparkommissar, Kommunalfinanzen 1. Einleitung Die Hürden für eine angemessene Evaluation politischer und administrativer Maßnahmen sind für Praxis und Wissenschaft gleichermaßen hoch. Ursächlich für die Schwierigkeit bei der Beurteilung von Wirkungen bestimmter Policies sind vor allem „Probleme der Zurechenbarkeit“ (Bogumil u. Jann 2009, S. 179), die kausale Schlüsse auf der Basis simpler ex-post Betrachtungen unsicher machen. Unabhängig davon besteht eine ungebrochen hohe Bedeutung von Evaluation für Wissenschaft und Praxis. Ziel dieses Beitrags ist es, den Nutzen einer bisher selten verwendeten Evaluations-Methode für die vergleichende politik- und verwaltungswissenschaftliche Praxis aufzuzeigen, die sich besonders für die Analyse einzelner Programme und Policies eignet. Konkret wird eine quantitativ gestützte Variante einer vergleichenden Fallstudie vorgestellt, die sowohl einige Schwächen der rein qualitativ basierten Fallstudien als auch Schwächen von regressionsbasierten Ansätzen kompensieren kann. Ausgehend von Abadie u. Gardeazabal (2003) beziehungsweise Abadie et al. (2010) und deren Idee des synthetischen Matching kann die Wirkung eines Policy-Instruments dadurch evaluiert werden, dass ein Treatment-Fall einem künstlich erzeugten Vergleichsfall gegenübergestellt wird. Die Bildung dieses synthetischen Vergleichsfalls erfolgt in objektiver, ausschließlich datenbasierter und transparenter Form. Zusätzlich wird im Rahmen dieser Analysestrategie eine nachvollzieh- 57. Jahrgang Heft 3 / 2016 ABHANDLUNG 431 Zabler | Synthetisches Matching als Evaluations-Tool bare Methode zur Angabe der Unsicherheit der Ergebnisse möglich. Diese Vorgehensweise trägt dazu bei, die Erkenntnisse klassischer vergleichender Fallstudien um eine quantifizierbare Komponente zu erweitern. Synthetisches Matching und qualitative Fallstudien können dabei arbeitsteilig genutzt werden, indem in einem ersten Schritt Lücken zwischen erwünschtem und realem Outcome identifiziert und in einem zweiten Schritt die dafür verantwortlichen Akteurskonstellationen und Mechanismen aufgedeckt werden. Mit der hier gewählten Evaluation eines umstrittenen Instrumentes, das zur Konsolidierung besonders prekärer Kommunalhaushalte in Nordrhein-Westfalen (NRW) konzipiert wurde, trägt dieser Beitrag abseits der methodischen Relevanz zu einem wissenschaftlich wie realpolitisch relevanten Diskurs bei. 2006 wurde in NRW eine bislang „fehlende Eskalationsstufe im Wege freier Rechtsfortbildung geschaffen“ (Effer-Uhe 2008, S. 26), indem ein sogenannter beratender Beauftrag ter eingesetzt wurde, der gegenüber der Kommunalaufsicht weisungsgebunden ist, im Gegensatz zum Beauftragten nach §124 GO NRW allerdings keine Organaufgaben übernimmt, sondern lediglich beratend tätig ist.1 Die Einführung dieses Modells ist der problematischen Legitimierung des Einsatzes eines echten Beauftragten nach §124 GO NRW geschuldet.2 Unter den oben erwähnten Gesichtspunkten der Zurechenbarkeit und Quantifizierbarkeit ist die Wirkung keines der beiden Beauftragten-Modelle bisher abschließend erfasst. Diese Lücke soll mit dem vorliegenden Beitrag zumindest teilweise geschlossen werden, indem die bereits vorliegenden Einzelfallstudien (Duve 2008; Bajohr 2009; Holtkamp 2009; Holtkamp 2010) um einen vergleichenden methodischen Ansatz am Beispiel des Einsatzes eines beratenden Sparkommissars in der Stadt Hagen im Jahr 2008 ergänzt werden. Dass der Einsatz von Instrumenten zur Haushaltskonsolidierung auf kommunaler Ebene ungebrochene Relevanz für Öffentlichkeit, Politik und Praxis entfaltet, liegt mit Sicherheit an der Tatsache einer differenzierten kommunalen Haushaltskrise. Ein Blick auf die jährliche Schuldenstatistik zeigt, dass die Kommunen in ihrer Gesamtheit zwar lediglich 6,6 Prozent der gesamtstaatlichen Verschuldung auf sich vereinen (Statistisches Bundesamt 2014), allerdings ist dies kein Indiz für eine unbedenkliche finanzielle Lage der Kommunen, da vor allem die Heterogenität der Finanzlage der Kommunen sehr stark ausgeprägt ist (Holtkamp 2010, S. 13-14; Boettcher 2013, S. 11-12; Stolzenberg u. Heinelt 2013, S. 465- 466; Bogumil et al. 2014, S. 614). Besonders die Situation und die vom restlichen Bundesgebiet teils abweichende Entwicklung der Kommunen in Nordrhein-Westfalen sind dabei verstärkt im Fokus (Holtkamp 2007, S. 3; Holtkamp 2010, S. 7; Boettcher 2013, S. 13).3 Die anhängige Diskussion um glaubhafte und effektive Sanktionsinstrumente zur Begrenzung von Haushaltsschieflagen stellt sich abseits der lokalen Forschung auch auf anderen föderalen Ebenen, da die Zielsetzung der Kommunalaufsicht und die damit verbundenen Handlungsoptionen im Falle 1 In vielen Veröffentlichungen ist von einem Beratenden Sparkommissar die Rede. 2 In der Zwischenzeit kam auch dieses Instrument im Rahmen definierter Sanktionsfolgen des Stär kungspakt Stadtfinanzen in NRW zur Anwendung. Siehe dazu Abschnitt 2. 3 Neben NRW wurde allerdings auch in anderen Bundesländern die finanzielle Lage der Kommunen auf die politische Agenda gehoben, sichtbar durch diverse Entschuldungsprogramme (Stolzenberg u. Heinelt 2013). 432 PVS, 57. Jg., 3/2016 Abhandlung unausgeglichener Haushalte Parallelen zur Bailout-Problematik der Schuldenbremsen des Bundes und der EU aufweisen. Ob getroffene Maßnahmen zur Lösungen dieser Problematik tatsächlich glaubhaft und effektiv gestaltet sind, ist allerdings sowohl im Rahmen bestimmter Instrumente auf kommunaler Ebene (Holtkamp 2016, S. 19-24), als auch beispielsweise auf EU-Ebene teilweise zweifelhaft (Gröteke u. Mause 2009, S. 325). In Abschnitt 2 erfolgt nun ein genauerer Blick auf den beratenden Sparkommissar hinsichtlich seiner Grundlagen und praktischen Anwendung. Abschnitt 3 beschreibt neben den speziellen methodischen Anforderungen die Vorstellung der Analysemethode. Die Begründung der Fallauswahl, die relevanten Variablen und die Daten werden in Abschnitt 4 und 5 erläutert, bevor Abschnitt 6 die empirischen Ergebnisse beinhaltet. Die Arbeit schließt mit einem Fazit, in dem zentrale Ergebnisse, Limitationen und Anstöße für die zukünftige Forschung diskutiert werden. 2. Der beratende Sparkommissar Grundlegender Ausgangspunkt für die Einsetzung eines beratenden Sparkommissars bildet die Pflicht zum Haushaltsausgleich nach §75 GO NRW, die in allen deutschen Kommunalverfassungen verankert ist (Frielinghaus 2007, S. 85). Der erste Schritt der haushaltsrechtlichen Kontrolle seitens der Kommunalaufsicht, um die Einhaltung des Haushaltsausgleichs zu wahren, liegt in der jährlichen Vorlage der Haushaltssatzung (§80 GO NRW).4 Im Fall eines unausgeglichenen Haushalts muss ein Haushaltssicherungskonzept (HSK) nach §76 GO NRW der Kommunalaufsicht glaubhaft darlegen, wie innerhalb von zehn Jahren mit entsprechenden Konsolidierungsmaßnahmen der Haushaltsausgleich erreicht wird. Ist der Haushaltsausgleich für den geforderten Zeitraum nicht darstellbar, wird die Genehmigung des HSK nicht erteilt und die betroffene Kommune fällt unter die vorläufige Haushaltsführung nach §82 GO NRW, auch als Nothaushalt bezeichnet. Ab dieser Eskalationsstufe kommt es dann zu Eingriffen in die Haushaltsführung der Kommune bezüglich kreditfinanzierter Investitionstätigkeit und Personalwirtschaft (Frielinghaus 2007, S. 89-92; Holtkamp 2007, S. 15; Holtkamp 2010, S. 15-16). Prinzipiell stellt eine weitere Eskalationsstufe der Haushaltskontrolle in NRW der Beauftragte nach §124 GO NRW dar, der in allen Bundesländern zur Verfügung steht.5 Dabei werden einzelne oder alle Aufgaben eines Gemeindeorgans von einem von der Kommunalaufsicht bestellten Beauftragten auf Rechnung der Kommune übernommen. Ob es in der Praxis zum Einsatz eines Staatskommissars kommt, hängt vom Ermessen der Aufsichtsbehörde ab. Lediglich alle vorgelagerten Maßnahmen müssen erschöpft und die Verhältnismäßigkeit gewahrt sein 4 Die explizite Genehmigung von Krediten und Kassenkrediten ist in NRW nicht vorgesehen, außer wenn die „Kreditaufnahme nach §19 des Gesetzes zur Förderung der Stabilität und des Wachstums der Wirtschaft beschränkt worden ist“ (§86 GO NRW). Zu einem Vergleich der Genehmigungsregelungen in den Bundesländern siehe Zabler et al. (2016). 5 In den Gemeindeordnungen der Bundesländer ist immer vom Beauftragten die Rede. In der Literatur tauchen auch die Bezeichnungen Staatsbeauftragter, Staatskommissar oder Sparkommissar auf (Duve 2008, S. 285-286). 433 Zabler | Synthetisches Matching als Evaluations-Tool (Vogelsang et al. 2005, S. 209-210; Frielinghaus 2007, S. 93-95, 141; Duve 2008, S. 285). Der Einsatz eines Staatskommissars ist jedoch aus juristischer Sicht mit Rechtsproblemen verbunden (Effer- Uhe 2008, S. 27). Frielinghaus (2007, S. 143) mahnt beispielsweise eine Unvereinbarkeit mit der im Grundgesetz verankerten Selbstverwaltungsgarantie nach §28 Abs. 2 an. In der Praxis der jüngeren Vergangenheit ist das Instrument des Staatskommissars ohne große Prominenz geblieben. Insgesamt kamen zwischen 1990 und 2004 198 Staatskommissare zum Einsatz (179 davon in Ostdeutschland), von denen 53 aufgrund von Haushaltsthemen eingesetzt wurden. Zu den Einsätzen liegt größtenteils keine einsehbare Dokumentation vor, die Zahlen und Angaben beruhen auf einer Befragung von Frielinghaus (2007, S. 96-103). Erstmals in NRW wurde im Mai 2013 der Stadt Nideggen und im März 2014 der Stadt Altena im Rahmen der Nicht-Erfüllung von Vorgaben aus dem Stärkungspakt Stadtfinanzen ein Staatskommissar verordnet (Ministerium für Inneres und Kommunales Nordrhein- Westfalen 2013; Ministerium für Inneres und Kommunales Nordrhein-Westfalen 2014). Die insgesamt spärliche Anwendung zeigt, dass das Instrument in vielen Fällen trotz extremer Haushaltslagen nicht adäquat erscheint (Holtkamp 2007, S. 15-16). Dies dürfte zum einen den oben erwähnten rechtlichen Bedenken, zum anderen den großen Widerständen und der schwierigen politischen Vermittelbarkeit geschuldet sein (Duve 2008, S. 290; Holtkamp 2010, S. 63). Die unzureichende Wirkung des Haushaltssicherungskonzepts in Verbindung mit dem problematischen Instrument des Staatskommissars erweckte offensichtlich das Bild einer fehlenden Eskalationsstufe, die über das Nothaushaltsrecht hinausgeht, aber unterhalb des Staatskommissars angesiedelt ist (Holtkamp 2007, S. 16). Aus diesem Grund wurde das Instrument des beratenden Sparkommissars 2006 gemeinsam von der nordrhein-westfälischen Landesregierung und der Bezirksregierung Münster für die Stadt Waltrop geschaffen. Es handelt sich um eine gegenüber der Kommunalaufsicht weisungsgebundene Person, die die jeweilige Kommune mit Vorschlägen zur Konsolidierung auf den Weg eines genehmigungsfähigen Haushalts bringen soll. Der beratende Sparkommissar hat keinerlei Handhabe, um selbst Maßnahmen zu ergreifen und ist daher nach wie vor auf Entscheidungen im Rat angewiesen, allerdings steht der Einsatz eines beratenden Sparkommissars meist in Verbindung mit der Androhung eines echten Staatskommissars (Holtkamp 2006, S. 41-43; Holtkamp 2007, S. 16). Der Einsatz des beratenden Sparkommissars auf der gleichen Rechtsgrundlage wie auf der des Staatskommissars gilt grundsätzlich als fragwürdig. Eine mögliche Zulässigkeit könnte aus einem Analogieschluss – einer Vergleichbarkeit beider Instrumente – oder dem Minoritätsargument – der Tatsache, dass der beratende Sparkommissar ein schwächeres Mittel als der Staatskommissar darstellt – erwachsen (Effer-Uhe 2008, S. 28). Aus einer Governance-Perspektive sieht Holtkamp (2009, S. 147, 157) in der Schaffung dieses neuen Instruments einen Versuch der Kommunalaufsicht, kooperatives Verwaltungshandeln zu etablieren, stellt aber nach Betrachtung von Anwendungsfällen die Wirksamkeit für Haushaltskonsolidierungen stark in Frage. Neben den berechtigten Zweifeln können auch denkbare Vorteile des beratenden Sparkommissars vorgebracht werden. Zwar sind grundsätzlich beide Beauftragten-Modelle mit rechtlichen Problemen behaftet, jedoch ist die Wahrschein- 434 PVS, 57. Jg., 3/2016 Abhandlung lichkeit, dass eine Kommune Rechtsmittel gegen einen beratenden Sparkommissar einlegt, solange die Drohung eines echten Sparkommissars im Raum steht, gering. Darüber hinaus kann ein Berater mit entsprechendem Drohpotential für die kommunalen Amtsträger von Vorteil sein, indem unliebsame Entscheidungen vor den Wählern leichter legitimiert werden können (Effer-Uhe 2008, S. 29). Ein weiterer Vorteil ist die ausschließliche Konzentration auf die Konsolidierung, da keine kompletten Organaufgaben übernommen werden müssen. Schließlich kann man auch von einer zumindest etwas höheren generellen Kooperationsbereitschaft im Vergleich zum Staatskommissareinsatz ausgehen (Duve 2008, S. 290-292). Der Einsatz eines beratenden Sparkommissars beschränkt sich bislang auf die Einsätze in Waltrop, Marl und Hagen. Bereits nach sehr kurzer Zeit wurde in Waltrop und Marl das Modell des beratenden Sparkommissars als Erfolgsmodell seitens der Kommunalaufsicht bezeichnet. Bei genauerer Sichtung der verwaltungswissenschaftlich relevanten Literatur ist der Erfolg der beratenden Sparkommissare in beiden Kommunen allerdings mindestens zweifelhaft (Holtkamp 2009, S. 151-154). Mit Stefan Bajohr wurde dann Anfang 2008 ein Finanzwissenschaftler erstmals in eine kreisfreie Stadt, nach Hagen, entsandt. Auch in dieser Kommune ist der Erfolg des beratenden Sparkommissars umstritten (Holtkamp 2009, S. 154-156; Bajohr 2009, S. 184). Die bisher fallstudienbasierte Literatur gibt dabei bereits Aufschluss über die Rolle zentraler Akteure im Verlauf der Sparkommissareinsätze und die anhängigen lokal-spezifischen Mechanismen, die für den ausbleibenden Erfolg verantwortlich gemacht werden können. Ein systematischer, auf Zahlen gestützter Ansatz zur Überprüfung der Wirksamkeit des Staatskommissars oder des beratenden Sparkommissars fehlt allerdings bislang und kann die erwähnten Fallstudien komplementieren. Die Konzentration auf den beratenden Sparkommissar in diesem Beitrag hat spezifische Gründe: Die Frage, ob ein lediglich beratend tätiger Sparkommissar ausreicht, um Konsolidierungserfolge zu erreichen, ist weit weniger intuitiv zu beantworten, da ein Staatskommissar allein aufgrund seiner Durchgriffsrechte in der Lage sein wird, die Haushaltssituation einer Kommune zumindest ‚auf dem Papier‘ zu verbessern. Darüber hinaus könnte das Modell aufgrund seiner geringeren Repressivität und der höheren Kooperationserwartung eine relevante Zukunftsoption für die Praxis darstellen. Schließlich ist die Wahl des Einsatzes durch die Eignung für die Verdeutlichung der gewählten Methode aufgrund bestimmter Anforderungen an die Datenlage determiniert, auf die noch gesondert eingegangen wird. 3. Methodische Herangehensweise Die Antwort auf die eingangs angerissene Frage, warum Schlussfolgerungen auf Basis der schlichten Beobachtung der interessierenden abhängigen Variablen – in diesem Fall die weitere Entwicklung von Haushaltskennzahlen nach der Entsendung des Sparkommissars – nicht ausreichend sind, liegt in dem von Holland (1986) formulierten fundamentalen Problem kausaler Inferenz. In diesem Zusammenhang sei – analog zur Literatur zu Experimenten – der Einsatz eines beratenden Sparkommissars als das interessierende Treatment definiert und die betroffe- 435 Zabler | Synthetisches Matching als Evaluations-Tool nen Kommunen als Einheiten in der Treatment-Gruppe. Die Kommunen ohne Einsatz befinden sich dementsprechend in der Kontrollgruppe. Vereinfacht formuliert beschreibt das fundamentale Problem kausaler Inferenz die Unmöglichkeit, eine Einheit sowohl im Treatment- als auch im Kontroll-Status zu beobachten (Holland 1986, S. 947). Für den sicheren kausalen Schluss bezüglich des Effekts eines beratenden Sparkommissars müsste ein und dieselbe Kommune sowohl mit als auch ohne den Einsatz eines beratenden Sparkommissars beobachtet werden. Da dies in der Realität nicht möglich ist, existiert für jede Kommune eine nicht beobachtbare kontrafaktische Situation. Auf den hier vorliegenden Fall bezogen, wäre dieser kontrafaktische Vergleich deshalb nötig, weil die schlichte Betrachtung der Entwicklung der kommunalen Haushaltssituation nicht ausreicht, um sie eindeutig und ausschließlich auf den Einsatz des beratenden Sparkommissars zurückzuführen.6 Zusätzlich zum Problem der eindeutigen Kausalität ist aufgrund der Seltenheit des Einsatzes eines beratenden Beauftragten der Spielraum für quantitative Methoden generell begrenzt. Zwar ist die Analyse von Daten für Kommunen im Rahmen einer Regression prinzipiell kein Problem, allerdings besteht aufgrund des seltenen Einsatzes so gut wie keine Varianz auf dem zentralen Erklärungsfaktor. Doch selbst bei genügend vorhandenen Fällen bliebe immer noch die Schwierigkeit einer ausreichenden Beobachtung der Effektspanne nach dem Einsatz. Einsätze aus der jüngsten Vergangenheit eignen sich deswegen nicht zur Analyse. In der Analyse seltener Interventionen ist daher der übliche Ansatz die vergleichende Fallstudie. Im Rahmen einer vergleichenden Fallstudie bedienen sich Forscher durchaus – wenn auch oft implizit – des Konzepts von Treatment- und Kontrollgruppe. Eine Einheit, die einem Treatment ausgesetzt ist, wird mit (einer) Einheit(en) ohne Treatment verglichen und die Entwicklung des interessierenden Merkmals als Effekt des Treatments verstanden (Abadie et al. 2010, S. 493-494). Dieses Design bringt entscheidende Vorteile mit sich: Die geringe Häufigkeit von Treatment-Fällen stellt per se kein Problem dar. Zudem erlaubt eine tiefergehende Analyse einer kleinen Menge an Untersuchungseinheiten in deskriptiver Hinsicht ein kleinteiliges und präzises Bild, und in analytischer Hinsicht die Aufdeckung kausaler Mechanismen. Aufgrund der Abwägung zwischen den Vorzügen der qualitativ gestützten kleineren Fallstudien und den Vorzügen quantitativer Untersuchungen mit größeren Fallzahlen existiert ein lebhafter Diskurs über Wege der gegenseitigen Befruchtung beider Ansätze. Auf der einen Seite sollen quantitative Methoden helfen, vergleichende Studien zu strukturieren, auf der anderen Seite können vergleichende Fallstudien dazu dienen, die Wahl von Analyseeinheiten in quantitativen Studien zu verbessern (Abadie et al. 2015, S. 495). Basierend auf der Idee der Verknüpfung beider Herangehensweisen kommt eine Variante der vergleichenden Fallstu- 6 Grundsätzlich wären kausale Schlüsse auf Basis eines Vergleichs von Einzelfällen vor und nach einem Treatment nur dann gültig, wenn zum einen die Annahme getroffen werden kann, dass der Wert für die interessierende Variable nicht auch vom Zeitpunkt des Auftretens des Treatments abhängt (Temporal Stability), und zum anderen, dass der Effekt eines Treatments über die Zeit hinweg nicht bestehen bleibt (Causal Transience) (Holland 1986, S. 948). 436 PVS, 57. Jg., 3/2016 Abhandlung die zum Einsatz, die mit quantitativen Mitteln fundamentalen Problemen qualitativer vergleichender Fallstudien begegnet. So soll vor allem die Wahl des zu einem Treatment-Fall passenden Vergleichsfalls erleichtert und transparent gemacht werden. Im Idealfall basiert die Wahl der Vergleichsfälle auf klaren Auswahlkriterien, die sich häufig auf Mills (1906) Method of Difference beziehungsweise Przeworski und Teunes (1970) Most Similar Systems Design berufen. Es kann allerdings nicht immer ausgeschlossen werden, dass subjektive Einschätzungen und persönliche Vorlieben zu Ungunsten einer objektiv begründbaren Fallauswahl einfließen. Wird die Wahl der Vergleichsfälle allerdings nicht gewissenhaft getroffen, sind beobachtete Unterschiede unter Umständen lediglich auf unterschiedliche Charakteristika, nicht aber auf das Treatment zurückzuführen (King et al. 1994, S. 149). Ein weiteres Problem resultiert aus der Tatsache, dass eine Angabe von Unsicherheit der gewonnenen Erkenntnisse in einer vergleichenden Fallstudie auf Basis weniger Fälle nicht möglich ist (Abadie et al. 2010, S. 493). Mit dem Synthetic Control Approach (im Weiteren Synthetisches Matching7) haben Abadie und Gardeazabal (2003) einen systematischen Ansatz zur Erfassung von Effekten in Fallstudien vorgestellt. Die Grundlage der Analysestrategie bilden die eben erwähnten klassischen Ansätze vergleichender Forschung, bei denen ein Treatment-Fall mit nicht betroffenen, aber ansonsten sehr ähnlichen Kontroll-Fällen verglichen wird. Um einen präzisen Vergleich zu schaffen, besteht der Ansatz des synthetischen Matching darin, die kontrafaktische Situation für den Treatment-Fall zu reproduzieren. Statt einen einzelnen vergleichbaren Kontroll- Fall zu ermitteln, setzt das synthetische Matching auf die Kombination mehrerer potentieller Vergleichsfälle. Dahinter steht die Überlegung, dass eine sinnvolle Kombination mehrerer Vergleichsfälle eine bessere Darstellung der kontrafaktischen Situation ermöglicht als ein einziger ausgesuchter Fall. Die Auswahl der Kontroll-Fälle geschieht ausschließlich datenbasiert, was den subjektiven Entscheidungsspielraum einschränkt, den Forscher zur Darstellung einer quantifizierbaren Beziehung zwischen Treatment-Fall und Kontroll-Fällen zwingt und daher die Auswahl der Vergleichsfälle objektiv nachvollziehbar macht (Abadie et al. 2010, S. 493-494; Abadie et al. 2015, S. 496-497). Nach der Bildung eines passenden Vergleichsfalls beschränkt sich die letztendliche Betrachtung des Treatment-Effekts auf die Differenz im Outcome beider Fälle. Zur Beobachtung der Differenz ist lediglich die Schätzung des Outcomes für den synthetischen Fall notwendig, da der Outcome des Treatment-Falls direkt beobachtbar ist.8 Der künstlich generierte Fall besteht aus mehreren real existierenden Fällen, die alle jeweils ein spezifisches Gewicht entsprechend ihrem Beitrag zum synthetischen Vergleichsfall zugeordnet bekommen. Die Schätzung der Gewichte erfolgt auf Basis der Periode vor dem Einsetzen des Treatments. Outcome und zugleich Prädiktoren des Outcomes in dieser Vor-Treatment-Phase werden ausbalanciert, oder anders ausgedrückt: Einheiten aus der Kontrollgruppe, die der 7 Die Bezeichnung Synthetisches Matching, als Übertragung des Begriffs Synthetic Control Approach, soll zeigen, dass hier – vergleichbar mit klassischem Matching – ein Treatment- mit einem Kontroll- Fall verglichen wird, von denen der Kontroll-Fall allerdings synthetisch erzeugt wurde. 8 Eine detaillierte formale Beschreibung der Analysemethode befindet sich im Appendix. 437 Zabler | Synthetisches Matching als Evaluations-Tool Treatment-Einheit hinsichtlich des interessierenden Outcomes und potentieller Prädiktoren des Outcomes sehr ähnlich sind, gehen mit einem größeren Gewicht in die Bildung des künstlichen Kontroll-Falls ein. Um die Wichtigkeit der einzelnen Prädiktoren zur Beurteilung der Ähnlichkeit schätzen zu können, sind für die Prädiktoren ebenfalls Gewichte notwendig. Für die Berechnung dieser Gewichte spielt die Vorhersagekraft der genutzten Variablen in der Vor-Treatment-Phase die entscheidende Rolle. Es ist von zentraler Bedeutung, eine möglichst präzise Vorhersage des Outcomes mithilfe geeigneter Variablen zu erreichen. Dabei ist die theoretisch-inhaltliche Dimension der Prädiktoren kaum von Bedeutung, da letztlich nur die Präzision der Vorhersage das relevante Kriterium darstellt. Im Hinblick auf einen zentralen Aspekt der Identifizierung kausaler Effekte, den Ausschluss beziehungsweise die Berücksichtigung von Konfundierungseffekten, konnten Abadie et al. (2010) zeigen, dass bei einer ausreichenden Zahl zur Verfügung stehender Vor-Treatment-Phasen das Problem unbeobachteter Einflussfaktoren und der Heterogenität von Effekten minimiert werden kann: „only units that are alike in both observed and unobserved determinants of the outcome variable as well as in the effect of those determinants on the outcome variable should produce similar trajectories of the outcome variable over extended periods of time“ (Abadie et al. 2015, S. 498). Die für die Schätzung entscheidende Frage, ob auf Basis der Vergleichs-Fälle und der zur Verfügung stehenden Prädiktoren des Outcomes in der Vor-Treatment- Phase eine ausreichende Übereinstimmung zwischen realem und künstlichem Fall gegeben ist, kann vorteilhafterweise schlicht empirisch beantwortet werden und gibt daher direkt Aufschluss über die Eignung der Methode für den vorliegenden Analysefall. Neben der Lösung von Problemen vergleichender Fallstudien sind nun auch zentrale Vorteile gegenüber Regressionsanalysen sichtbar. Ein entscheidender Vorteil ist die Transparenz der Analyse: Beim synthetischen Matching wird zum einen der Beitrag jeder potentiellen Kontroll-Einheit zum synthetischen Fall explizit gemacht, zum anderen kann sowohl anhand des Outcomes vor dem Treatment als auch durch die Prädiktoren des Outcomes die Ähnlichkeit des künstlichen Falls zum Treatment-Fall exakt gezeigt werden. Weiterhin verhindert – ähnlich dem klassischen Matching – synthetisches Matching die Extrapolation von Werten für den kontrafaktischen Fall in Wertebereichen, in denen eigentlich keine Vergleichseinheiten zum Treatment vorhanden sind (Abadie et al. 2010, S. 494; Abadie et al. 2015, S. 496).9 Schließlich bietet das synthetische Matching auch die Möglichkeit, mit dem Problem der Inferenz umzugehen. In Fallstudien ist die zentrale Quelle von Unsicherheit die exakte Reproduzierbarkeit der erwünschten kontrafaktischen Situation (Abadie et al. 2010, S. 496-497). Zur Lösung dieses Problems schlagen Abadie und Gardeazabal (2003, S. 119-120) Placebo Studien vor. Die Grundidee besteht darin, eine Einheit aus der Kontrollgruppe rechnerisch dem Treatment auszusetzen, mit- 9 Zum Beweis und zum genauen Unterschied der Matching-Gewichte und Regressionsgewichte im Hinblick auf die potentielle Extrapolation siehe Abadie et al. (2015, S. 498-499). 438 PVS, 57. Jg., 3/2016 Abhandlung hilfe der übrigen Einheiten erneut eine synthetische Kontroll-Einheit zu konstruieren und daraufhin zu beobachten, ob sich der Effekt für die Kontroll-Einheit tatsachlich von dem der realen Treatment-Einheit unterscheidet. Bei einem im Hinblick auf Richtung und Stärke ähnlichen Effekt für die Kontroll-Einheit ist der Rückschluss auf den realen Treatment-Effekt äußerst unsicher. Als Erweiterung dazu ist es möglich, den Treatment-Status allen verfügbaren Kontroll-Einheiten nach und nach zuzuweisen und dadurch eine Verteilung potentieller Treatment- Effekte sichtbar zu machen (Abadie et al. 2010, S. 496-497; Abadie et al. 2011, S. 5; Abadie et al. 2015, S. 499-500).10 Bei dieser intuitiven Vorgehensweise ist eine Angabe von Unsicherheit möglich, unabhängig von der Anzahl an Kontroll- Einheiten, der Zeitperioden und der Aggregationsebene der Daten (Abadie et al. 2011, S. 5).11 4. Fallauswahl Die Auswahl eines Einsatzes eines beratenden Sparkommissars zur Analyse ist an mehrere Anforderungen geknüpft. Erstens ist für die Analyse – neben der Tatsache, dass der Einsatz überhaupt auftritt – der Zeitrahmen entscheidend. Für die Beobachtung eines Effekts ist eine angemessene Zeitspanne nach dem Einsatz eines beratenden Sparkommissars notwendig, um eventuell verzögerte oder auch längerfristige Auswirkungen beobachten zu können. Auf der anderen Seite darf der Einsatz nicht zu lange zurückliegen, da die Zugänglichkeit von Daten zur Haushaltslage und zu den benötigten Prädiktoren in elektronischer Form meist nicht sehr weit in die Vergangenheit reicht. Ein zweiter Aspekt der Datenverfügbarkeit im Hinblick auf die Wahl einer Kommune besteht im Status der Gebietskörperschaft. So ist die Datenlage zu vielen Kennzahlen in den offiziellen Statistiken für kreisfreie Städte deutlich besser als für kreisangehörige Kommunen. 10 Dieser Test über verschiedene Einheiten hinweg wird als In Space Placebo bezeichnet, während zusätzlich auch noch die Möglichkeit von In Time Placebos besteht, bei denen der Zeitpunkt des Treatments variiert wird. 11 Zwei grundsätzliche Annahmen bei der Anwendung von synthetischem Matching müssen explizit gemacht werden: Zum einen soll das Treatment ohne Antizipationseffekte wirken. Das heißt, dass das Treatment seine Wirkung erst zum designierten Zeitpunkt entfaltet und nicht bereits – wie es im Bereich von Policy-Programmen oft nicht auszuschließen ist – eine Reaktion im Voraus bedingt. Für die Eingrenzung der Vor-Treatment-Periode und damit für die Schätzung der synthetischen Kontroll-Einheit ist diese Annahme elementar. Die zweite Annahme besagt, dass der Effekt des Treatments nicht gleichzeitig auch den Outcome diverser Kontroll-Einheiten beeinflusst (Abadie et al. 2010, S. 494). Als Empfehlung bei der Anwendung betonen vor allem Abadie et al. (2010, S. 495-496), dass bei einem schlechten Fit der synthetischen Kontroll-Einheit in der Vor-Treatment-Phase unter Umständen die Methode für den Anwendungsfall verworfen werden sollte. Um dem schlechten Fit zu begegnen, kann der Pool an Kontroll-Einheiten allerdings von vornherein auf ähnliche Einheiten begrenzt werden, wodurch zusätzlich die Gefahr des Overfitting minimiert wird. Beim Overfitting wird ein augenscheinlich guter Match lediglich durch die Kombination einer großen Menge an idiosynkratischer Variation in den Kontroll-Einheiten erreicht. Schließlich sollte, wie oben bereits erwähnt, für eine gute Konstruktion eines synthetischen Vergleichsfalls die Anzahl an Vor-Treatment-Perioden möglichst groß sein. Genauso ist eine ausreichende Zahl an Nach-Treatment-Perioden bei einem graduell eintretenden Effekt für die Outcome-Variable empfehlenswert (Abadie et al. 2015, S. 500). 439 Zabler | Synthetisches Matching als Evaluations-Tool Außerdem ist die Wahl eines passenden Einsatzes eng mit potentiellen Vergleichsfällen verknüpft, vor allem hinsichtlich der rechtlichen und politischen Einheitlichkeit der betroffenen Kommune mit Vergleichs-Kommunen. Die kommunale Haushaltssituation, inklusive der Regelung der Aufsicht, ihrer Instrumente und Sanktionsmechanismen, ist unter anderem durch die Zugehörigkeit zu einem Bundesland determiniert, da die Rechtssetzung im kommunalen Bereich Aufgabe der Länder ist. Für die Analyse sollen diese bundeslandspezifischen Einflussfaktoren ausgeklammert werden, um damit zusätzliche Heterogenität zu vermeiden. Unter Berücksichtigung der methodischen Empfehlung zur Einschränkung potentieller Kontroll-Fälle auf von vornherein ähnliche Fälle erscheint daher die Festlegung auf ein Bundesland sinnvoll. Unter Berücksichtigung all dieser Aspekte fällt die Wahl auf den Einsatz in der kreisfreien Stadt Hagen in Nordrhein-Westfalen zu Beginn des Jahres 2008. Hagen zählt zu den drei prominenten und zugleich ersten Fällen eines Einsatzes eines beratenden Sparkommissars in NRW und bundesweit. Der Zeitpunkt eignet sich zur Analyse, da sowohl genügend Zeit zur Beobachtung nach dem Einsatz besteht, als auch die elektronische Datenverfügbarkeit im Vorfeld ausreichend gegeben ist. Bis zu diesem Punkt eignen sich die Einsätze in Waltrop 2006 und in Marl 2007 in gleichem Maß, allerdings ermöglicht der kreisfreie Status von Hagen einen verbesserten Datenzugang. So liegen beispielsweise für die kreisfreien Städte bessere Arbeitslosigkeitsstatistiken, Einkommensstatistiken und vor allem auch aus vorangegangenen Untersuchungen Gemeinde-interne Variablen vor. Dadurch ist eine präzisere Konstruktion eines synthetischen Vergleichsfalls gewährleistet. 5. Variablen und Daten Die Haushaltslage als grundlegender Outcome kann durch verschiedene Kennzahlen beschrieben werden. Die Wahl der Outcome-Variable orientiert sich daran, was von Seiten der Kommunalaufsicht als indikativ für eine angespannte Haushaltslage angesehen wird. Die Literatur ist sich dazu einig: Die Kassenkredite sind der wichtigste Krisenindikator und dienen als zentrale Vergleichsgröße (Holtkamp 2009, S. 151; Holtkamp 2010, S. 14, 16; Holler 2012, S. 2; Boettcher 2013, S. 15). Die Kassenkredite bilden das Ausmaß des Fehlbetrags und damit gewissermaßen die Grundlage für die Entscheidung über die Genehmigung des Haushalts ab. Dieser eventuelle Fehlbetrag muss rein aus Gründen der Haushaltsdarstellung durch Kassenkredite ausgeglichen werden, obwohl diese aus rechtlicher Sicht nur sehr kurzfristig verwendet werden dürfen (Holtkamp 2010, S. 14-15). Der Hauptgrund für den Einsatz eines beratenden Sparkommissars ist laut Holtkamp (2009, S. 151) letztlich die Höhe der Kassenkredite. Dadurch qualifiziert sich diese Kennzahl als die zentrale Outcome-Variable.12 12 An dieser Stelle stellt sich die Frage, ob anstatt der absoluten Höhe die Pro-Kopf-Höhe an Kassenkrediten verwendet werden sollte. Die Frage wurde empirisch beantwortet, da bei der Verwendung der absoluten Höhe ein deutlich verbesserter Fit in der Vor-Treatment-Phase erreicht werden konnte, das heißt, eine bessere Vorhersage möglich war. Aus theoretischer Sicht ist die absolute Höhe ebenfalls gerechtfertigt, da sie schlicht die Größe des Haushaltslochs beschreibt. 440 PVS, 57. Jg., 3/2016 Abhandlung Beim synthetischen Matching erfolgt, im Gegensatz zu einer sorgfältigen Regressionsanalyse, keine stark theoriegeleitete Integration unabhängiger Variablen, sondern im Vordergrund steht lediglich die Präzision der Vorhersage des Outcomes. Das Ziel ist, die Kassenkredithöhe möglichst gut vorhersagen zu können, um den bestmöglichen Fit zwischen synthetischem Vergleichsfall und Treatment-Fall in der Vor-Treatment-Phase zu erreichen. Trotz der Unerheblichkeit der theoretischen Dimension der Vorhersage-Variablen für die Schätzung per se bietet die folgende theoretische Diskussion zu den Ursachen kommunaler Haushaltsdefizite den Anknüpfungspunkt für die Suche nach Prädiktoren, die in ausreichendem Maße Vorhersagekraft entfalten können. In der öffentlichen und politischen Diskussion zu den Ursachen kommunaler Finanzschieflagen stehen sich zwei normative Positionen gegenüber: die Opferthe se, die die Probleme als exogen bedingt betrachtet; und die Verschwendungsthese, die kommunal-interne Versäumnisse als Ursache vertritt (Holtkamp 2010, S. 7-8). Diese normative Kategorisierung spiegelt sich in der wissenschaftlichen Trennung von Gemeinde externen und Gemeinde internen Variablen wider.13 Die Grundlage dieser Unterteilung sowie die Forschung zu kommunalen Haushaltsproblemen entstammen den Erklärungsansätzen der vergleichenden Staatstätigkeitsforschung (Holtkamp 2007, S. 4) und finden sich in nahezu unveränderter Form in der allgemeinen Forschung zu Haushaltskonsolidierung wieder (Wagschal u. Wenzelburger 2008, S. 52-64). Die Gemeinde-externen Variablen werden durch Faktoren der „Bedarfsverursachung“ (Boettcher 2013, S. 89) oder des „haushaltspolitischen Handlungsbedarfs“ (Boettcher 2012, S. 67) charakterisiert. Darunter werden Variablen der Sozialstruktur, der Wirtschaftsstruktur, der Demografie und der Raumstruktur subsummiert. Abhängig von der jeweiligen Sozialstruktur fallen für Kommunen Pflichten der Bedarfserfüllung an. Ausschlaggebend sind besonders die Arbeitslosenquote und die Altersstruktur der Kommunen, da sich daraus direkte Leistungen für die Kommunen ergeben, sei es aufgrund der Aufgaben im Bereich der sozialen Unterstützung oder aufgrund der Notwendigkeit bestimmter Infrastrukturleistungen (Holtkamp 2007, S. 4; Boettcher 2012, S. 67-68). Die Wirtschaftsstruktur entwickelt ihren Einfluss auf die Finanzsituation durch die Bereitstellung von Arbeitsplätzen (also indirekt wiederum über die Sozialstruktur) und über die Generierung von Steuereinnahmen (Boettcher 2013, S. 69-75). Hinsichtlich der Demografie ist die Bevölkerungsentwicklung ein zentraler Faktor. Eine rückläufige Bevölkerung stellt Kommunen vor das Problem, dass Infrastrukturleistungen aufgrund von Umsetzungsschwierigkeiten oder politischen Widerständen meist nicht proportional zur Bevölkerung reduziert werden können. (Boettcher 2012, S. 68). Zu den Faktoren der Raumstruktur zählen die zentralörtlichen Funktionen, die eine Kommune erfüllt und die zu zusätzlichen Belastungen führen (Holtkamp 2007, S. 12; Boettcher 2012, S. 68). Operationalisiert werden die demogra- 13 In der Literatur wird in überwiegendem Maße von exogenen und endogenen Variablen gesprochen. Aufgrund der Mehrdeutigkeit der Begriffe im Hinblick auf Exogenität beziehungsweise Endogenität in der methodologischen Literatur wird in dieser Arbeit auf die Begriffe (Gemeinde-) extern und (Gemeinde-)intern zurückgegriffen. 441 Zabler | Synthetisches Matching als Evaluations-Tool phischen Faktoren aus diesem Bereich über die Bevölkerungsgröße und die Bevölkerungsentwicklung. Aus dem Bereich der sozial-strukturellen Variablen werden die jeweilige Arbeitslosenquote und die Seniorenquote als Anteil der Bürger über dem 65.  Lebensjahr integriert. Erweitert wird die sozial-strukturelle Dimension um das durchschnittliche Pro-Kopf-Einkommen. Als Indikator für die wirtschaftliche Situation einer Kommune dient die Höhe der Gewerbesteuer pro Kopf.14 Hinsichtlich der räumlichen Lage wird auf den Zentralitätsindex nach dem Landesentwicklungsplan zurückgegriffen. Die Gemeinde-internen Variablen werden durch den Begriff „haushaltspolitische Handlungsfähigkeit“ charakterisiert (Boettcher 2012, S. 69). Aufgrund der Übersichtlichkeit und Klarheit bietet sich die Zweiteilung Gemeinde-interner Faktoren von Boettcher (2012, S. 69-71) an, der als bestimmende Faktoren die Fähigkeit beziehungsweise Position zentraler Akteure und die Intensität des politischen Wettbewerbs nennt. Die Idee einer Akteurskonstellation, die ein geringes Haushaltsdefizit fordert, geht auf Banner (1982, 1985) zurück und wird im Zusammenhang mit den Akteuren Bürgermeister und Parteien von Timm- Arnold (2011) aufgegriffen. Als förderlich für gute Haushaltspolitik wird vor allem eine starke Stellung von Steuerungspolitikern betont, die auf einen Rat mit gering ausgeprägtem Parteienwettbewerb ohne zusätzliche Konfliktlinien zwischen den Fraktionen treffen, um eine solide Haushaltspolitik betreiben zu können. Ausgeprägter Parteienwettbewerb fördert demnach wahltaktisch bedingtes opportunes Verhalten, das selten zur Lösung von Haushaltsproblemen führt. Genauso ist die Stellung eines starken Steuerungspolitikers zentral, der die notwendige Kompetenz und Akzeptanz besitzt, um sich gegenüber fachpolitischen Interessen durchzusetzen und politische Widerstande zu überwinden (Boettcher 2012, S.  69-71). Diese Zweiteilung der Gemeinde-internen Faktoren wird in der Literatur zum Teil um die Parteidifferenzhypothese erweitert, die postuliert, dass je nach parteipolitischer Zusammensetzung der Räte unterschiedliche Haushaltsergebnisse zu erwarten sind (Boettcher 2013, S. 108; Holtkamp 2007, S. 9-10). Im Hinblick auf die konkrete Messung lassen sich die Position zentraler Akteure und die Intensität des politischen Wettbewerbs nur schwer erfassen. Glücklicherweise bieten die Daten von Boettcher (2012) eine Übersicht für alle kreisfreien Städte in NRW. Auf der Basis von Umfragen von Kämmerern und Ratsvorsitzenden aus dem Jahr 2008 wurden drei zentrale Indizes gebildet: Das politische Wettbewerbspotential (zwischen 0 und 3), die Wettbewerbsintensität (zwischen 0 und 4) und die Durchsetzungsstärke der Steuerungspolitik (zwischen 0 und 5). Um den potentiellen Effekt der Parteiendifferenzhypothese zu berücksichtigen, wird außerdem der Anteil an SPD-Sitzen im Rat genutzt. Als zusätzlicher Indikator für die Größe und den Aufwand der Verwaltung und Infrastruktur sind der Personalstand und die Personalausgaben pro Kopf berücksichtigt. Schließlich wird, wie in Abadie et al. (2010, S. 499), die Kassenkredithöhe zweier früherer Perioden (1995 und 2005) berück- 14 Die Klassifizierung der Gewerbesteuereinnahmen als externe oder interne Variable ist nicht trennscharf. Neben der Abhängigkeit von wirtschaftlichen – externen – Bedingungen, ist die Höhe der Einnahmen auch stark durch Hebesatzanpassungen bestimmt, was wiederum eher einem internen Faktor in Form einer einnahmeseitigen Konsolidierungsstrategie entspricht. 442 PVS, 57. Jg., 3/2016 Abhandlung sichtigt, um dem Ausgangsniveau an Kassenkreditschulden Rechnung zu tragen. Der Gesamtzeitraum der Daten umfasst die Jahre 1995 bis 2012, wobei nicht alle Variablen für alle Zeiträume zur Verfügung stehen. Tabelle 1 zeigt die jeweiligen Variablen mit ihren Operationalisierungen, den verfügbaren Zeiträumen und den Quellen. Tabelle 1: Übersicht über die verwendeten Variablen, die Operationalisierungen, den verfügbaren Zeitraum und die jeweiligen Quellen Variable Operationalisierung Zeitraum Quelle Kommunale Haushaltssituation Kassenkredithöhe (Ist-Zahlen) 1995 - 2012 Landesdatenbank NRW (auf Anfrage) Bevölkerungsgröße Absolute Größe 1995 - 2012 Landesdatenbank NRW Bevölkerungsentwicklung Veränderung gegenüber Vorjahr 1996 - 2012 Landesdatenbank NRW Arbeitslosigkeit Arbeitslosenquote 1998 - 2012 Landesdatenbank NRW Seniorenquote Bevölkerung über 65 1995 - 2012 Landesdatenbank NRW Einkommensstruktur Durchschnittliches Einkommen 2000 - 2011 Landesdatenbank NRW Wirtschaftskraft Gewerbesteuer pro Kopf (Ist-Zahlen) 1995 - 2012 Landesdatenbank NRW Zentralität Zentralitätsindex Landesentwicklungsplan (1 - 11) – Boettcher (2012) Personalaufwand Personalstand, -ausgaben (pro Kopf) 1995 - 2012 Landesdatenbank NRW Wettbewerbspotential Index auf der Basis von Umfragen 2008 Boettcher (2012) Wettbewerbsintensität Index auf der Basis von Umfragen 2008 Boettcher (2012) Durchsetzungsstärke Steuerungspolitik Index auf der Basis von Umfragen 2008 Boettcher (2012) Parteizusammensetzung Anteil an SPD-Sitzen 1995 - 2012 Landesdatenbank NRW Ausgangsverschuldung Ausgangsniveau der Kassenkredite in 1.000 € 1995, 2000 Landesdatenbank NRW (auf Anfrage) Quelle: Landesdatenbank NRW (https://www .landesdatenbank .nrw .de/); Boettcher 2012 (siehe Literaturverzeichnis) . 6. Ergebnisse der Analyse Das zentrale Analyseergebnis wird im Vergleich der Verläufe der Kassenkredithöhe der Stadt Hagen und der synthetischen Vergleichskommune deutlich. Im Vorfeld ist allerdings die Angabe zur Passform des synthetischen Vergleichsfalls elementar. Ziel ist es, eine synthetische Vergleichskommune zu schaffen, die der Stadt Hagen bezüglich der Prädiktoren für die Höhe der Kassenkredite ähnlich ist. Die Gruppe 443 Zabler | Synthetisches Matching als Evaluations-Tool der Kontroll-Einheiten umfasst alle kreisfreien Städte in NRW bis auf die Stadt Aachen, für die teilweise die Daten nicht verfügbar sind. Die Vor-Treatment-Phase ist von 1995 bis 2007 festgelegt. Um etwaige Antizipationseffekte auszuschließen, wurde der Zeitraum zur Schätzung des Vergleichsfalls auch auf 2006 und 2005 begrenzt, was die Ergebnisse allerdings in keiner Weise beeinflusst hat. Tabelle 2: Mittelwerte und Gewichte der Variablen zur Vorhersage der Höhe der Kassenkredite Hagen Synthetischer Vergleichsfall Durchschnitt Kontrollgruppe Gewicht der Variablen Bevölkerung 202759,538 374964,502 341294,873 0,000 Bevölkerungsentwicklung -1521,250 -370,134 -557,192 0,008 Arbeitslosenquote 12,010 11,059 12,082 0,051 Seniorenquote 0,198 0,187 0,185 0,000 Einkommen 16914,750 16943,537 16848,963 0,238 Gewerbesteuer 0,364 0,467 0,436 0,032 Zentralität 8,000 9,113 8,500 0,000 Personalstand 0,052 0,087 0,053 0,000 Personalausgaben 0,665 0,641 0,589 0,177 Wettbewerbspotential 1,000 1,291 1,800 0,04 Wettbewerbsintensität 2,000 1,818 1,200 0,21 Durchsetzungsstärke 2,000 2,280 2,750 0,1 Anteil SPD-Sitze 0,428 0,373 0,394 0,008 Kassenkredite 1995 61,056 55,927 51,888 0,059 Kassenkredite 2000 20,344 51,787 81,306 0,074 Anmerkung: Rundung der Gewichte auf die dritte Nachkommastelle . Quelle: Eigene Darstellung auf Basis eigener Berechnungen . Durch die Berechnung der Gewichte für die jeweiligen Kontroll-Kommunen lassen sich die Zusammensetzung des synthetischen Vergleichsfalls und damit auch die Werte der Prädiktoren des synthetischen Vergleichsfalls darstellen, um zu veranschaulichen, ob ein sinnvoller Vergleich im Hinblick auf die Vor-Treatment- Eigenschaften möglich ist. Tabelle 2 zeigt dazu in Spalte eins bis drei die Übersicht über die Mittelwerte der Prädiktoren für Hagen, den synthetischen Vergleichsfall und den schlichten Durchschnitt aller Kommunen in der Kontrollgruppe. Es wird ersichtlich, dass der einfache Durchschnitt Hagen verständlicherweise nicht exakt widerspiegeln kann; darüber hinaus, dass bei manchen Variablen keine oder kaum eine Verbesserung vom rohen Durchschnitt der Vergleichskommunen zum synthetischen Fall stattgefunden hat, bei anderen wiederum eine präzise Annäherung beobachtet werden kann. Für einen bestmöglichen Fit des synthetischen Falls wäre eine genaue Übereinstimmung von Spalte eins und zwei wünschenswert. Bezieht man in die Betrachtung Spalte vier, die Gewichte im Hinblick auf die Vorhersagekraft der Variablen, mit ein, relativiert sich das Ergebnis: Lediglich die Variablen mit einem sehr geringen Gewicht zeigen keine oder kaum eine An- 444 PVS, 57. Jg., 3/2016 Abhandlung näherung des synthetischen Vergleichsfalls an die Stadt Hagen und sind daher kein Indiz für einen schlechten Fit (Abadie et al. 2010, S. 500). Auf den Variablen mit einer großen Vorhersagekraft ist eine deutliche Näherung der Werte sichtbar. Zu den Gemeinde-externen Variablen mit der meisten Vorhersagekraft zählen das durchschnittliche Einkommen, die Arbeitslosenquote und die Gewerbesteuer pro Kopf. Bei den Gemeinde-internen Variablen spielen dagegen bis auf den Personalstand und den Anteil an SPD-Sitzen im Rat alle Variablen eine gewisse Rolle. Das Ausgangsniveau der Kassenkredite trägt erwartungsgemäß ebenfalls zur Vorhersage bei. Die Werte in Tabelle 3 beschreiben den Anteil, den jede der kreisfreien Städte in NRW zur Bildung der synthetischen Kommune beiträgt. Daraus wird ersichtlich, dass sich Hagen zum größten Teil durch eine Kombination der Eigenschaften der Kommunen Bonn, Duisburg, Essen, Leverkusen und in begrenztem Maß Gelsenkirchen und Herne abbilden lässt. Tabelle 3: Gewichte der Kommunen aus der Kontrollgruppe zur Bildung des synthetischen Vergleichsfalls Kommune Gewicht Kommune Gewicht Bielefeld 0,000 Herne 0,025 Bochum 0,006 Krefeld 0,000 Bonn 0,410 Köln 0,000 Bottrop 0,001 Leverkusen 0,126 Dortmund 0,000 Mönchengladbach 0,000 Duisburg 0,101 Münster 0,000 Düsseldorf 0,000 Oberhausen 0,000 Essen 0,246 Remscheid 0,000 Gelsenkirchen 0,084 Solingen 0,000 Hamm 0,000 Wuppertal 0,000 Anmerkung: Rundung der Gewichte auf die dritte Nachkommastelle . Quelle: Eigene Darstellung auf Basis eigener Berechnungen . Der Kern der Analyse steckt in Abbildung 1. Darin wird der Verlauf der Kassenkredithöhe in Hagen dem synthetischen Kontroll-Fall gegenübergestellt. Zusätzlich vertikal eingetragen ist das Jahr 2008, in dem der beratende Sparkommissar seinen Dienst in Hagen aufnahm. Der generelle Trend der Kassenkreditentwicklung in Hagen in den Jahren 1995 bis 2000 bewegt sich sehr nahe der Null-Grenze, bevor daraufhin die Kassenkredite bis zum Jahr 2008 und darüber hinaus beinahe linear ansteigen. Der Fit des synthetischen Falls in der Vor-Treatment- Phase ist außerordentlich gut. Die Entwicklung der Kassenkredithöhe der Stadt Hagen kann durch die Kombination der Kontroll-Fälle beinahe perfekt rekonstruiert werden. Dies zeigt, dass die Vorhersage präzise ist und spricht für eine gerechtfertigte Anwendung des synthetischen Matching. 445 Zabler | Synthetisches Matching als Evaluations-Tool Abbildung 1: Verlauf der Kassenkredithöhe über den Zeitraum von 1995 bis 2012 der kreisfreien Stadt Hagen und ihrem synthetisch gebildeten Vergleichsfall Quelle: Eigene Darstellung auf Basis eigener Berechnungen . Nachdem sich die Schätzung des Vergleichsfalls als erfolgreich erwiesen hat, ist nun die Diskrepanz in der Entwicklung ab 2008 zentral: Während sich beim synthetischen Fall der Anstieg der Kassenkredite verlangsamt, geht der Trend in Hagen in beinahe unverändertem Maß weiter. Der Einsatz des beratenden Sparkommissars führt nicht zu einer Reduzierung der Kassenkredithöhe (oder zumindest zu einem verlangsamten Anstieg) im Verlauf der folgenden vier Jahre. Der beratende Sparkommissar scheint im Gegenteil auf den ersten Blick sogar einen die Kassenkredite erhöhenden Effekt ausgeübt zu haben. Dazu zeigt Abbildung 2 das Ausmaß der Differenz der Kassenkredithöhe zum Vergleichsfall vor und nach dem Einsatz des beratenden Sparkommissars. Während sich die Abweichungen vor dem Einsatz in moderaten Bereichen bewegen, entspricht die Abweichung danach einem Bereich zwischen 27.000 und 154.000 Euro. Dabei steigt nach dem Einsatz die Differenz an und sinkt wieder zum Ende des Beobachtungszeitraums. 446 PVS, 57. Jg., 3/2016 Abhandlung Abbildung 2: Differenz der Kassenkredithöhe über den Zeitraum von 1995 bis 2012 der kreisfreien Stadt Hagen und ihrem synthetisch gebildeten Vergleichsfall Quelle: Eigene Darstellung auf Basis eigener Berechnungen . Im nächsten Schritt wird das Ergebnis einer Überprüfung der Unsicherheit unterzogen. Dabei wird getestet, ob ähnliche Resultate bei der zufälligen Wahl einer der Vergleichskommunen als Treatment-Fall beobachtet werden können. Können ähnliche Differenzen für die Kommunen aus der Kontrollgruppe wie für die Stadt Hagen beobachtet werden, ist der Rückschluss, dass der entdeckte Treatment- Effekt auf den Sparkommissar-Einsatz zurückgeht, unsicher. In Abbildung 3 sind die Differenzen der jeweiligen Kommunen zu ihrem synthetischen Vergleichsfall für alle Kommunen abgetragen. Dem Vorgehen von Abadie et al. (2010, S. 502) folgend werden Kommunen mit einer unpräzisen Schätzung des Verlaufs in der Vor-Treatment-Phase ausgeschlossen.15 Die Logik hinter diesem Vorgehen besteht darin, dass Kommunen, für die keine besonders präzise Vergleichskommune gebildet werden kann, nicht zur Quantifizierung der Unsicherheit dienen sollten. Die Ergebnisse des Placebo-Tests lassen keinen eindeutigen Rückschluss auf die Sicherheit der Ergebnisse zu. Hagen ist nicht die einzige Kommune, die einen Effekt zum Zeitpunkt 2008 zeigt, wenngleich keine der anderen Kommunen einen gleichartigen oder gar stärkeren Effekt zeigt. Die Ergebnisse deuten zwar vorsichtig in die Richtung eines gegenteiligen Effekts, aufgrund der wenig eindeutigen Ergebnisse der Placebo-Studie kann dieser allerdings nicht als gesichert angenom- 15 Die Präzision der Schätzung wird über den Mean Squared Prediction Error (MSPE) der Outcome- Variable in der Vor-Treatment-Phase definiert (siehe auch Appendix). Kommunen mit einem deutlich höheren Vorhersagefehler als der Treatment-Fall Hagen werden bei der Analyse ausgeschlossen. 447 Zabler | Synthetisches Matching als Evaluations-Tool men werden. Zentral festgehalten werden sollte, dass ein die Kassenkredithöhe beschränkender Effekt des beratenden Sparkommissars allerdings keinesfalls gegeben ist. Abbildung 3: Ergebnisse des Placebo-Tests Anmerkung: Differenz der Kassenkredithöhe über den Zeitraum von 1995 bis 2012 der kreisfreien Stadt Hagen und ihrem synthetisch gebildeten Vergleichsfall, gegenübergestellt den Differenzen aller Städte aus der Kontrollgruppe (mit einem MSPE < 3 x MSPE von Hagen) und ihren jeweiligen synthetischen Vergleichsfällen . Quelle: Eigene Darstellung auf der Basis eigener Berechnungen . Eine zugegebenermaßen spekulative inhaltliche Erklärung für einen negativen oder zumindest ausbleibenden positiven Effekt des Einsatzes liegt in der Diskrepanz zwischen dem Konsolidierungserfolg des beratenden Sparkommissars und den nicht zu unterschätzenden Kosten des Einsatzes. Die Kosten für den Einsatz eines beratenden Sparkommissars müssen von der Kommune getragen werden. Zusätzlich waren im Fall der Stadt Hagen fünf weitere Mitarbeiter für die Unterstützung des Einsatzes freigestellt, was zusätzliche Personalkosten verursacht haben dürfte (Holtkamp 2009, S. 155). Unter der Voraussetzung, dass der Sparkommissar also keinerlei direkt sichtbaren Erfolg beim Abbau der Kassenkredite erreicht, schlagen lediglich seine Kosten durch. Diese Argumentation wird durch die fallstudienartige Evidenz von Holtkamp (2009, S. 153) gestützt. Im Fall der Stadt Waltrop wurden beispielsweise für ein Jahr Kosten von 210.000 Euro für den Einsatz des beratenden Sparkommissars veranschlagt. Derselbe Mechanismus könnte für den beobachteten Anstieg im hier untersuchten Fall der Stadt Hagen ursächlich sein. Dafür spricht auch die Beobachtung, dass sich die Entwicklung der Kassenkredithöhe in 448 PVS, 57. Jg., 3/2016 Abhandlung Hagen zum Ende des Beobachtungszeitraums wieder dem Niveau des Vergleichsfalls annähert, was für eine kurzzeitige Belastung spricht. Ein weiterer methodisch begründeter Erklärungsversuch könnte in der Verletzung der Annahme, dass keine Interferenz zwischen den Fällen herrscht, liegen. Die Einsetzung eines beratenden Sparkommissars im Fall Hagen, als erste kreisfreie Stadt und als Fortführung der Einsätze in Waltrop und Marl, könnte Einfluss auf die anderen kreisfreien Städte – oder zumindest einen Teil davon – zu einem vergleichbaren Zeitpunkt genommen haben. Die Drohkulisse, die durch die Einsätze aufgebaut wird, wirkt als Quasi-Treatment und die Annahme keiner Interferenz zwischen den Untersuchungseinheiten ist unter Umständen verletzt. 7. Fazit Die schwierige Haushaltssituation vieler Kommunen in NRW dient als Ausgangspunkt zur systematischen Evaluation eines der jüngsten Instrumente kommunaler Finanzkontrolle, des beratenden Sparkommissars. Dieses neu geschaffene Instrument soll als zusätzliche Eskalationsstufe Kommunen mit dauerhaft unausgeglichenem Haushalt den Weg aus der finanziellen Schieflage aufzeigen. Die Stadt Hagen mit einem der bislang seltenen Einsätze eines beratenden Sparkommissars 2008 stellt den zentralen Analysefall dar. Mithilfe einer bisher kaum verwendeten Methode aus der Programmevaluationsforschung wurde die Wirksamkeit des beratenden Sparkommissars zum ersten Mal systematisch quantifiziert. Auf der Basis von Daten zu den Kassenkreditschulden und deren Gemeinde-externen und -internen Bestimmungsfaktoren konnte mithilfe des synthetischen Matching ein zur Stadt Hagen passender Vergleichsfall gebildet werden, der Aufschluss über die kontrafaktische Situation des Sparkommissareinsatzes gibt. Das zentrale Ergebnis des Vergleichs: Der von der Kommunalaufsicht zugeschriebene positive Effekt des beratenden Sparkommissars ist auf Grundlage der hier gewonnenen Ergebnisse im Fall von Hagen nicht gegeben. Zwar lässt die Betrachtung der Schätzergebnisse inklusive der Unsicherheit auch nicht den eindeutigen Schluss auf einen negativen Effekt zu, rückt aber den positiven Einfluss in weite Ferne. Damit kommt diese Arbeit zu einem ähnlich ernüchternden Fazit wie Holtkamp (2009, 2010). Eine denkbare Erklärung für den ausbleibenden Erfolg beratender Sparkommissare liefert die Literatur: Die Voraussetzung für einen wirksamen kontrollierenden Eingriff in die kommunalen Finanzen ist direkte Sanktionsmacht (Glöckner u. Mühlenkamp 2009, S. 14). Trotz der gut gemeinten Absicht einer kooperativen Lösung handelt es sich bei Haushaltskonsolidierungen um einen konfliktiven Prozess, für den stärker hierarchische Mechanismen besser geeignet sein könnten (Holtkamp 2009, S. 146). Eine erste zu treffende Einschränkung der Ergebnisse besteht in der Struktur kommunaler Schulden. Durch Auslagerungen, beispielsweise in Form von Regieund Eigenbetrieben, die oft strategische Anreize zur Entlastung ‚auf dem Papier‘ bieten, ist die Transparenz der Verschuldungssituation oft eingeschränkt (Herrmann 2012, S. 1-2). In einem zukünftigen Forschungsvorhaben könnten durch die Berücksichtigung dieser Schattenhaushalte die Ergebnisse weiter präzisiert werden. Darüber hinaus ist für die weitere Forschung vor allem die Ausdehnung 449 Zabler | Synthetisches Matching als Evaluations-Tool der Analyse auf andere Kommunen, die von einem Sparkommissareinsatz betroffen waren, wichtig. Dies ist vor dem Hintergrund zu sehen, dass in diesem Beitrag lediglich ein Hagen-spezifischer Effekt, nicht aber ein genereller Effekt für alle Einsätze beratender Sparkommissare, ermittelt werden kann. Bereits die erwähnten Fallstudien verdeutlichen gewissermaßen die ‚Einzigartigkeit‘ der jeweiligen Sparkommissareinsätze. Demensprechend wäre es gewagt, von einer Generalisierbarkeit des Falls Hagen auf andere Kontexte zu sprechen. Besonders angesichts der oben erwähnten Bestellung echter Sparkommissare in der jüngeren Vergangenheit und der generell erleichterten Einsetzbarkeit dieses Instruments im Rahmen der Bestimmungen aktueller Entschuldungsfonds muss zukünftige Forschung sich der systematischen Evaluation beider Beauftragtenmodelle annehmen. Abschließend ist es ein zentrales Anliegen dieses Beitrags, ein starkes Plädoyer für den Einsatz des synthetischen Matching in der vergleichenden verwaltungswissenschaftlichen Forschung zu halten. Für die Evaluation eingesetzter Instrumente, Programme oder Pilotprojekte, die sich ansonsten häufig auf eine fallstudienartige Beschreibung beschränken muss, bieten sich in diesem Forschungsfeld unzählige Anwendungsmöglichkeiten, die weitreichende Implikationen besitzen und damit der stärkeren Verknüpfung von Forschung und Praxis in der Verwaltungswissenschaft Rechnung tragen. Literatur Abadie, Alberto, Alexis Diamond, und Jens Hainmueller. 2010. Synthetic Control Methods for Comparative Case Studies: Estimating the Effect of California’s Tobacco Control Program. Journal of the American Statistical Association 105: 493-505. DOI: 10.1198/ jasa.2009.ap08746. Abadie, Alberto, Alexis Diamond, und Jens Hainmueller. 2011. Synth: An R Package for Synthetic Control Methods in Comparative Case Studies. Journal of Statistical Soft ware 42: 1-17. DOI: 10.18637/jss.v042.i13. Abadie, Alberto, Alexis Diamond, und Jens Hainmueller. 2015. Comparative Politics and the Synthetic Control Method. American Journal of Political Science 59: 495-510. DOI: 10.1111/ajps.12116. Abadie, Alberto, und Javier Gardeazabal. 2003. The Economic Costs of Conflict: A Case Study of the Basque Country. The American Economic Review 93: 113-132. DOI: 10.1257/000282803321455188. Bajohr, Stefan. 2009. Beratender Sanierungsmanager in einer hoch verschuldeten Kommune: Ein Erfahrungsbericht aus der Stadt Hagen. Verwaltung und Management 15: 171-185. Banner, Gerhard. 1982. Zur politisch-administrativen Steuerung in der Kommune. Archiv für Kommunalwissenschaften 1: 26-46. Banner, Gerhard. 1985. Haushaltspolitik und Haushaltskonsolidierung. In Handbuch der kommunalen Wissenschaft und Praxis. Band 6: Kommunale Finanzen, Hrsg. Günter Püttner, 423-440. Berlin/Heidelberg: Springer. DOI: 10.1007/978-3-642-61656-3_21. Bogumil, Jörg, und Werner Jann. 2009. Verwaltung und Verwaltungswissenschaft in Deutschland. Einführung in die Verwaltungswissenschaft. Wiesbaden: VS Verlag für Sozialwissenschaften. DOI: 10.1007/978-3-531-91341-4. 450 PVS, 57. Jg., 3/2016 Abhandlung Bogumil, Jörg, Lars Holtkamp, Martin Junkernheinrich, und Uwe Wagschal. 2014. Ursachen kommunaler Haushaltsdefizite. Politische Vierteljahresschrift 55: 614-647. DOI: 10.5771/0032-3470-2014-4-614. Boettcher, Florian. 2012. Kommunale Haushaltsdefizite: Umfang, Ursachen und Lösungsmöglichkeiten. dms – der moderne staat – Zeitschrift für Public Policy, Recht und Management 5: 65-84. Boettcher, Florian. 2013. Ursachen kommunaler Haushaltsdefizite. Eine finanz und poli tikwissenschaftliche Untersuchung am Beispiel der nordrhein westfälischen Gemein den. Dissertation (Technische Universität Kaiserslautern). Münster: LIT Verlag. Duve, Thomas. 2008. Staatskommissare als Manager kommunaler Haushaltskonsolidierungsprozesse. Verwaltung und Management 14: 283-293. DOI: 10.5771/0947- 9856-2008-6-283. Effer-Uhe, Daniel. 2008. Echter und beratender Sparkommissar im Kommunalrecht der Länder. Zeitschrift für Kommunalfinanzen 58: 25-29. Frielinghaus, Stefan Niederste. 2007. Die kommunale Insolvenz als Sanierungsansatz für die öffentlichen Finanzen. Stuttgart: Boorberg. Glöckner, Andreas, und Holger Mühlenkamp. 2009. Die kommunale Finanzkontrolle. Zeitschrift für Planung & Unternehmenssteuerung 19: 397-420. DOI: 10.1007/ s00187-008-0065-0. Gröteke, Friedrich, und Karsten Mause. 2009. Die deutsche „Schuldenbremse“: Ein wirksames Instrument zur Vermeidung eines Bailout? Zeitschrift für Wirtschaftspolitik 58: 309-335. DOI: 10.1515/zfwp-2009-0303. Herrmann, Karolin. 2012. Kommunale Schattenhaushalte – Versteckte Schulden und Haf tungsrisiken. Berlin: Karl-Bräuer-Institut des Bundes der Steuerzahler. Holland, Paul W. 1986. Statistics and Causal Inference. Journal of the American Statistical Association 81: 945-960. DOI: 10.1080/01621459.1986.10478354. Holler, Benjamin. 2012. Liquiditätsverschuldung außer Kontrolle? Kommunale Finanzaufsicht im Ländervergleich. Arbeitspapier 1/2012. Forschung für Kommunen. http:// forschung-fuer-kommunen.de/index.php/forschung/66-liquiditaetskredite-ausserkontrolle. Zugegriffen: 17.06.2016. Holtkamp, Lars. 2006. Der beratende Sparkommissar gemäß §124 GO NRW. Der Ge meindehaushalt 107: 41-43. Holtkamp, Lars. 2007. Wer hat Schuld an der Verschuldung? Ursachen nationaler und kommunaler Haushaltsdefizite. Polis 64: 1-32. Holtkamp, Lars. 2009. Governance-Konzepte in der Haushaltskrise: Eine Analyse am Beispiel der beratenden Sparkommissare. Verwaltung und Management 15: 146-159. DOI: 10.5771/0947-9856-2009-3-146. DOI: 10.5771/0947-9856-2009-3-146. Holtkamp, Lars. 2010. Kommunale Haushaltspolitik bei leeren Kassen. Bestandsauf nahme, Konsolidierungsstrategien, Handlungsoptionen. Berlin: Ed. Sigma. Holtkamp, Lars. 2016. Symbolische Haushaltspolitik: Zum Verhältnis von symbolischer Politik und Haushaltskonsolidierung mit einigen Illustrationen aus NRW. Verwaltung und Management 22: 14-26. DOI: 10.5771/0947-9856-2016-1-14. King, Gary, Robert Owen Keohane, und Sidney Verba. 1994. Designing social inquiry. Scientific inference in qualitative research. Princeton: Princeton University Press. 451 Zabler | Synthetisches Matching als Evaluations-Tool Mill, John Stuart. 1906. A system of logic ratiocinative and inductive. Being a connected view of the principles of evidence and the methods of scientific investigation. New York/London/Bombay: Longmans. Ministerium für Inneres und Kommunales Nordrhein-Westfalen. 2013. Erster Sparkommis sar soll Eifel Gemeinde Nideggen sanieren. http://www.mik.nrw.de/presse-mediathek/ aktuelle-meldungen/archiv/archiv-meldungen-im-detail/news/erster-sparkommissar-solleifel-gemeinde-nideggen-sanieren.html. Zugegriffen: 15.07.2015. Ministerium für Inneres und Kommunales Nordrhein-Westfalen. 2014. Kommunen in Nordrhein Westfalen in der Haushaltssicherung: Entwicklung 2004 bis 2013. http:// www.mik.nrw.de/fileadmin/user_upload/Redakteure/Dokumente/Themen_und_ Aufgaben/Kommunales/kommunale_finanzen/2013-12-31_anzahl_hsk-kommunen_ NRW_grafik.pdf. Zugegriffen: 15.07.2015. Przeworski, Adam, und Henry Teune. 1970. The Logic of Comparative Social Inquiry. New York: John Wiley & Sons. Statistisches Bundesamt. 2014. Finanzen und Steuern. Schulden der öffentlichen Haushalte. Wiesbaden: Statistisches Bundesamt. Stolzenberg, Philipp, und Hubert Heinelt. 2013. „Die Griechen von NRW“. Kommunale Rettungsschirme der Bundesländer. dms – der moderne staat – Zeitschrift für Public Policy, Recht und Management 6: 463-484. Timm-Arnold, Klaus-Peter. 2011. Bürgermeister und Parteien in der kommunalen Haus haltspolitik. Endogene Ursachen kommunaler Haushaltsdefizite. Wiesbaden: VS Verlag für Sozialwissenschaften. DOI: 10.1007/978-3-531-92675-9. Vogelgesang, Klaus, Uwe Lübking, und Ina-Maria Ulbrich. 2005. Kommunale Selbstverwal tung. Rechtsgrundlagen – Organisation – Aufgaben – neue Steuerungsmodelle. Berlin: Schmidt. Wagschal, Uwe, und Georg Wenzelburger. 2008. Haushaltskonsolidierung. Wiesbaden: VS Verl. für Sozialwissenschaften. Zabler, Steffen, Christian Person, und Falk Ebinger. 2016. Finanzaufsicht in den Ländern: Struktur, Recht und ihr (fraglicher) Effekt auf die kommunale Verschuldung. Zeitschrift für Kommunalfinanzen 2016.1: 6-12. Autorenangaben Steffen Zabler, M.A. Lehrstuhl für Politikwissenschaft (Prof. Dr. Stephan Grohs) Deutsche Universität für Verwaltungswissenschaften Speyer Freiherr-vom-Stein-Str. 2 D-67346 Speyer Telefon: +49 (0) 6232 654-146 E-Mail: zabler@uni-speyer.de Web: http://www.uni-speyer.de/grohs 452 PVS, 57. Jg., 3/2016 Abhandlung Appendix A1: Details der Analysestrategie Die folgenden Details der Analysestrategie sind den Ausführungen von Abadie et al. (2010, S. 494-496) nachempfunden. Den Ausgangspunkt bilden ? ? + 1 Einheiten, von denen aus Gründen der einfacheren Notation die erste Einheit vom Treatment betroffen sei und insgesamt ? ? potentielle Kontroll-Einheiten verbleiben. ? ? !" ! bildet den Outcome für Einheit ? ? zum Zeitpunkt ? ? ohne Treatment für alle Einheiten ? ? = 1, . . ., ? ? + 1 und Zeitpunkte ? ? = 1, . . . ,? ? . ? ? ! bildet den Zeitraum vor dem Treatment mit 1 ≤ ? ? ! < ? ? . Analog dazu ist ? ? !" ! der Outcome für den Treatment-Status im Zeitraum von ? ? ! + 1 bis ? ? . ? ? !" = ? ? !" ! − !" ! stellt den interessierenden Effekt für eine bestimmte Einheit und einen bestimmten Zeitpunkt dar. Da man für den Treatmentfall den Outcome ? ? !! ! beobachten kann, muss lediglich ? ? !! ! geschätzt werden, das durch ein Faktormodell charakterisiert werden kann: ? ? !" ! = ? ? ! + ? ? !? ? ! + ? ? !? ? ! + ? ? !" (1) Dabei bildet ? ? ! einen unbekannten gemeinsamen Faktor mit konstanten Ladungen für alle Einheiten. ? ? ! ist ein (? ? ×1) Vektor beobachteter Kovariaten, ? ? ! ein (1×? ? ) Vektor unbekannter Parameter. ? ? ! ist ein (1×? ? ) Vektor unbeobachteter gemeinsamer Faktoren, ? ? ! ein (? ? ×1) Vektor unbekannter Faktorladungen. Die Fehlerterme ? ? !" sind vorübergehende Schocks auf der Ebene der Einheiten mit einem Mittelwert von null. Weiterhin besteht ein (? ? ×1) Vektor von Gewichten ? ? = (? ? !, . . . ,? ? !!!)′, die alle ≥ 0 sind und sich zu eins addieren. Dieser Vektor ? ? ist letztlich ein potentieller künstlicher Kontroll-Fall in Form eines gewichteten Mittelwerts, bestehend aus real existierenden Kontroll-Einheiten. Daraus ergibt sich die Outcome-Variable für die synthetische Kontroll-Einheit als: !!!!!! ? ? !? ? !" = ? ? ! + ? ? ! !!! !!! ? ? !? ? ! + ? ? ! !!! !!! ? ? !? ? ! + !!! !!! ? ? !? ? !" (2) Die Gewichte (? ? ! ∗, . . . ,? ? !!! ∗ ) für die einzelnen Kontroll-Einheiten werden so gewählt, dass gilt: !!!!!! ? ? ! ∗? ? !! = ? ? !!, !!! !!! ? ? ! ∗? ? !! = ? ? !", . . . , !!! !!! ? ? ! ∗? ? !!! = ? ? !!!und !!! !!! ? ? ! ∗? ? ! = ? ? ! (3) Es wird in der Schätzung der Gewichte letztlich versucht, eine Balance in den Vor-Treatment-Phasen hinsichtlich des Outcomes ? ? !" und der bekannten Prädiktoren ? ? ! zu erreichen. Abadie et al. (2010, S. 495, 503-504) beweisen ausgehend von dem Faktormodell in Gleichung 1 und 2, dass, wenn die Anzahl an Vor-Treatment-Perioden groß genug ist, der beste Schätzer für den Treatment-Effekt ? ? !! ist: ? ? !! = ? ? !! − !!! !!! ? ? ! ∗? ? !" (4) Das Rational hinter dem Beweis von Abadie et al. (2010), dass bei genügend Vor-Treatment-Perioden ein guter Schätzer für den Treatment-Effekt erreicht werden kann, der dem Problem unbeobachteter Einflussfaktoren und der Die folg nd Details der Analysestrategie sind den Ausführungen von Abadie et al. (2010, S. 494-496) nachempfunden. Den Ausgangspunkt bilden ? ? + 1 Einheiten, n denen aus Gründen der einfacheren Notation die erste Einheit vom Treatment betroffen sei und insgesamt ? ? potentielle Kontroll-Einheiten verbleiben. ? ? bildet e Outcome für Einheit ? ? zum Zeitpunkt ? ? ohne Treatment für alle Einheiten ? ? = 1, . . ., ? ? + 1 und Zeitpunkte ? ? = 1, . . . ,? ? . ? ? ! bildet den Zeitraum vor dem Treatment mit 1 ≤ ? ? ! < ? ? . Analog dazu ist ? ? !" ! der Outcome für den Treatm nt-Status im Zeitraum von ? ? ! + 1 bis ? ? . ? ? !" = ? ? !" ! − !" ! stellt den interessierenden Effekt für eine bestimmte Einheit und einen bestimmten Zeitpunkt dar. Da man für den Treatmentfall den Outcome ? ? !! ! beobachten kann, muss lediglich ? ? !! ! geschätzt werden, das durch ein Faktormodell charakterisiert werden kann: ? ? !" ! = ? ? ! + ? ? !? ? ! + ? ? !? ? ! + ? ? !" (1) Dabei bildet ? ? ! einen unbekannten gemeinsamen Faktor mit konstanten Ladunge für alle Einheiten. ? ? ! ist ein (? ? ×1) Vektor beobachteter Kovariaten, ? ? ! ein (1×? ? ) Vektor unbekannter Parame-ter. ? ? ! ist ein (1×? ? ) Vektor unbeobachteter gemeinsamer Faktoren, ? ? ! ein (? ? ×1) Vektor unbekannter Faktorladungen. Die Fehlerterme ? ? !" sind vorübergehende Schocks auf der Ebene der Einheiten mit einem Mittelwert von null. Weiterhin esteht ein (? ? ×1) Vektor von Gewichten ? ? = (? ? !, . . . ,? ? !!!)′, die alle ≥ 0 sind und sich zu eins addieren. Dieser Vektor ? ? ist letztlich ein potentieller künstlicher Kontroll-Fall in Form eines gewichteten Mittelwerts, bestehend aus real existierenden Kontroll-Einheiten. Daraus ergibt sich die Outcome-Variable für die sy thetische Kontroll-Einheit als: !!!!!! ? ? !? ? !" = ? ? ! + ? ? ! !!! !!! ? ? !? ? ! + ? ? ! !!! !!! ? ? !? ? ! + !!! !!! ? ? !? ? !" (2) Die Gewichte (? ? ! ∗, . . . ,? ? !!! ∗ ) für die einzelnen Kontroll-Einheiten werden so gewählt, dass gilt: !!!!!! ? ? ! ∗? ? !! = ? ? !!, !!! !!! ? ? ! ∗? ? !! = ? ? !", . . . , !!! !!! ? ? ! ∗? ? !!! = ? ? !!!und !!! !!! ? ? ! ∗? ? ! = ? ? ! (3) Es wird in der Schätzung der Gewichte letztlich versucht, eine Balance in den Vor-Treatment-Phasen hinsichtlich des Outcomes ? ? !" und der bekannten Prädiktoren ? ? ! zu erreichen. Abadie et al. (2010, S. 495, 503-504) beweisen ausgehend von dem Faktormodell in Gleichung 1 und 2, dass, wenn die Anzahl an Vor-Treatment-Perioden groß genug ist, der beste Schätzer für den Treatm nt-Effekt ? ? !! ist: ? ? !! = ? ? !! − !!! !!! ? ? ! ∗? ? !" (4) Das Rational hinter dem Beweis von Abadie et al. (2010), dass bei genügend Vor-Treatment-Perioden ein guter Schätzer für den Treatment-Effekt erreicht werden kann, der dem Problem unbeobachteter Einflussfaktoren und der 453 Zabler | Synthetisches Matching als Evaluations-Tool Heterogenität von Effekten begegnen kann, beruht intuitiv betrachtet darauf, dass „only units that are alike in both observed and unobserved determinants of the outcome variable as well as in the effect of those determinants on the outcome variable should produce similar trajecotries of the outcome variable over extended periods of time“ (Abadie et al. 2015, S. 498). Die Bedingungen aus Gleichung 3 zur Wahl der Gewichte sind für die Schätzung zentral. Sie gelten allerdings nur, wenn (? ? !!, . . . ,? ? !!! ,? ? ′!) zur konvexen Hülle von (? ? !",… ,? ? !!! ,? ? ′!), . . . , (? ? !!!!, . . . ,? ? !!!!! ,? ? ′!!!) gehört. Vereinfacht ausgedrückt bedeutet dies, dass die Vor-Treatment-Charakteristika in der Treatment-Einheit und den Kontroll-Einheiten ähnlich sein müssen, um einen sinnvollen synthetischen Match zu erreichen. Die Frage, ob diese Übereinstimmung gegeben ist, kann allerdings schlicht empirisch beantwortet werden und gibt daher direkt Aufschluss über die Eignung der Methode für den jeweils vorliegenden Analysefall. Daher empfehlen Abadie et al. (2010) bei mangelnder Übereinstimmung, den Pool an potentiellen Kontrollfällen von vornherein auf ähnliche Fälle zu beschränken. Aus einer Perspektive von Panel-Regressionsmodellen handelt es sich bei Gleichung 1 um eine generalisierte Form des Difference-in-Difference Schätzers. Der Unterschied zu einem Difference-in-Difference Schätzer besteht darin, dass ? ? ! nicht als konstant angenommen wird und folglich variieren darf. Dementsprechend werden unbeobachtete Konfundierungseffekte nicht durch die Nutzung der Zeitunterschiede eliminiert. Wenn allerdings !!!!!! ? ? ! ∗? ? ! = ? ? !und !!! !!! ? ? ! ∗? ? ! = ? ? ! (5) gilt, dann ist die synthetische Kontroll-Einheit ein unverzerrter Schätzer für ? ? !! !. Zwar kann ? ? !, . . . ,? ? !! nicht beobachtet und damit die synthetische Kontroll- Einheit nicht davon abhängig gemacht werden, unter Standardkonditionen können die Bedingungen für Gleichung 5 allerdings näherungsweise angenommen werden. Zur Schätzung wird ein (? ? !×1) Vektor ? ? = (? ? !, . . . , ? ? !!)′ mit Linearkombinationen der Vor-Treatment-Outcomes gebildet: ? ? ! ? ? = !!!!! ? ? !? ? !". Ausgehend von ? ? solchen Linearkombinationen ? ? !, . . . ,? ? ! ist ? ? ! = (? ? ′!,? ? ! ? ? ! , . . . ,? ? ! ? ? ! ) ein (? ? ×1) Vektor der Vor-Treatment-Eigenschaften für die vom Treatment betroffene Region. Analog dazu ist ? ? ! = (? ? ′! ,? ? ! ? ? ! , . . . ,? ? ! ? ? ! ) eine (? ? ×? ? ) Matrix für die Kontroll-Einheiten. Der bereits zuvor eingeführte Vektor ? ? ∗ soll danach die Distanz ||? ? ! − ? ? !? ? || minimieren. Um die Distanz ermitteln zu können wird ||? ? ! − ? ? !? ? ||? ? = (? ? ! − ? ? !? ? )′? ? ? ? ! − ? ? !? ? genutzt, wobei ? ? als eine (? ? ×? ? ) symmetrische positiv semidefinite Matrix gewählt wird. Die Diagonale der Matrix bildet dabei die relativen Gewichte einzelner bekannter Prädiktoren der Outcome- Variable. Die Matrix, und damit die Gewichte für die Prädiktoren, kann aufgrund von subjektiven Kriterien gewählt werden, kann aber auch – wie bei Abadie und Gardeazabal (2003) – datenbasiert so gewählt werden, dass der Verlauf der Heterogenität von Effekten begegne kann, beruht intuitiv betrachtet dar uf, dass „only units that are alike in both observed and unobserved determinants of the outcome variable as well as in the effect of those determinants on the outcome variable should produce similar trajecotries of the outcome variable over extended periods of time“ (Abadie et al. 2015, S. 498). Die Bedingungen aus Gleichung 3 zur Wahl der Gewichte sind für die Schätzung zentral. Sie gelten allerdings nur, wenn (? ? !!, . . . ,? ? !!! ,? ? ′!) zur konvexen Hülle von (? ? !",… ,? ? !!! ,? ? ′!), . . . , (? ? !!!!, . . . ,? ? !!!!! ,? ? ′!!!) gehört. Vereinfacht ausgedrückt bedeutet dies, dass die Vor-Treatment-Charakteristika in der Treatment-Einheit und den Kontroll-Einheiten ähnlich sein müssen, um einen sinnvollen synthetischen Match zu erreichen. Die Frage, ob diese Übereinstimmung gegeben ist, kann allerdings schlicht empirisch beantwortet werden und gibt daher direkt Aufschluss über die Eignung der Methode für den jeweils vorliegenden Analysefall. Daher empfehlen Abadie et al. (2010) bei mangelnder Übereinstimmung, den Pool an potentiellen Kontrollfällen von vornherein auf ähnliche Fälle zu beschränken. Aus einer Perspektive von Panel-Regressionsmodellen handelt es sich bei Gleichung 1 um eine generalisierte Form des Difference-in-Difference Schätzers. Der Unterschied zu einem Difference-in-Difference Schätzer besteht darin, dass ? ? ! nicht als konstant angenommen wird und folglich variieren darf. Dementsprechend werden unbeobachtete Konfundierungseffekte nicht durch die Nutzung der Zeitunterschiede eliminiert. Wenn allerdings !!!!!! ? ? ! ∗? ? ! = ? ? !und !!! ! ! ? ? ! ∗ ! = ? ? ! (5) gilt, dann ist die synthetische Kontroll-Einheit ein unverzerrter Schätzer für ? ? !! !. Zwar kann ? ? !, . . . ,? ? !! nicht beobachtet und damit die synthetische Kontroll- Einheit nicht davon abhängig gemacht werden, unter Standardkonditionen können die Bedingungen für Gleichung 5 allerdings näherungsweise angenommen werden. Zur Schätzung wird ein (? ? !×1) Vektor ? ? = (? ? !, . . . , ? ? !!)′ mit Linearkombinationen der Vor-Treatment-Outcomes gebildet: ? ? ! ? ? = !!!! ? ? !? ? !". Ausgehend von ? ? solchen Linearkombinationen ? ? !, . . . ,? ? ! ist ? ? ! = (? ? ′!,? ? ! ? ? ! , . . . ,? ? ! ? ? ! ) ein (? ? ×1) Vektor der Vor-Treatment-Eigenschaften für die vom Treatment betroffene Region. Analog dazu ist ? ? ! = (? ? ′! ,? ? ! ? ? ! , . . . ,? ? ! ? ? ! ) eine (? ? ×? ? ) Matrix für die Kontroll-Einheiten. Der bereits zuvor eingeführte Vektor ? ? ∗ soll danach die Distanz ||? ? ! − ? ? !? ? || minimieren. Um die Distanz ermitteln zu können wird ||? ? ! − ? ? !? ? ||? ? = (? ? ! − ? ? !? ? )′? ? ? ? ! − ? ? !? ? genutzt, wobei ? ? als eine (? ? ×? ? ) symmetrische positiv semidefinite Matrix gewählt wird. Die Diagonale der Matrix bildet dabei die relativen Gewichte einzelner bekannter Prädiktoren der Outcome- Variable. Die Matrix, und damit die Gewichte für die Prädiktoren, kann aufgrund von subjektiven Kriterien gewählt werden, kann aber auch – wie bei Abadie und Gardeazabal (2003) – datenbasiert so gewählt werden, dass der Verlauf der 454 PVS, 57. Jg., 3/2016 Abhandlung Outcome-Variable der Treatment-Einheit möglichst gut von der synthetischen Kontroll-Einheit approximiert wird. Dazu wird der Mean Squared Prediction Error (MSPE) der Outcome-Variable in der Vor-Treatment-Phase minimiert. Es zählt bei diesem Verfahren also letztlich die Güte der Vorhersage der Outcome- Variable in Abhängigkeit der in ? ? beobachteten Prädiktoren. Sowohl die Schätzung des Vektors mit den Einheiten-spezifischen Gewichten ? ? als auch der Gewichte für die beobachteten Prädiktoren ? ? können am Ende sichtbar gemacht werden. Bei der Schätzung selbst besteht ein „nested optimization problem“ (Abadie et al. 2011, S. 5), da ? ? und ? ? sowohl für die Minimierung der Distanz ||? ? ! − ? ? !? ? || als auch zur Minimierung des MSPE benötigt werden. Dieses Problem wird durch das von Abadie et al. (2011) geschriebene Programm Synth numerisch gelöst.

Abstract

This paper evaluates the effect of an appointed commissioner for developing consolidation strategies for local public finances. So far, the evaluation concentrates on single-case studies of rare deployments of such a commissioner. The synthetic control approach is employed to expand existing research and to evaluate the causal effect of the commissioner in the city of Hagen in 2008. By using data on predictors of the local financial situation, other cities from North Rhine-Westphalia constitute a synthetic version of Hagen which can impressively reflect its characteristics. The final comparison does not reveal a positive effect of the commissioner on the city’s finances, in contrast to official rhetoric.

Zusammenfassung

Während sich die bisherige Forschung auf Einzelfallstudien stützt, wird in diesem Beitrag die Methode des synthetischen Matching genutzt, um einen quantifizierbaren kausalen Effekt des Einsatzes eines beratenden Sparkommissars 2008 in der Stadt Hagen zu identifizieren und damit ein weitreichendes Instrument kommunaler Finanzaufsicht zu evaluieren. Mithilfe von Daten anderer Kommunen in Nordrhein-Westfalen zu den Bestimmungs- faktoren der kommunalen Haushaltssituation wird ein künstlicher Vergleichsfall erzeugt, der die Charakteristika der Stadt Hagen präzise nachbilden kann. Der abschließende Vergleich zeigt - entgegen der offiziellen Rhetorik - keinen positiven Effekt des beratenden Sparkommissars.

References
Abadie, Alberto, Alexis Diamond, und Jens Hainmueller. 2010. Synthetic Control Methods for Comparative Case Studies: Estimating the Effect of California’s Tobacco Control Program. Journal of the American Statistical Association 105: 493-505. DOI: 10.1198/ jasa.2009.ap08746. https://doi.org/10.1198/jasa.2009.ap08746
Abadie, Alberto, Alexis Diamond, und Jens Hainmueller. 2011. Synth: An R Package for Synthetic Control Methods in Comparative Case Studies. Journal of Statistical Software 42: 1-17. DOI: 10.18637/jss.v042.i13. https://doi.org/10.18637/jss.v042.i13
Abadie, Alberto, Alexis Diamond, und Jens Hainmueller. 2015. Comparative Politics and the Synthetic Control Method. American Journal of Political Science 59: 495-510. DOI: 10.1111/ajps.12116. https://doi.org/10.1111/ajps.12116
Abadie, Alberto, und Javier Gardeazabal. 2003. The Economic Costs of Conflict: A Case Study of the Basque Country. The American Economic Review 93: 113-132. DOI: 10.1257/000282803321455188. https://doi.org/10.1257/000282803321455188
Bajohr, Stefan. 2009. Beratender Sanierungsmanager in einer hoch verschuldeten Kommune: Ein Erfahrungsbericht aus der Stadt Hagen. Verwaltung und Management 15: 171-185. https://doi.org/10.5771/0947-9856-2009-4-171
Banner, Gerhard. 1982. Zur politisch-administrativen Steuerung in der Kommune. Archiv für Kommunalwissenschaften 1: 26-46.
Banner, Gerhard. 1985. Haushaltspolitik und Haushaltskonsolidierung. In Handbuch der kommunalen Wissenschaft und Praxis. Band 6: Kommunale Finanzen, Hrsg. Günter Püttner, 423-440. Berlin/Heidelberg: Springer. DOI: 10.1007/978-3-642-61656-3_21. https://doi.org/10.1007/978-3-642-61656-3_21
Bogumil, Jörg, und Werner Jann. 2009. Verwaltung und Verwaltungswissenschaft in Deutschland. Einführung in die Verwaltungswissenschaft. Wiesbaden: VS Verlag für Sozialwissenschaften. DOI: 10.1007/978-3-531-91341-4. https://doi.org/10.1007/978-3-531-91341-4
Bogumil, Jörg, Lars Holtkamp, Martin Junkernheinrich, und Uwe Wagschal. 2014. Ursachen kommunaler Haushaltsdefizite. Politische Vierteljahresschrift 55: 614-647. DOI: 10.5771/0032-3470-2014-4-614. https://doi.org/10.5771/0032-3470-2014-4-614
Boettcher, Florian. 2012. Kommunale Haushaltsdefizite: Umfang, Ursachen und Lösungsmöglichkeiten. dms – der moderne staat – Zeitschrift für Public Policy, Recht und Management 5: 65-84.
Boettcher, Florian. 2013. Ursachen kommunaler Haushaltsdefizite. Eine finanz­ und politikwissenschaftliche Untersuchung am Beispiel der nordrhein­westfälischen Gemeinden. Dissertation (Technische Universität Kaiserslautern). Münster: LIT Verlag.
Duve, Thomas. 2008. Staatskommissare als Manager kommunaler Haushaltskonsolidierungsprozesse. Verwaltung und Management 14: 283-293. DOI: 10.5771/0947-9856-2008-6-283. https://doi.org/10.5771/0947-9856-2008-6-283
Effer-Uhe, Daniel. 2008. Echter und beratender Sparkommissar im Kommunalrecht der Länder. Zeitschrift für Kommunalfinanzen 58: 25-29.
Frielinghaus, Stefan Niederste. 2007. Die kommunale Insolvenz als Sanierungsansatz für die öffentlichen Finanzen. Stuttgart: Boorberg.
Glöckner, Andreas, und Holger Mühlenkamp. 2009. Die kommunale Finanzkontrolle. Zeitschrift für Planung & Unternehmenssteuerung 19: 397-420. DOI: 10.1007/ s00187-008-0065-0. https://doi.org/10.1007/s00187-008-0065-0
Gröteke, Friedrich, und Karsten Mause. 2009. Die deutsche „Schuldenbremse“: Ein wirksames Instrument zur Vermeidung eines Bailout? Zeitschrift für Wirtschaftspolitik 58: 309-335. DOI: 10.1515/zfwp-2009-0303. https://doi.org/10.1515/zfwp-2009-0303
Herrmann, Karolin. 2012. Kommunale Schattenhaushalte – Versteckte Schulden und Haftungsrisiken. Berlin: Karl-Bräuer-Institut des Bundes der Steuerzahler.
Holland, Paul W. 1986. Statistics and Causal Inference. Journal of the American Statistical Association 81: 945-960. DOI: 10.1080/01621459.1986.10478354. https://doi.org/10.1080/01621459.1986.10478354
Holler, Benjamin. 2012. Liquiditätsverschuldung außer Kontrolle? Kommunale Finanzaufsicht im Ländervergleich. Arbeitspapier 1/2012. Forschung für Kommunen. http://forschung-fuer-kommunen.de/index.php/forschung/66-liquiditaetskredite-ausser-kontrolle. Zugegriffen: 17.06.2016.
Holtkamp, Lars. 2006. Der beratende Sparkommissar gemäß §124 GO NRW. Der Gemeindehaushalt 107: 41-43.
Holtkamp, Lars. 2007. Wer hat Schuld an der Verschuldung? Ursachen nationaler und kommunaler Haushaltsdefizite. Polis 64: 1-32.
Holtkamp, Lars. 2009. Governance-Konzepte in der Haushaltskrise: Eine Analyse am Beispiel der beratenden Sparkommissare. Verwaltung und Management 15: 146-159. DOI: 10.5771/0947-9856-2009-3-146. DOI: 10.5771/0947-9856-2009-3-146. https://doi.org/10.5771/0947-9856-2009-3-146
Holtkamp, Lars. 2010. Kommunale Haushaltspolitik bei leeren Kassen. Bestandsaufnahme, Konsolidierungsstrategien, Handlungsoptionen. Berlin: Ed. Sigma. https://doi.org/10.5771/9783845269634-51
Holtkamp, Lars. 2016. Symbolische Haushaltspolitik: Zum Verhältnis von symbolischer Politik und Haushaltskonsolidierung mit einigen Illustrationen aus NRW. Verwaltung und Management 22: 14-26. DOI: 10.5771/0947-9856-2016-1-14. https://doi.org/10.5771/0947-9856-2016-1-14
King, Gary, Robert Owen Keohane, und Sidney Verba. 1994. Designing social inquiry.
Scientific inference in qualitative research. Princeton: Princeton University Press.
Mill, John Stuart. 1906. A system of logic ratiocinative and inductive. Being a connected view of the principles of evidence and the methods of scientific investigation. New York/London/Bombay: Longmans.
Ministerium für Inneres und Kommunales Nordrhein-Westfalen. 2013. Erster Sparkommissar soll Eifel­Gemeinde Nideggen sanieren. http://www.mik.nrw.de/presse-mediathek/aktuelle-meldungen/archiv/archiv-meldungen-im-detail/news/erster-sparkommissar-soll-eifel-gemeinde-nideggen-sanieren.html. Zugegriffen: 15.07.2015.
Ministerium für Inneres und Kommunales Nordrhein-Westfalen. 2014. Kommunen in Nordrhein­Westfalen in der Haushaltssicherung: Entwicklung 2004 bis 2013. http://www.mik.nrw.de/fileadmin/user_upload/Redakteure/Dokumente/Themen_und_ Aufgaben/Kommunales/kommunale_finanzen/2013-12-31_anzahl_hsk-kommunen_NRW_grafik.pdf. Zugegriffen: 15.07.2015.
Przeworski, Adam, und Henry Teune. 1970. The Logic of Comparative Social Inquiry.
New York: John Wiley & Sons.
Statistisches Bundesamt. 2014. Finanzen und Steuern. Schulden der öffentlichen Haushalte.
Wiesbaden: Statistisches Bundesamt.
Stolzenberg, Philipp, und Hubert Heinelt. 2013. „Die Griechen von NRW“. Kommunale Rettungsschirme der Bundesländer. dms – der moderne staat – Zeitschrift für Public Policy, Recht und Management 6: 463-484.
Timm-Arnold, Klaus-Peter. 2011. Bürgermeister und Parteien in der kommunalen Haushaltspolitik. Endogene Ursachen kommunaler Haushaltsdefizite. Wiesbaden: VS Verlag für Sozialwissenschaften. DOI: 10.1007/978-3-531-92675-9. https://doi.org/10.1007/978-3-531-92675-9
Vogelgesang, Klaus, Uwe Lübking, und Ina-Maria Ulbrich. 2005. Kommunale Selbstverwaltung. Rechtsgrundlagen – Organisation – Aufgaben – neue Steuerungsmodelle. Berlin: Schmidt.
Wagschal, Uwe, und Georg Wenzelburger. 2008. Haushaltskonsolidierung. Wiesbaden: VS Verl. für Sozialwissenschaften.
Zabler, Steffen, Christian Person, und Falk Ebinger. 2016. Finanzaufsicht in den Ländern: Struktur, Recht und ihr (fraglicher) Effekt auf die kommunale Verschuldung. Zeitschrift für Kommunalfinanzen 2016.1: 6-12.

Abstract

Current Research Findings and Controversial Discussions from all areas and sub-areas of Political Science: Politische Vierteljahresschrift (PVS) has been published since 1960 by the executive and advisory board of the German Association for Political Science (DVPW). The journal provides space for recent research findings from all sub-areas of political science. It therefore contains papers on political theory and the history of ideas; on comparative governance and politics; the domains of policy analysis, international relations and foreign policy; on political sociology; and papers in the areas of empirical social research and methodology.

The PVS contains four categories of articles: The critical papers form the core category of the journal. In this section, are published theory-based and methodically reflected articles from all sub-areas of political science.

Within the forum section, contemporary scientific controversies are debated.

The commentaries contain scientifically well-grounded statements with reference to current issues of political developments or to the field of political science.

The review essays provide a broad overview of the international state of the art of political science, as well as current developments and relevant published literature regarding a particular research-field.

The PVS-Literatur publishes reviews of single publications from all sub-fields of the discipline of political sciences, as well as accumulative reviews presenting more than one new publication within an area of political sciences.

Every paper published in the PVS (within the categories critical papers and forum) is run through a double-blind expertise process prior to publication. Generally, two external referees examine the anonymous manuscripts. The referee reports are also made anonymous before being handed back to the authors. Additionally, the authors can be provided with references from the editorial board.

The editors rely on the collaboration of the colleagues in the scientific discipline as their referees and reviewers. Anyone interested in being a referee or reviewer is welcomed to complete and submit the PVS-reviewer-form or referee-form to the editor. Next to your name and address please indicate your field of investigative interest as well. This information will be added to the editorial database.

Website: www.pvs.nomos.de

Zusammenfassung

Aktuelle Forschungsergebnisse und kontroverse Diskussionen aus allen Teilbereichen der Politikwissenschaft: Die Zeitschrift bietet Raum für neueste Forschungsergebnisse aus allen Teildisziplinen der Politikwissenschaft. Sie beinhaltet somit Beiträge aus der Politischen Theorie und Ideengeschichte, aus dem Bereich Analyse und Vergleich politischer Systeme, aus der Policy-Analyse, aus dem Bereich der Internationalen Beziehungen und der Außenpolitik, aus der empirischen Sozialforschung und Methodenlehre sowie aus der Politischen Soziologie.

Die PVS umfasst vier Kategorien von Beiträgen: Die Abhandlungen stellen den Kern der Zeitschrift dar. In dieser Rubrik werden theoriegeleitete, methodisch reflektierte Forschungsbeiträge aus allen Bereichen der Politikwissenschaft veröffentlicht. Im Forum sollen wissenschaftliche Kontroversen angestoßen oder ausgetragen werden. Die Kommentare beinhalten wissenschaftlich fundierte Stellungnahmen zu Problemen der politischen Entwicklung oder des Faches „Politikwissenschaft“. Mit den Literaturberichten wird ein breiter Überblick über den internationalen Forschungsstand, über aktuelle Entwicklungen und die hierzu erschienene Literatur in einem bestimmten Forschungsfeld gegeben.

Homepage: www.pvs.nomos.de