Content

Peter Paic, Entwicklung und Aufbau des SOEP in:

Peter Paic

Gründungsaktivität und Gründungserfolg von Freiberuflern, page 141 - 149

Eine empirische Mikroanalyse mit dem Sozio-ökonomischen Panel

1. Edition 2009, ISBN print: 978-3-8329-4112-3, ISBN online: 978-3-8452-1348-4 https://doi.org/10.5771/9783845213484

Series: FFB - Schriften des Forschungsinstituts Freie Berufe der Leuphana Universität Lüneburg, vol. 17

Bibliographic information
4. Das Sozio-ökonomische Panel (SOEP) Freiberufliche Tätigkeiten im Mittelalter: Künstlerische Darstellung der Logik oder Dialektik Das Sozio-ökonomische Panel (SOEP) 143 Für die Untersuchung des freiberuflichen Gründungsgeschehens wird das SOEP als eine von zwei Datenbasen im Rahmen der empirischen Untersuchung verwendet. Im folgenden Kapitel wird kurz auf die Entstehung und Zielsetzung des SOEP-Datensatzes sowie den Vor- und Nachteilen von Paneldatenbasen eingegangen. Dem schließt sich der Aufbau und die Entwicklung sowie die geeignete Auswahl der verwendeten Panelstruktur an, bevor speziell die Freien Berufe im SOEP behandelt werden. Einen Schwerpunkt dieses Kapitels und der Arbeit bildet der Abschnitt zur Berichtigung des SOEP-Datensatzes. Nach ersten Anzeichen fehlerhafter Angaben im SOEP zur beruflichen Tätigkeit der Selbständigen (vgl. Merz und Paic, 2003) wurde erstmals eine umfassende Überprüfung der Befragten freiberuflich Tätigen Personen durchgeführt. Aus den Erkenntnissen der Überprüfung wurden Kriterien zur Berichtigung des Datensatzes entwickelt und umgesetzt. Dieser Teil der Arbeit zählt zu den genuinen Beiträgen dieser Arbeit und wird daher ausführlich von der Problemstellung über die Kriterien und das Ergebnis bis zu einem konkreten Vorschlag für die zukünftige Fragestellung des SOEP zur Selbständigengruppe dargestellt. Im Anschluss daran werden mit den berichtigten SOEP-Daten die deskriptiven Auswertungen der Freien Berufe in der Bundesrepublik Deutschland als ein Ziel des praktischen Erkenntnisgewinns vorgestellt. Die Untersuchungsmodelle zur freiberuflichen Gründungsaktivität und dem Gründungserfolg auf Grundlage des berichtigten SOEP-Datensatzes stellen neben der FFB-Onlineumfrage den empirischen Hauptteil dieser Untersuchung dar. In beiden Modellen wird zunächst die Konstruktion der abhängigen Variablen und anschließend die deskriptiven Ergebnisse der Auswertung vorgestellt. In den multivariaten Teilen der Untersuchung werden die Modelle sowie die angewendeten statistischen Auswertungsverfahren erläutert. Dem folgt die Darstellung der multivariaten Analysen zur Gründungsaktivität und dem Gründungserfolg. Aufgrund der Datenstruktur wird im Modell zur Gründungsaktivität die Möglichkeit genutzt Längsschnittanalysen anzuwenden. Hypothesentests und ein Zwischenfazit schließen die Kapitel der beiden Untersuchungsmodelle ab. 4.1 Das SOEP-Panel als Datenbasis Das Sozio-ökonomische Panel (SOEP) ist ein Mikrodatensatz, welcher durch repräsentative Wiederholungsbefragung privater Haushalte in Deutschland entstanden ist und vom Deutschen Institut für Wirtschaftsforschung (DIW) bereitgestellt wird. Es handelt sich dabei um Mikrodaten, die seit 1984 im jährlichen Rhythmus durch Befragungen derselben Personen und Familien in der Bundesrepublik generiert werden. Seit dem Jahr 1990 wurde die Studie auf das Gebiet der ehemaligen DDR ausgeweitet (SOEP-Gruppe 2003a). Mit Hilfe des SOEP können politische und gesellschaftliche Veränderungen beobachtet und analysiert werden, denn der Datensatz gibt Auskunft über objektive Lebensbedingungen und über die subjektiv wahrgenommene Lebensqualität. 144 Das Sozio-ökonomische Panel (SOEP) Da immer dieselben Personen und Familien mit denselben Fragen im gleichen zeitlichen Rhythmus befragt werden, gewährleistet das SOEP repräsentative Daten über die bundesdeutsche Bevölkerung. Die Stärken des SOEP bestehen vor allem in seinen besonderen Analysemöglichkeiten, wie z.B. dem Längsschnittdesign (Panelcharakter). Das bedeutet, es ist möglich die gleichen Personen über einen längeren Zeitraum zu beobachten und aufgrund der Ergebnisse der Befragung, Rückschlüsse auf die gesellschaftliche, politische und/oder wirtschaftliche Situation zu ziehen (SOEP-Gruppe 2003a). Das SOEP ist in der Lage, ein sehr breites Themenspektrum abzudecken. Dafür liefert es kontinuierlich Informationen u.a. über: - Haushaltszusammensetzung; Wohnsituation, - Erwerbs- und Familienbiografien, - Erwerbsbeteiligung und berufliche Mobilität, - Einkommensverläufe, - Gesundheit, - Lebenszufriedenheit und gesellschaftliche Partizipation (SOEP-Gruppe 2003a). Darüber hinaus existieren jährlich wechselnde Schwerpunktthemen über die ebenfalls Informationen bereitgestellt werden: Familie und soziale Dienste, Zeitverwendung, Weiterbildung und Qualifikation sowie soziale Sicherung (SOEP- Gruppe 2003a). Die Vorzüge einer Panelerhebung und die des SOEP-Panels im Speziellen, liegen nicht nur in der wiederholten Befragung der Personen und Haushalte zu denen kontinuierlich Informationen gesammelt und hochgerechnet werden können, auch die daraus resultierende Aufbereitung der Daten hat erhebliche Vorteile. Hsiao (2003) fast die Vorteile wie folgt zusammen: „Panel data sets for economic research possess several major advantages over conventional cross-sectional or time-series data sets. Panel data usually give the researcher a large number of data points, increasing the degrees of freedom and reducing the collinearity among explanatory variables hence improving the efficiency of econometric estimates. More importantly, longitudinal data allow the researcher to analyse a number of important economic questions that cannot be addressed using cross-sectional or time-series data sets” (Hsiao 2003, 3). Explizit ausgeführt sind es vier Vorteile, die Hsiao herausstellt: - Ansteigende Freiheitsgrade und geringere Probleme mit Multikolliearität von Daten. - Identifikation von ökonomischen Modellen und Unterscheidung von konkurrienden Modellen. Das Sozio-ökonomische Panel (SOEP) 145 - Beseitigung oder Verringerung einer Verzerrung der Schätzung. - Bereitstellen von mikroökonomischen Grundlagen für aggregierte Datenanalyse (Hsiao 2003, 311). Vor dem Hintergrund der bereits benannten Mängel bisheriger empirischer Arbeiten hinsichtlich der verwendeten Datenbasen und angewendeten Auswertungsmethoden (vgl. Kapitel 3), kann das SOEP als Datengrundlage für die Gründungsforschung mit seinen vielfältigen Möglichkeiten statistischer Auswertungsverfahren auch in methodischer Hinsicht überzeugen. Hier bietet das SOEP den Vorteil einer repräsentativen Datenbasis mit der Möglichkeit multivariate Analysen durchzuführen. Für die zugrunde liegende Fragestellung und Auswahl des SOEP als Datenbasis ist ebenso von Bedeutung, dass in den jährlichen Erhebungen speziell Daten zur Gruppe der Freien Berufe erhoben werden. Trotz der großen Aussagekraft unterliegen Panels, wie die meisten dieser Befragungen, Problemen, die den Nutzen nicht unwesentlich beeinträchtigen. Dazu gehören z.B. die Validität, die Messprobleme wie u.a. das Adäquationsproblem (Umsetzung idealtypischer Konstrukte in statistische Erhebungen), Infrastrukturprobleme, die Panelmortalität, aber auch allgemeinere Erhebungsprobleme sowie die erhöhte Komplexität der Daten. Im Rahmen dieser Untersuchung ist es nicht möglich alle Problemfelder eingehend zu behandeln8. Zur besseren Bewertung der späteren Analysen ist es jedoch notwendig auf die zentralen Probleme näher einzugehen. Hier soll zunächst allgemein auf die Problematik der Mortalität von Panels eingegangen werden, der konkrete Bezug zum SOEP wird im folgenden Kapitel zur Struktur und dem Aufbau des SOEP hergestellt. Bei der Panelmortalität (in der englischsprachigen Literatur wird auch der Ausdruck „Panel Attrition“ verwendet) handelt es sich um sukzessive Ausfälle von Respondenten durch z.B. Antwortverweigerung der Haushalte oder Personen unter Angabe bestimmter Gründe oder Kontaktverlust. Dies führt bei einem Großteil der Erhebungen zu einer bedeutenden Verkleinerung der Stichprobe. Dieser Effekt kann die aus dem Panel gewonnenen Ergebnisse stark verzerren, insbesondere wenn diese Ausfälle nicht zufällig zustande gekommen sind, sondern selbst eine Funktion der Welle derjenigen Variablen sind, in denen sie auftreten (vgl. Engel und Reinecke 1994, 10). Panelattrition sind sogenannte „nonsampling errors“ (im Gegensatz dazu sind „sampling errors“ Fehler bei der Auswahl der Stichprobe), die beim Prozess der Datenerhebung entstehen können. Hier werden verschiedene Arten von Fehlern unterschieden. Neben den Fehlern bei der Messung und bei der Dateneingabe liegt das Augenmerk bei den „nonoberservation errors“. Dies sind fehlende Beobachtungen, die durch Abwesenheit (noncoverage error) oder Verweigerung (nonresponse error) zustande kommen. Von besonderem Interesse sind bei der 8 Weiterführende Literatur zu diesem Problemfeld findet sich bei Bömermann und Hauswirth 2002; Wagner 1997; Engel und Reinke 1994 oder Grohmann 1985. 146 Das Sozio-ökonomische Panel (SOEP) Panelmortalität die zeitweiligen (temporary unit nonresponse) oder kompletten Ausfälle für den gesamten weiteren Untersuchungszeitraum (permanent unit nonresponse) ganzer Untersuchungseinheiten (durch Verweigerung). Typische Beispiele hierfür sind Firmen, die in Konkurs gehen, Antwortverweigerungen oder unvorhersehbare Interviewabbrüche (vgl. Lechner 1995, 12). Die erhebungsbedingten Ausfälle durch Antwortverweigerung oder Kontaktverlust führen bei den meisten Erhebungen zu einer bedeutenden Verkleinerung der Stichprobe. Problematisch ist hierbei nicht nur die Verringerung des Stichprobenbestands, sondern die Gefahr, dass die Ausfälle hinsichtlich interessierender Merkmale nicht ignorierbar sind. Darüber hinaus können speziell bei Haushaltsund Firmenpanelerhebungen Probleme durch Fusionen entstehen. Im Falle von Firmenpanels treten Fusionen bei der Übernahme von Panelfirmen durch andere Firmen auf. Die Angliederung von Teilen einer Panelfirma in eine andere Firma ist ebenfalls eine stichprobenrelevante Fusion. Dabei stellt sich das Problem der nötigen Transparenz und letztlich die für die Stichprobe notwendige Gewichtung bei einer Angliederung von Firmenanteilen (vgl. Rendtel 1997, 35). Das SOEP selbst ist nicht als Firmenpanel, sondern als Haushaltspanel konzipiert. Befragt werden im SOEP alle Personen, die 16 Jahre oder älter sind, in den Haushalten der Stichprobe. Dabei werden nachwachsende Kinder als auch Personen, die einen Befragungshaushalt verlassen, weiter in die Befragung mit einbezogen. Die Erfassung einer selbständigen Tätigkeit erfolgt über die Angaben der befragten Personen zu ihrer beruflichen Stellung (SOEP-Gruppe 2003a). Insgesamt zeigt sich das SOEP, mit seiner großen Stichprobe und den detaillierten Befragungen zu den verschiedensten Themenbereichen, als eine flexible Datenbank mit hoher repräsentativer Eigenschaft. Dabei erfüllt das SOEP zwei Grundvoraussetzungen, um es als Datenbasis für die Untersuchung des freiberuflichen Gründungsgeschehens zu verwenden. Zum einen berücksichtigt es speziell die Selbständigengruppe der Freien Berufe bei der Erhebung und zum anderen bietet das SOEP methodische Vorteile für die Analyse der Freien Berufe durch seine Panelstruktur gegenüber anderen Querschnitts- und Zeitreihendaten (vgl. Kap. 2). Um das SOEP eingehender auf das zentrale Problem der Panelmortalität zu überprüfen, ist es notwendig den Aufbau und die Entwicklung der Stichproben genauer zu betrachten. Dazu gehört auch die richtige Auswahl aus den verschiedenen strukturbezogenen Möglichkeiten der Datengenerierung. 4.1.1 Entwicklung und Aufbau des SOEP Obwohl sich das SOEP gegenüber den Befragten und Anwendern unter dem einheitlichen Label „Leben in Deutschland“ präsentiert, besteht das SOEP aus einem komplexen Befragungssystem, dessen Datenbestand sich aus mehreren Teilstichproben zusammensetzt. So besteht das SOEP im Jahr 2002 aus sieben Das Sozio-ökonomische Panel (SOEP) 147 verschiedenen Teilstichproben, die zu unterschiedlichen Startzeitpunkten in das Haushaltspanel integriert wurden (SOEP-Gruppe 2003a; 2002b). Die ältesten Teilstichproben A. und B. befinden sich bereits in der 19. jährlichen Wiederholungsbefragung (Welle). Zu Beginn der SOEP-Umfrage 1984 beteiligten sich 5.921 Haushalte mit 12.290 Personen ab dem 16 Lebensjahr in Westdeutschland (Stichproben A. Deutsche West und Stichprobe B. Ausländer). Eine dritte Teilstichprobe folgte 1990 auf dem Gebiet der ehemaligen DDR. Im Zuge der Deutschen Einheit wurden erstmalig 2.179 Haushalte mit 4.453 Personen in Ostdeutschland befragt (Stichprobe C. Deutsche Ost). Im Jahr 1995 folgte eine weitere Teilstichprobe zum Schwerpunkt „Zuwanderung“ mit 522 Haushalte und 1.078 Personen (Stichprobe D. Zuwanderung). Die fünfte Teilstichprobe zur Auffrischung des Panels fand 1998 in 1.067 Haushalten mit 1.932 Personen statt (Stichprobe E. Erweiterung). Um auf Basis einer großen Fallzahl genauere Analysen kleinerer Teilgruppen der Bevölkerung zu ermöglichen, wurde 2000 eine weitere Teilstichprobe eingeführt, diese umfasste zum Start 6.052 Haushalte mit 10.886 Personen (Stichprobe F. Erweiterung). Die siebte und derzeit letzte Teilstichprobe fand im Jahr 2002 statt. Mit dem thematischen Schwerpunkt auf „hohe Einkommen“ wurden 1.224 Haushalte mit 2.671 Personen befragt (SOEP- Gruppe 2003a; 2003b und 2002b). Die Abbildung 10 zeigt die jährliche Brutto-Entwicklung sämtlicher Stichproben auf der Personenebene für den Beobachtungszeitraum von 1992 bis 2002. Abbildung 10: Brutto-Entwicklung der jährlichen SOEP Stichproben auf Personenebene von 1992 bis 2002 0 5000 10000 15000 20000 25000 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 G. F. E. D. C. B. A. Quelle: Eigene Abbildung in Anlehnung an SOEP-Gruppe 2003b und 2002a. * A. Deutsche West; B. Ausländer; C. Deutsche Ost; D. Zuwanderer; E. Querschnitt; F. Querschnitt; G. Hohe Einkommen. 148 Das Sozio-ökonomische Panel (SOEP) Betrachtet man die Entwicklung der ersten drei erhobenen Teilstichproben (A- C) wird die hohe Kontinuität und geringe Abbruchrate der befragten Teilnehmer deutlich. So sind von den erstmalig 1984 Befragten 12.290 Personen im Jahr 2002 - also nach 19 Jahren! - noch über 6.000 Befragungsteilnehmer der ersten Stunde dabei (vgl. Abb. 10.). Diese Zahlen belegen eindrucksvoll die geringe Panelmortalität des SOEP. Mit den Erweiterungsstichproben E. und F. sowie der Teilstichprobe G. stehen im Jahr 2002 Informationen über 23.892 befragte Personen zur Verfügung (SOEP-Gruppe 2003a; 2003b und 2002b). Zur Generierung eines für die Untersuchungsfragen geeigneten Datensatzes bietet das SOEP im Internet (http:www.diw.de/soepinfo) zwei Alternativen an. Zur Auswahl steht die Generierung eines „balanced“ Datensatzes oder eines „unbalanced“ Datensatzes. Vorteil des „balanced“ Datensatzes ist es, die durchgängig im SOEP erfassten Personen einheitlich über den Beobachtungszeitraum in ihren Bruttoveränderungen zu untersuchen. Da beim „balanced“ Datensatz die mit den Erweiterungsstichproben neu befragten Personen außen vor bleiben, ist die Gruppe der Freien Berufe über einen länger anhaltenden Beobachtungshorizont in der Stichprobe äußerst gering (vgl. Koch 2003). Die Abbildung 11 zeigt den strukturellen Aufbau eines „balanced“ und eines „unbalanced“ Datensatzes. Abbildung 11: Übersicht „balanced“ und „unbalanced“ Panel Struktur Universe of SOEP Population „Net“ Population (longitudinal) = balanced panel design „Net“ Population (longitudinal) = unbalanced panel design Meta Data Wave1 Wave 2 Wave 3 „filled gap“ Cross-sectional Population Quelle: Eigene Abbildung. In Anlehnung an SOEP-Gruppe 2003a und 2003b. Mit der Verwendung eines „unbalanced“ Datensatz kann der Vorteil genutzt werden, die in den Erweiterungsstichproben 1995, 1998, 2000 und 2002 stärker ansteigende Zahl der Freien Berufe im SOEP zu berücksichtigen. Dieser Aspekt Meta Data Wave1 Wave 2 Wave 3 „filled gap“ Das Sozio-ökonomische Panel (SOEP) 149 ist im Rahmen der Aufgabestellung umso bedeutender, da durch die Fokussierung auf die freiberuflichen Gründungen die Fallzahlen relativ gering sind. Ein genereller Vorteil des SOEP-Datensatzes ist die Vermeidung der „Survivor- Problematik“ (vgl. Kapitel 3). Freiberufler, die nur über eine kurze Zeit freiberuflich tätig waren und danach aus dieser Tätigkeit ausscheiden, fallen nicht aus der Stichprobe heraus, da sie weiterhin befragt werden. Daher können retrospektiv, im Gegensatz zu den meisten Untersuchungen zum Gründungsgeschehen (vgl. Brüderl, Preisendörfer und Ziegler 1996, 17), neben den erfolgreichen Gründungen auch die Aufgaben berücksichtigt werden. Allerdings werden beim „balanced“ Datensatz nur die Personen berücksichtigt, welche über den kompletten Beobachtungszeitraum von elf Jahren an der Befragung teilgenommen haben. Scheidet eine Person aus der Befragung während des Beobachtungszeitraumes von elf Jahren aus, wird sie im „balanced“ Datensatz nicht berücksichtigt. Dagegen bleiben die Informationen der aus der Befragung ausgeschiedenen Personen im „unbalanced“ Datensatz erhalten. Dadurch ist es mit dem „unbalanced“ Datensatz retrospektiv möglich, ein relativ konkretes Bild über den Erfolg der freiberuflichen Personen zu gewinnen, da auch die Informationen der aus der Befragung ausgeschiedenen Personen erhalten bleiben. Aufgrund der zu erwartenden höheren Fallzahlen sowie der methodischen Vorteile wird für die Untersuchung des freiberuflichen Gründungsgeschehens ein „unbalanced“ Datensatz verwendet. Der folgende Abschnitt beschäftigt sich eingehend mit der Erfassung und den Fallzahlen der Freien Berufe im SOEP. 4.1.2 Die Freien Berufe im SOEP-Panel Das SOEP unterscheidet seit dem Beginn seiner jährlichen Umfragen im Jahr 1984 die Gruppe der Selbständigen in vier verschiedene Kategorien. Dies sind die Landwirte, die Freien Berufe, die sonstigen Selbständigen und die mithelfenden Familienangehörigen. Zwischen 1992 und 1999 wurden die Kategorien in folgende Unterkategorien aufgeteilt: Landwirte [1], Freie Berufe [2], sonstige Selbständige mit <9 Mitarbeiter [3]), sonstige Selbständige mit >9 Mitarbeiter [4] und mithelfende Familienangehörige [5] (SOEP 1992-1999). Mit der Erweiterungsstichprobe F im Jahr 2000 wurden die Unterkategorien der Variable „Derzeitige Stellung Selbständige“ um die Unterkategorie „Selbständige ohne Mitarbeiter“ erweitert. Die neue Unterteilung hat seit dem Jahr 2000 nun folgendes Bild: Landwirte [1], Freie Berufe [2], sonstige Selbständige ohne Mitarbeiter [3], sonstige Selbständige mit <9 Mitarbeitern [4], Selbständige mit >9 Mitarbeitern [5] und mithelfende Familienangehörige [6] (SOEP 2000-2002). Wie in der neuen Unterteilung nach Mitarbeitern bei den sonstigen Selbständigen werden seit dem Jahr 2000 auch die Zahl der Mitarbeiter bei den Freien Berufen in den drei Unterkategorien „ohne Mitarbeiter“, „mit <9 Mitarbeiter“ und „>9 Mitarbeiter erfasst und in einer gesonderten Variable im SOEP zur Verfügung gestellt (SOEP 2000-2002).

Chapter Preview

References

Zusammenfassung

Die Arbeit verfolgt die theoretische, methodische und empirisch fundierte Analyse des freiberuflichen Gründungsgeschehens. Um die Fragestellung “Welche Determinanten beeinflussen die Gründungsaktivität und den Gründungserfolg von Freiberuflern?“ wird das Spektrum über die Phasen vor der Gründung bis zur Etablierung der freiberuflichen Tätigkeit am Markt erfasst.

Auf Grundlage des SOEP-Panels und einer Onlineerhebung tragen die Ergebnisse zu einem Erkenntnisgewinn des freiberuflichen Gründungsgeschehens bei. Gewürdigt wird dabei insbesondere die Praxis mit vielen neuen Ergebnissen aus den empirisch neu gewonnenen Daten zum Gründungsgeschehen der Freien Berufe.

Dr. Peter Paic studierte BWL und Ökonomie in Hamburg. 2008 Promotion an der Leuphana Universität Lüneburg. Zurzeit ist er Referent im Landesamt für Datenverarbeitung und Statistik (LDS NRW) in Düsseldorf.