4. Das Sozio-ökonomische Panel (SOEP)
Freiberufliche Tätigkeiten im Mittelalter:
Künstlerische Darstellung der Logik oder
Dialektik
Das Sozio-ökonomische Panel (SOEP) 143
Für die Untersuchung des freiberuflichen Gründungsgeschehens wird das SOEP
als eine von zwei Datenbasen im Rahmen der empirischen Untersuchung verwendet. Im folgenden Kapitel wird kurz auf die Entstehung und Zielsetzung des
SOEP-Datensatzes sowie den Vor- und Nachteilen von Paneldatenbasen eingegangen. Dem schließt sich der Aufbau und die Entwicklung sowie die geeignete
Auswahl der verwendeten Panelstruktur an, bevor speziell die Freien Berufe im
SOEP behandelt werden. Einen Schwerpunkt dieses Kapitels und der Arbeit bildet der Abschnitt zur Berichtigung des SOEP-Datensatzes. Nach ersten Anzeichen fehlerhafter Angaben im SOEP zur beruflichen Tätigkeit der Selbständigen
(vgl. Merz und Paic, 2003) wurde erstmals eine umfassende Überprüfung der
Befragten freiberuflich Tätigen Personen durchgeführt. Aus den Erkenntnissen
der Überprüfung wurden Kriterien zur Berichtigung des Datensatzes entwickelt
und umgesetzt. Dieser Teil der Arbeit zählt zu den genuinen Beiträgen dieser
Arbeit und wird daher ausführlich von der Problemstellung über die Kriterien
und das Ergebnis bis zu einem konkreten Vorschlag für die zukünftige Fragestellung des SOEP zur Selbständigengruppe dargestellt. Im Anschluss daran
werden mit den berichtigten SOEP-Daten die deskriptiven Auswertungen der
Freien Berufe in der Bundesrepublik Deutschland als ein Ziel des praktischen
Erkenntnisgewinns vorgestellt.
Die Untersuchungsmodelle zur freiberuflichen Gründungsaktivität und dem
Gründungserfolg auf Grundlage des berichtigten SOEP-Datensatzes stellen neben der FFB-Onlineumfrage den empirischen Hauptteil dieser Untersuchung
dar. In beiden Modellen wird zunächst die Konstruktion der abhängigen Variablen und anschließend die deskriptiven Ergebnisse der Auswertung vorgestellt. In
den multivariaten Teilen der Untersuchung werden die Modelle sowie die angewendeten statistischen Auswertungsverfahren erläutert. Dem folgt die Darstellung der multivariaten Analysen zur Gründungsaktivität und dem Gründungserfolg. Aufgrund der Datenstruktur wird im Modell zur Gründungsaktivität die
Möglichkeit genutzt Längsschnittanalysen anzuwenden. Hypothesentests und
ein Zwischenfazit schließen die Kapitel der beiden Untersuchungsmodelle ab.
4.1 Das SOEP-Panel als Datenbasis
Das Sozio-ökonomische Panel (SOEP) ist ein Mikrodatensatz, welcher durch
repräsentative Wiederholungsbefragung privater Haushalte in Deutschland entstanden ist und vom Deutschen Institut für Wirtschaftsforschung (DIW) bereitgestellt wird. Es handelt sich dabei um Mikrodaten, die seit 1984 im jährlichen
Rhythmus durch Befragungen derselben Personen und Familien in der Bundesrepublik generiert werden. Seit dem Jahr 1990 wurde die Studie auf das Gebiet
der ehemaligen DDR ausgeweitet (SOEP-Gruppe 2003a).
Mit Hilfe des SOEP können politische und gesellschaftliche Veränderungen beobachtet und analysiert werden, denn der Datensatz gibt Auskunft über objektive Lebensbedingungen und über die subjektiv wahrgenommene Lebensqualität.
144 Das Sozio-ökonomische Panel (SOEP)
Da immer dieselben Personen und Familien mit denselben Fragen im gleichen
zeitlichen Rhythmus befragt werden, gewährleistet das SOEP repräsentative Daten über die bundesdeutsche Bevölkerung. Die Stärken des SOEP bestehen vor
allem in seinen besonderen Analysemöglichkeiten, wie z.B. dem Längsschnittdesign (Panelcharakter). Das bedeutet, es ist möglich die gleichen Personen über
einen längeren Zeitraum zu beobachten und aufgrund der Ergebnisse der Befragung, Rückschlüsse auf die gesellschaftliche, politische und/oder wirtschaftliche
Situation zu ziehen (SOEP-Gruppe 2003a).
Das SOEP ist in der Lage, ein sehr breites Themenspektrum abzudecken. Dafür
liefert es kontinuierlich Informationen u.a. über:
- Haushaltszusammensetzung; Wohnsituation,
- Erwerbs- und Familienbiografien,
- Erwerbsbeteiligung und berufliche Mobilität,
- Einkommensverläufe,
- Gesundheit,
- Lebenszufriedenheit und gesellschaftliche Partizipation (SOEP-Gruppe
2003a).
Darüber hinaus existieren jährlich wechselnde Schwerpunktthemen über die
ebenfalls Informationen bereitgestellt werden: Familie und soziale Dienste, Zeitverwendung, Weiterbildung und Qualifikation sowie soziale Sicherung (SOEP-
Gruppe 2003a).
Die Vorzüge einer Panelerhebung und die des SOEP-Panels im Speziellen,
liegen nicht nur in der wiederholten Befragung der Personen und Haushalte zu
denen kontinuierlich Informationen gesammelt und hochgerechnet werden können, auch die daraus resultierende Aufbereitung der Daten hat erhebliche Vorteile. Hsiao (2003) fast die Vorteile wie folgt zusammen:
„Panel data sets for economic research possess several major advantages over conventional cross-sectional or time-series data sets. Panel
data usually give the researcher a large number of data points, increasing the degrees of freedom and reducing the collinearity among explanatory variables hence improving the efficiency of econometric estimates.
More importantly, longitudinal data allow the researcher to analyse a
number of important economic questions that cannot be addressed using
cross-sectional or time-series data sets” (Hsiao 2003, 3).
Explizit ausgeführt sind es vier Vorteile, die Hsiao herausstellt:
- Ansteigende Freiheitsgrade und geringere Probleme mit Multikolliearität von Daten.
- Identifikation von ökonomischen Modellen und Unterscheidung von
konkurrienden Modellen.
Das Sozio-ökonomische Panel (SOEP) 145
- Beseitigung oder Verringerung einer Verzerrung der Schätzung.
- Bereitstellen von mikroökonomischen Grundlagen für aggregierte
Datenanalyse (Hsiao 2003, 311).
Vor dem Hintergrund der bereits benannten Mängel bisheriger empirischer
Arbeiten hinsichtlich der verwendeten Datenbasen und angewendeten Auswertungsmethoden (vgl. Kapitel 3), kann das SOEP als Datengrundlage für die
Gründungsforschung mit seinen vielfältigen Möglichkeiten statistischer Auswertungsverfahren auch in methodischer Hinsicht überzeugen. Hier bietet das SOEP
den Vorteil einer repräsentativen Datenbasis mit der Möglichkeit multivariate
Analysen durchzuführen. Für die zugrunde liegende Fragestellung und Auswahl
des SOEP als Datenbasis ist ebenso von Bedeutung, dass in den jährlichen
Erhebungen speziell Daten zur Gruppe der Freien Berufe erhoben werden.
Trotz der großen Aussagekraft unterliegen Panels, wie die meisten dieser Befragungen, Problemen, die den Nutzen nicht unwesentlich beeinträchtigen. Dazu
gehören z.B. die Validität, die Messprobleme wie u.a. das Adäquationsproblem
(Umsetzung idealtypischer Konstrukte in statistische Erhebungen), Infrastrukturprobleme, die Panelmortalität, aber auch allgemeinere Erhebungsprobleme
sowie die erhöhte Komplexität der Daten. Im Rahmen dieser Untersuchung ist
es nicht möglich alle Problemfelder eingehend zu behandeln8. Zur besseren Bewertung der späteren Analysen ist es jedoch notwendig auf die zentralen Probleme näher einzugehen. Hier soll zunächst allgemein auf die Problematik der
Mortalität von Panels eingegangen werden, der konkrete Bezug zum SOEP wird
im folgenden Kapitel zur Struktur und dem Aufbau des SOEP hergestellt.
Bei der Panelmortalität (in der englischsprachigen Literatur wird auch der Ausdruck „Panel Attrition“ verwendet) handelt es sich um sukzessive Ausfälle von
Respondenten durch z.B. Antwortverweigerung der Haushalte oder Personen
unter Angabe bestimmter Gründe oder Kontaktverlust. Dies führt bei einem
Großteil der Erhebungen zu einer bedeutenden Verkleinerung der Stichprobe.
Dieser Effekt kann die aus dem Panel gewonnenen Ergebnisse stark verzerren,
insbesondere wenn diese Ausfälle nicht zufällig zustande gekommen sind, sondern selbst eine Funktion der Welle derjenigen Variablen sind, in denen sie auftreten (vgl. Engel und Reinecke 1994, 10).
Panelattrition sind sogenannte „nonsampling errors“ (im Gegensatz dazu sind
„sampling errors“ Fehler bei der Auswahl der Stichprobe), die beim Prozess der
Datenerhebung entstehen können. Hier werden verschiedene Arten von Fehlern
unterschieden. Neben den Fehlern bei der Messung und bei der Dateneingabe
liegt das Augenmerk bei den „nonoberservation errors“. Dies sind fehlende Beobachtungen, die durch Abwesenheit (noncoverage error) oder Verweigerung
(nonresponse error) zustande kommen. Von besonderem Interesse sind bei der
8
Weiterführende Literatur zu diesem Problemfeld findet sich bei Bömermann und Hauswirth
2002; Wagner 1997; Engel und Reinke 1994 oder Grohmann 1985.
146 Das Sozio-ökonomische Panel (SOEP)
Panelmortalität die zeitweiligen (temporary unit nonresponse) oder kompletten
Ausfälle für den gesamten weiteren Untersuchungszeitraum (permanent unit
nonresponse) ganzer Untersuchungseinheiten (durch Verweigerung). Typische
Beispiele hierfür sind Firmen, die in Konkurs gehen, Antwortverweigerungen
oder unvorhersehbare Interviewabbrüche (vgl. Lechner 1995, 12).
Die erhebungsbedingten Ausfälle durch Antwortverweigerung oder Kontaktverlust führen bei den meisten Erhebungen zu einer bedeutenden Verkleinerung der
Stichprobe. Problematisch ist hierbei nicht nur die Verringerung des Stichprobenbestands, sondern die Gefahr, dass die Ausfälle hinsichtlich interessierender
Merkmale nicht ignorierbar sind. Darüber hinaus können speziell bei Haushaltsund Firmenpanelerhebungen Probleme durch Fusionen entstehen. Im Falle von
Firmenpanels treten Fusionen bei der Übernahme von Panelfirmen durch andere
Firmen auf. Die Angliederung von Teilen einer Panelfirma in eine andere Firma
ist ebenfalls eine stichprobenrelevante Fusion. Dabei stellt sich das Problem der
nötigen Transparenz und letztlich die für die Stichprobe notwendige Gewichtung bei einer Angliederung von Firmenanteilen (vgl. Rendtel 1997, 35).
Das SOEP selbst ist nicht als Firmenpanel, sondern als Haushaltspanel konzipiert. Befragt werden im SOEP alle Personen, die 16 Jahre oder älter sind, in
den Haushalten der Stichprobe. Dabei werden nachwachsende Kinder als auch
Personen, die einen Befragungshaushalt verlassen, weiter in die Befragung mit
einbezogen. Die Erfassung einer selbständigen Tätigkeit erfolgt über die Angaben der befragten Personen zu ihrer beruflichen Stellung (SOEP-Gruppe 2003a).
Insgesamt zeigt sich das SOEP, mit seiner großen Stichprobe und den detaillierten Befragungen zu den verschiedensten Themenbereichen, als eine flexible Datenbank mit hoher repräsentativer Eigenschaft. Dabei erfüllt das SOEP zwei
Grundvoraussetzungen, um es als Datenbasis für die Untersuchung des freiberuflichen Gründungsgeschehens zu verwenden. Zum einen berücksichtigt es
speziell die Selbständigengruppe der Freien Berufe bei der Erhebung und zum
anderen bietet das SOEP methodische Vorteile für die Analyse der Freien Berufe durch seine Panelstruktur gegenüber anderen Querschnitts- und Zeitreihendaten (vgl. Kap. 2).
Um das SOEP eingehender auf das zentrale Problem der Panelmortalität zu
überprüfen, ist es notwendig den Aufbau und die Entwicklung der Stichproben
genauer zu betrachten. Dazu gehört auch die richtige Auswahl aus den verschiedenen strukturbezogenen Möglichkeiten der Datengenerierung.
4.1.1 Entwicklung und Aufbau des SOEP
Obwohl sich das SOEP gegenüber den Befragten und Anwendern unter dem
einheitlichen Label „Leben in Deutschland“ präsentiert, besteht das SOEP aus
einem komplexen Befragungssystem, dessen Datenbestand sich aus mehreren
Teilstichproben zusammensetzt. So besteht das SOEP im Jahr 2002 aus sieben
Das Sozio-ökonomische Panel (SOEP) 147
verschiedenen Teilstichproben, die zu unterschiedlichen Startzeitpunkten in das
Haushaltspanel integriert wurden (SOEP-Gruppe 2003a; 2002b).
Die ältesten Teilstichproben A. und B. befinden sich bereits in der 19. jährlichen
Wiederholungsbefragung (Welle). Zu Beginn der SOEP-Umfrage 1984 beteiligten sich 5.921 Haushalte mit 12.290 Personen ab dem 16 Lebensjahr in Westdeutschland (Stichproben A. Deutsche West und Stichprobe B. Ausländer). Eine
dritte Teilstichprobe folgte 1990 auf dem Gebiet der ehemaligen DDR. Im Zuge
der Deutschen Einheit wurden erstmalig 2.179 Haushalte mit 4.453 Personen in
Ostdeutschland befragt (Stichprobe C. Deutsche Ost). Im Jahr 1995 folgte eine
weitere Teilstichprobe zum Schwerpunkt „Zuwanderung“ mit 522 Haushalte
und 1.078 Personen (Stichprobe D. Zuwanderung). Die fünfte Teilstichprobe zur
Auffrischung des Panels fand 1998 in 1.067 Haushalten mit 1.932 Personen statt
(Stichprobe E. Erweiterung). Um auf Basis einer großen Fallzahl genauere Analysen kleinerer Teilgruppen der Bevölkerung zu ermöglichen, wurde 2000 eine
weitere Teilstichprobe eingeführt, diese umfasste zum Start 6.052 Haushalte mit
10.886 Personen (Stichprobe F. Erweiterung). Die siebte und derzeit letzte Teilstichprobe fand im Jahr 2002 statt. Mit dem thematischen Schwerpunkt auf „hohe Einkommen“ wurden 1.224 Haushalte mit 2.671 Personen befragt (SOEP-
Gruppe 2003a; 2003b und 2002b).
Die Abbildung 10 zeigt die jährliche Brutto-Entwicklung sämtlicher Stichproben
auf der Personenebene für den Beobachtungszeitraum von 1992 bis 2002.
Abbildung 10: Brutto-Entwicklung der jährlichen SOEP Stichproben auf
Personenebene von 1992 bis 2002
0
5000
10000
15000
20000
25000
1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002
G.
F.
E.
D.
C.
B.
A.
Quelle: Eigene Abbildung in Anlehnung an SOEP-Gruppe 2003b und 2002a. * A. Deutsche
West; B. Ausländer; C. Deutsche Ost; D. Zuwanderer; E. Querschnitt; F. Querschnitt;
G. Hohe Einkommen.
148 Das Sozio-ökonomische Panel (SOEP)
Betrachtet man die Entwicklung der ersten drei erhobenen Teilstichproben (A-
C) wird die hohe Kontinuität und geringe Abbruchrate der befragten Teilnehmer
deutlich. So sind von den erstmalig 1984 Befragten 12.290 Personen im Jahr
2002 - also nach 19 Jahren! - noch über 6.000 Befragungsteilnehmer der ersten
Stunde dabei (vgl. Abb. 10.). Diese Zahlen belegen eindrucksvoll die geringe
Panelmortalität des SOEP.
Mit den Erweiterungsstichproben E. und F. sowie der Teilstichprobe G. stehen
im Jahr 2002 Informationen über 23.892 befragte Personen zur Verfügung
(SOEP-Gruppe 2003a; 2003b und 2002b).
Zur Generierung eines für die Untersuchungsfragen geeigneten Datensatzes bietet das SOEP im Internet (http:www.diw.de/soepinfo) zwei Alternativen an. Zur
Auswahl steht die Generierung eines „balanced“ Datensatzes oder eines „unbalanced“ Datensatzes. Vorteil des „balanced“ Datensatzes ist es, die durchgängig
im SOEP erfassten Personen einheitlich über den Beobachtungszeitraum in ihren Bruttoveränderungen zu untersuchen. Da beim „balanced“ Datensatz die mit
den Erweiterungsstichproben neu befragten Personen außen vor bleiben, ist die
Gruppe der Freien Berufe über einen länger anhaltenden Beobachtungshorizont
in der Stichprobe äußerst gering (vgl. Koch 2003). Die Abbildung 11 zeigt den
strukturellen Aufbau eines „balanced“ und eines „unbalanced“ Datensatzes.
Abbildung 11: Übersicht „balanced“ und „unbalanced“ Panel Struktur
Universe of
SOEP Population
„Net“ Population
(longitudinal)
= balanced
panel design
„Net“ Population
(longitudinal)
= unbalanced
panel design
Meta Data Wave1 Wave 2 Wave 3 „filled gap“
Cross-sectional Population
Quelle: Eigene Abbildung. In Anlehnung an SOEP-Gruppe 2003a und 2003b.
Mit der Verwendung eines „unbalanced“ Datensatz kann der Vorteil genutzt
werden, die in den Erweiterungsstichproben 1995, 1998, 2000 und 2002 stärker
ansteigende Zahl der Freien Berufe im SOEP zu berücksichtigen. Dieser Aspekt
Meta Data Wave1 Wave 2 Wave 3 „filled gap“
Das Sozio-ökonomische Panel (SOEP) 149
ist im Rahmen der Aufgabestellung umso bedeutender, da durch die Fokussierung auf die freiberuflichen Gründungen die Fallzahlen relativ gering sind.
Ein genereller Vorteil des SOEP-Datensatzes ist die Vermeidung der „Survivor-
Problematik“ (vgl. Kapitel 3). Freiberufler, die nur über eine kurze Zeit freiberuflich tätig waren und danach aus dieser Tätigkeit ausscheiden, fallen nicht aus
der Stichprobe heraus, da sie weiterhin befragt werden. Daher können retrospektiv, im Gegensatz zu den meisten Untersuchungen zum Gründungsgeschehen
(vgl. Brüderl, Preisendörfer und Ziegler 1996, 17), neben den erfolgreichen
Gründungen auch die Aufgaben berücksichtigt werden.
Allerdings werden beim „balanced“ Datensatz nur die Personen berücksichtigt,
welche über den kompletten Beobachtungszeitraum von elf Jahren an der Befragung teilgenommen haben. Scheidet eine Person aus der Befragung während des
Beobachtungszeitraumes von elf Jahren aus, wird sie im „balanced“ Datensatz
nicht berücksichtigt. Dagegen bleiben die Informationen der aus der Befragung
ausgeschiedenen Personen im „unbalanced“ Datensatz erhalten. Dadurch ist es
mit dem „unbalanced“ Datensatz retrospektiv möglich, ein relativ konkretes Bild
über den Erfolg der freiberuflichen Personen zu gewinnen, da auch die Informationen der aus der Befragung ausgeschiedenen Personen erhalten bleiben. Aufgrund der zu erwartenden höheren Fallzahlen sowie der methodischen Vorteile
wird für die Untersuchung des freiberuflichen Gründungsgeschehens ein „unbalanced“ Datensatz verwendet. Der folgende Abschnitt beschäftigt sich eingehend mit der Erfassung und den Fallzahlen der Freien Berufe im SOEP.
4.1.2 Die Freien Berufe im SOEP-Panel
Das SOEP unterscheidet seit dem Beginn seiner jährlichen Umfragen im Jahr
1984 die Gruppe der Selbständigen in vier verschiedene Kategorien. Dies sind
die Landwirte, die Freien Berufe, die sonstigen Selbständigen und die mithelfenden Familienangehörigen. Zwischen 1992 und 1999 wurden die Kategorien
in folgende Unterkategorien aufgeteilt: Landwirte [1], Freie Berufe [2], sonstige
Selbständige mit <9 Mitarbeiter [3]), sonstige Selbständige mit >9 Mitarbeiter
[4] und mithelfende Familienangehörige [5] (SOEP 1992-1999).
Mit der Erweiterungsstichprobe F im Jahr 2000 wurden die Unterkategorien der
Variable „Derzeitige Stellung Selbständige“ um die Unterkategorie „Selbständige ohne Mitarbeiter“ erweitert. Die neue Unterteilung hat seit dem Jahr 2000
nun folgendes Bild: Landwirte [1], Freie Berufe [2], sonstige Selbständige ohne
Mitarbeiter [3], sonstige Selbständige mit <9 Mitarbeitern [4], Selbständige mit
>9 Mitarbeitern [5] und mithelfende Familienangehörige [6] (SOEP 2000-2002).
Wie in der neuen Unterteilung nach Mitarbeitern bei den sonstigen Selbständigen werden seit dem Jahr 2000 auch die Zahl der Mitarbeiter bei den Freien Berufen in den drei Unterkategorien „ohne Mitarbeiter“, „mit <9 Mitarbeiter“ und
„>9 Mitarbeiter erfasst und in einer gesonderten Variable im SOEP zur Verfügung gestellt (SOEP 2000-2002).
Chapter Preview
References
Zusammenfassung
Die Arbeit verfolgt die theoretische, methodische und empirisch fundierte Analyse des freiberuflichen Gründungsgeschehens. Um die Fragestellung “Welche Determinanten beeinflussen die Gründungsaktivität und den Gründungserfolg von Freiberuflern?“ wird das Spektrum über die Phasen vor der Gründung bis zur Etablierung der freiberuflichen Tätigkeit am Markt erfasst.
Auf Grundlage des SOEP-Panels und einer Onlineerhebung tragen die Ergebnisse zu einem Erkenntnisgewinn des freiberuflichen Gründungsgeschehens bei. Gewürdigt wird dabei insbesondere die Praxis mit vielen neuen Ergebnissen aus den empirisch neu gewonnenen Daten zum Gründungsgeschehen der Freien Berufe.
Dr. Peter Paic studierte BWL und Ökonomie in Hamburg. 2008 Promotion an der Leuphana Universität Lüneburg. Zurzeit ist er Referent im Landesamt für Datenverarbeitung und Statistik (LDS NRW) in Düsseldorf.