Top-Fragen
Zeitleiste
Chat
Kontext
Hierarchisch strukturierte Daten
Aus Wikipedia, der freien Enzyklopädie
Remove ads
In der Statistik und in den Wirtschaftswissenschaften spricht man von hierarchisch strukturierten Daten (oder genesteten Daten; englisch nested data) wenn die Beobachtungen eines Datensatzes sich hierarchisch übergeordneten Einheiten zuordnen lassen. Solche Hierarchie-Zusammenhänge können mehrstufig sein.[1]
Für die Analyse genesteter Daten sind spezielle Verfahren notwendig, die diese Datenstruktur berücksichtigen. Beispiele sind die Paneldatenanalyse und Mehrebenenanalyse.[2][3] Auch robuste Schätzungen, die diese Datenstruktur berücksichtigen, werden angewandt.
Remove ads
Allgemeines
In der Soziologie wird Wert darauf gelegt, dass soziales Handeln nicht nur von individuellen Merkmalen wie Geschlecht, Bildung oder Persönlichkeit abhängt, sondern auch vom sozialen Kontext, in den der Akteur eingebettet ist.[4] Liegen Kontext-Informationen in sozialwissenschaftlichen Datensätzen vor, handelt es sich um hierarchisch strukturierte Daten. Von einer hierarchischen Datenstruktur wird ausgegangen, wenn sowohl Elemente der Mikroebene (Mikrodaten) jeweils genau einem Element der Makroebene (Makrodaten) zugeordnet sind als auch die Makroebene sich ausschließlich aus Elementen der Mikroebene zusammensetzt.[5] Diese hierarchischen Datenstrukturen können mit der Mehrebenenanalyse ausgewertet werden.
Remove ads
Einteilung
Je nach Fachgebiet können unter anderem folgende Mikro- und Makroebenen unterschieden werden:
Der einzelne Schüler gehört zur Mikroebene, seine Schulklasse zur Mesoebene und die Schule zur Makroebene. Besteht beispielsweise ein Datensatz aus Schülern und enthält Informationen zu den Schulen, so würde eine Schätzung, welche die genestete Struktur der Daten nicht berücksichtigt, die Streuung der Merkmale unterschätzen. Durch Berücksichtigung der genesteten Struktur wird die Schätzungenauigkeit berücksichtigt.[6]
Remove ads
Beispiele
Hierarchisch strukturierte Daten gibt es in den Sozialwissenschaften sehr häufig.[7] So bilden einzelne Schüler die Mikroebene, darüber sind die Schulen als Makroebene angesiedelt. Unter dieser Voraussetzung lässt sich beispielsweise die Schulnote im Schulzeugnis eines einzelnen Schülers (Mikrodaten) zu einer Durchschnittsnote in der gesamten Schule, in einem Bundesland und in Deutschland (Makrodaten) aggregieren. Auf diese Weise ergibt sich beispielsweise der Abiturdurchschnitt,[8] der für ein Studium an einer Universität von Bedeutung ist.
Die Analyse hierarchisch strukturierter Daten anhand einer einfachen Regression ohne Berücksichtigung der Mehrebenenstruktur ist statistisch und interpretatorisch oft problematisch.[9]
Siehe auch
Literatur
- M. K. Anand, S. Bowers, T. McPhillips, B. Ludäscher: Efficient provenance storage over nested data collections. In: Proceedings of the 12th International Conference on Extending Database Technology: Advances in Database Technology. ACM, New York, März 2009, S. 958–969.
- A. Kawaguchi, D. Lieuwen, I. Mumick, K. Ross: Implementing incremental view maintenance in nested data models. In: Database Programming Languages. Springer, Berlin/Heidelberg, August 1997, S. 202–221.
- K. F. Widaman: Hierarchically nested covariance structure models for multitrait-multimethod data. In: Applied Psychological Measurement. 9(1), 1985, S. 1–26.
Remove ads
Einzelnachweise
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads