Clusteranalyse
Clusteranalyse verständlich & knapp definiert
Im Rahmen der Clusteranalyse werden die Merkmale von Objekten analysiert, die sich in einem großen Datensatz befinden. Ziel ist es, die Objekte übergeordneten Clustern (Gruppen) zuzuordnen, wobei sich diese Gruppen möglichst stark voneinander unterscheiden sollten.- chevron_right Ziel einer Clusteranalyse
- chevron_right Voraussetzungen für die Clusteranalyse
- chevron_right Beispiel für die Clusteranalyse
- chevron_right Clusteranalyse – Definition & Erklärung – Zusammenfassung
Der ursprünglich aus der Statistik stammende Begriff der sogenannten Clusteranalyse beschreibt die Unterteilung verschiedener Objekte in bestimmte Gruppen.
Grundlage für diese Einteilung sind dabei verschiedene Gemeinsamkeiten, die diese Objekte aufweisen können. Häufige Anwendung findet die Clusteranalyse im Bereich der Datenauswertung. Bestehen größere Datensätze können diese mittels der Clusteranalyse in verschiedene Objektgruppen unterteilt werden.
Auf diese Weise wird die weitere Datenverarbeitung bzw. Weiterverwendung einfacher. Auch die rein statistische Auswertung dieser Datensätze ist mittels Clusteranalyse möglich – je nach Daten und gewünschter Unterteilung. Vor allem in betriebswirtschaftlichen Bereichen findet die Clusteranalyse Anwendung.
Ziel einer Clusteranalyse
Führen Wirtschaftswissenschaftler eine Clusteranalyse durch, so möchten sie eine Menge von Objekten in Gruppen einteilen. Dabei sollen sich die Objekte, die einem Cluster zugeordnet werden, möglichst ähnlich sein. Hingegen sollen die einzelnen Cluster möglichst stark voneinander abweichen, um klare Unterscheidungskriterien definieren zu können.
Die Problematik dieses Verfahrens besteht darin, dass die Ähnlichkeit von Objekten genau gemessen werden muss. Als bestmögliches Verfahren hierfür hat sich die sogenannte hierarchische Clusteranalyse etabliert, wobei dies nicht die einzige Variante ist. Allerdings erfordert die hierarchische Analyse nur recht geringe Voraussetzungen und kann in fast jeder Situation angewendet werden.
Voraussetzungen für die Clusteranalyse
Damit eine solcher Clusteranalyse tatsächlich durchgeführt werden kann, muss die Ähnlichkeit zweiter Objekte mathematisch quantifizierbar sein. Sofern die Daten metrisch skalierte Merkmale enthalten, kann die Clusteranalyse ohne Weiteres durchgeführt werden (Beispiel: Größe eines Menschen). Handelt es sich hingegen um ordinal (Beispiel: Dienstrang beim Militär) oder gar nominal (Beispiel: Geschlecht) skalierte Daten, so müssen Dummy-Variablen codiert werden. Handelt es sich beim Merkmal beispielsweise um das Geschlecht, so könnte „1“ für männlich und „0“ für weiblich stehen. Sehr wohl möglich ist es, gleichzeitig metrisch und nicht metrische Daten zu verwenden.
Beispiel für die Clusteranalyse
Eine Großstadt wie beispielsweise Berlin verfügt über eine Vielzahl von Stadtteilen. Für die Politik könnte es von Bedeutung sein, ähnliche Stadtteile in Cluster einzuordnen. So könnten beispielsweise finanzielle Mittel effizienter verteilt werden. Als Merkmale der Stadtteile, die später für die Einordnung in Cluster sorgen, könnten folgende Eigenschaften dienen:
- Altersstruktur
- Bevölkerungsdichte
- Arbeitslosigkeit
- Ausländeranteil
- Bevölkerungsentwicklung
- Haushaltseinkommen
- Bildungsstand
Mit einem komplexen Algorithmus werden die Berliner Stadtteile jetzt aufgrund dieser Merkmale in Cluster eingeteilt. So ist ersichtlich, welche Viertel als wohlhabend und welche als eher arm gelten. Auf dieser Basis können Politiker Mittel besser verteilen, um etwa für mehr Bildung in den finanziell schwächeren Stadtteilen zu sorgen.
Clusteranalyse – Definition & Erklärung – Zusammenfassung
- Die Clusteranalyse ist ein statistisches Verfahren
- Aus einem Datensatz werden solche Objekte gefiltert, die über ähnliche Merkmale verfügen
- Im Idealfall unterscheiden sich die erzeugten Cluster möglichst stark voneinander
whatshot Beliebteste Artikel
- chevron_right Stakeholder und Shareholder
- chevron_right Nachhaltigkeit
- chevron_right Diskontieren
- chevron_right Soziale Ziele
- chevron_right Ökonomie
- chevron_right Restbuchwert
- chevron_right Schwellenländer
- chevron_right Antizyklische Fiskalpolitik
- chevron_right Vertragsfreiheit
- chevron_right Prokura