Clusteranalyse


Kurz & einfach erklärt:

Clusteranalyse verständlich & knapp definiert

Im Rahmen der Clusteranalyse werden die Merkmale von Objekten analysiert, die sich in einem großen Datensatz befinden. Ziel ist es, die Objekte übergeordneten Clustern (Gruppen) zuzuordnen, wobei sich diese Gruppen möglichst stark voneinander unterscheiden sollten.
notes Inhalte

Der ursprünglich aus der Statistik stammende Begriff der sogenannten Clusteranalyse beschreibt die Unterteilung verschiedener Objekte in bestimmte Gruppen


Grundlage für diese Einteilung sind dabei verschiedene Gemeinsamkeiten, die diese Objekte aufweisen können. Häufige Anwendung findet die Clusteranalyse im Bereich der Datenauswertung. Bestehen größere Datensätze können diese mittels der Clusteranalyse in verschiedene Objektgruppen unterteilt werden. 

Auf diese Weise wird die weitere Datenverarbeitung bzw. Weiterverwendung einfacher. Auch die rein statistische Auswertung dieser Datensätze ist mittels Clusteranalyse möglich – je nach Daten und gewünschter Unterteilung. Vor allem in betriebswirtschaftlichen Bereichen findet die Clusteranalyse Anwendung.

Ziel einer Clusteranalyse

Führen Wirtschaftswissenschaftler eine Clusteranalyse durch, so möchten sie eine Menge von Objekten in Gruppen einteilen. Dabei sollen sich die Objekte, die einem Cluster zugeordnet werden, möglichst ähnlich sein. Hingegen sollen die einzelnen Cluster möglichst stark voneinander abweichen, um klare Unterscheidungskriterien definieren zu können.

Die Problematik dieses Verfahrens besteht darin, dass die Ähnlichkeit von Objekten genau gemessen werden muss. Als bestmögliches Verfahren hierfür hat sich die sogenannte hierarchische Clusteranalyse etabliert, wobei dies nicht die einzige Variante ist. Allerdings erfordert die hierarchische Analyse nur recht geringe Voraussetzungen und kann in fast jeder Situation angewendet werden.

Voraussetzungen für die Clusteranalyse

Damit eine solcher Clusteranalyse tatsächlich durchgeführt werden kann, muss die Ähnlichkeit zweiter Objekte mathematisch quantifizierbar sein. Sofern die Daten metrisch skalierte Merkmale enthalten, kann die Clusteranalyse ohne Weiteres durchgeführt werden (Beispiel: Größe eines Menschen). Handelt es sich hingegen um ordinal (Beispiel: Dienstrang beim Militär) oder gar nominal (Beispiel: Geschlecht) skalierte Daten, so müssen Dummy-Variablen codiert werden. Handelt es sich beim Merkmal beispielsweise um das Geschlecht, so könnte „1“ für männlich und „0“ für weiblich stehen. Sehr wohl möglich ist es, gleichzeitig metrisch und nicht metrische Daten zu verwenden.

Beispiel für die Clusteranalyse

Eine Großstadt wie beispielsweise Berlin verfügt über eine Vielzahl von Stadtteilen. Für die Politik könnte es von Bedeutung sein, ähnliche Stadtteile in Cluster einzuordnen. So könnten beispielsweise finanzielle Mittel effizienter verteilt werden. Als Merkmale der Stadtteile, die später für die Einordnung in Cluster sorgen, könnten folgende Eigenschaften dienen:

  • Altersstruktur
  • Bevölkerungsdichte
  • Arbeitslosigkeit
  • Ausländeranteil
  • Bevölkerungsentwicklung
  • Haushaltseinkommen
  • Bildungsstand


Mit einem komplexen Algorithmus werden die Berliner Stadtteile jetzt aufgrund dieser Merkmale in Cluster eingeteilt. So ist ersichtlich, welche Viertel als wohlhabend und welche als eher arm gelten. Auf dieser Basis können Politiker Mittel besser verteilen, um etwa für mehr Bildung in den finanziell schwächeren Stadtteilen zu sorgen.

Clusteranalyse – Definition & Erklärung – Zusammenfassung

  • Die Clusteranalyse ist ein statistisches Verfahren
  • Aus einem Datensatz werden solche Objekte gefiltert, die über ähnliche Merkmale verfügen
  • Im Idealfall unterscheiden sich die erzeugten Cluster möglichst stark voneinander

Weiterführende Artikel:

Absatz: Mit dem Terminus Absatz wird die durch ein Unternehmen von einem Gut oder einer Dienstleistung in einer bestimmten Zeitspanne ...


Vermögen: Unter den Begriff Vermögen fallen alle Güter und Rechte, die Unternehmen, Privathaushalte und der Staat besitzen. Diese Kategorie ...


Abgrenzung (zeitlich): Eine Abgrenzung in zeitlicher Hinsicht erfolgt, um die Erfolgsermittlung (Gewinne, Verluste) periodengerecht durchführen zu ...


Accounting: Unter Accounting ist die systematische Erfassung und Überwachung der in einem Unternehmen entstehenden Geld- und Leistungsströme ...


Akkordlohn: Der Akkordlohn wird auf Basis des Mengenergebnisses pro Zeiteinheit vergeben. Dabei ist zwischen Zeit- und Geldakkord zu unterscheiden, ...


Aktivkonto: Mit dem Begriff Aktivkonto wird in der Betriebswirtschaftslehre ein Bestandskonto bezeichnet, das sich aus einer Unternehmensbilanz ableiten ...

whatshot Beliebteste Artikel