DataCite Commons: Vergleich von Strategien zum Clustern von Daten mit fehlenden Werten

Die klassischen Methoden zur Clusteranalyse wurden entwickelt um auf vollständigen Daten Analysen durchzuführen. Oft fehlen aber in Daten einzelne Werte - systematisch oder unsystematisch -, z.B. infolge der Probleme bei der Datenerfassung, Datenübertragung, Datenbereinigung oder weil Daten aus unterschiedlichen Quellen stammen. Demzufolge können die traditionellen Clusteringmethoden zur Analyse solcher Daten nicht ohne weiteres angewendet werden. Im Rahmen dieses Beitrags werden unterschiedliche Strategien zum Umgang mit fehlenden Werten in Daten für das Clusteringproblem vorgestellt, analysiert und miteinander verglichen. Dabei wird das besondere Augenmerk auf die Untersuchung der Leistungsfähigkeit dieser Verfahren in Abhängigkeit von den Ausfallmechanismen, die den fehlenden Werten zugrundeliegen, und von dem Anteil fehlender Werte in Daten gelegt.

Content published 2009 in RosDok

TextGerman

https://doi.org/10.18453/rosdok_id00002202

Vergleich von Strategien zum Clustern von Daten mit fehlenden Werten

Cite as

Download Reports

Vergleich von Strategien zum Clustern von Daten mit fehlenden Werten

Cite as

Download Reports

Vergleich von Strategien zum Clustern von Daten mit fehlenden Werten

Cite as

Download Reports

Share

Vergleich von Strategien zum Clustern von Daten mit fehlenden Werten

Cite as

Download Reports

Share