Shlukování a vizualizace tabulkových dat s nominálními atributy

Štefan Okruhlica Vedoucí práce: Ladislav Čmolík Diplomová práce 2021

Tato diplomová práce se zabývá různými přístupy ke clusterování a následné vizualizaci nominálních a ordinálních dat. Ukazuje tabulkové datasety, definuje typy attributů a popisuje úkoly pro vizualizaci. Dále vysvětluje různé clusterovací metody (hierarchické clusterování, k-means, k-modes, paralellogramové cluserování) pro clusterování nominálních dat. K výpočtu vzdálenosti je vystvěleno Dicova míra podobnosti. Ukazuje jakým způsobem byl implementován použitý algoritmus parallelogramového clusterování v nástroji XDat. Výsledky jsou prezentovány na čtyř datasetech.

Publikace

Shlukování a vizualizace tabulkových dat s nominálními atributy

Ukázky

Obrázky