Hájek Martin
Modul v jazyce C pro shlukovou analýzu na bázi prahování dendrogramu
SW module for a cluster analysis in the C-language based on a dendrogramme thresholding
Abstrakt
Tento modul je určen pro hierarchickou shlukovou analýzu dvourozměrných dat. Sestává ze samostatné jednotky (*.c a *.h souboru), která obsahuje všechny potřebné funkce. Kód nejprve sestaví dendrogram (je použita euklidovská metrika) a následně provede shlukování prvků dat, přičemž hodnotícím kritériem zařazení do clusteru je výška od paty dendrogramu. Modul tedy vrací shluky, které vytvoří čára protínající dendrogram ve zvolené výšce.
Klíčová slova
Shluková analýza, dendrogram, prahování, 2D data, euklidovská metrika
Abstract
This SW module provides a hierarchical cluster analysis of 2D data. It consists of a detached unit (*.c a *.h file), containing all the necessary functions. First, the dendrogramme is compiled using Euclides metrics then data clustering is accomplished whereas the data level over the dendrogramme bottom is used as a clustering criterion. The module then returns clusters formed by a line, crossing the dendrogramme in the selected level.
Keywords
cluster analysis, tresholding, dendrogram, euclides metrics
download: shlukovani.zip