Přejít k hlavnímu obsahu

Přihlášení pro studenty

Přihlášení pro zaměstnance

Publikace detail

On Reporting performance of binary classifiers
Autoři: Škrabánek Pavel | Doležel Petr
Rok: 2017
Druh publikace: článek v odborném periodiku
Název zdroje: Scientific Papers of the University of Pardubice - Series D, Faculty of Economics and Administration
Strana od-do: 181-192
Tituly:
Jazyk Název Abstrakt Klíčová slova
cze Jak správně publikovat výsledky evaluace binárních klasifikátorů Článek se zabývá otázkou jak správně provést evaluaci binárních klasifikátorů. Tato otázka je řešena v kontextu vyváženosti zastoupení tříd v evaluačních datových sadách. Některé z metrik používaných při evaluaci jsou totiž citlivé na složení evaluační datových sad. V případě jejich nevyváženosti poskytují tyto metriky zavádějící výsledky. K zamezení tohoto problému je možné použít vážené metriky, které nejsou ovlivňovány skladbou evaluačních datových sad. Tyto metriky jsou zavedeny a diskutovány v rámci tohoto článku.
eng On Reporting performance of binary classifiers In this contribution, the question of reporting performance of binary classifiers is opened in context of the so called class imbalance problem. The class imbalance problem arises when a dataset with a highly imbalanced class distribution is used within the training or evaluation process. In such cases, only measures, which are not biased by distribution of classes in datasets, should be used; however, they cannot be chosen arbitrarily. They should be selected so that their outcomes provide desired information; and simultaneously, they should allow a full comparison of just evaluated classifier performance along, with performances of other solutions. As is shown in this article, the dilemma with reporting performance of binary classifiers can be solved using so called class balanced measures. The class balanced measures are generally applicable means, appropriate for reporting performance of binary classifiers on balanced as well as on imbalanced datasets. On the basis of the presented pieces of information, a suggestion for a generally applicable, fully-valued, reporting of binary classifiers performance is given. machine learning; binary classification; class imbalance problem; performance measures; reporting of results