Univerzita Pardubice Fakulta elektrotechniky a informatiky

Univerzita Pardubice

Zaměstnanci
|
Studenti
English

Publikace detail

Tituly:

Jazyk	Název	Abstrakt	Klíčová slova
cze	Podmínky aplikace GPA-ES algoritmu na Big Data	Zde představený příspěvek hovoří o podmínkách užití Algoritmu Genetického Programování (GPA) pro práci s tzv. big daty. V článku jsou diskutovány různé způsoby snížení počtu vyhodnocení trénovacích (big) dat stejně jako parallelizace tohoto procesu. Článek rovněž diskutuje užití plovoucího okénka k uskutečnění vyhodnocovacích kroků na malých podmnožinách dat. Presentovaný přístup je založen na redukci počtu vyhodnocení, aby bylo možno vyhodotit fitness funkci v akceptovatelném výpočetním čase. Původní GPA-ES algoritmus je popsán též. Tento algoritmus byl vyvíjen a testován po mnoho let v aplikační oblasti precizní symbolické regresi. Nyní je zájem aplikovat ho pro aplikční oblast big dat, především pak oblasti datově založeného modelování a objevování znalostí. Poté jsou popsány experimenty verifikující tyto hypotézy a diskutovány výsledky. Tyto experimenty jsou založeny na symbolické regresi (objevování diferenciálních rovnic) popisující trénovací množinu dat představující pohybsystému Lorenzova atraktoru který je systémem deterministického chaosu.	Big Data; Evoluční Algoritmus; Vyhodnocovací schema; Redukce ohodnocování; Plovoucí okénka; Podmnožina dat
eng	Preconditions of GPA-ES Algorithm Application to Big Data	Abstract. Herein presented contribution speaks about preconditions of Genetic Programming Algorithm (GPA) used to work with so called big data. In the paper the different ways of decrease of number of (big) training data evaluations as well as parallelization of this process. The paper also discusses using of a floating window to provide evolution steps on small data subsets. The presented approach is based on reduction of the number of evaluations to allow fitness function evaluation in acceptable computational time. The original GPA-ES algorithm is described too. This algorithm was developed and tested for many years for application in area of accurate symbolic regression. Now the interest is to apply it to the application domain of big data, especially to data based modeling and knowledge discovering fields. Then there are described experiments verifying these hypotheses and the results are discussed. These experiments are based on symbolic regression (discovering of differential equations) describing a training data set representing movement of the Lorenz attractor deterministic chaos system.	Big Data; Evolutionary Algorithm; Evaluation Scheme; Evaluation Reduction; Floating Window; Data Subset