Přejít k hlavnímu obsahu

Přihlášení pro studenty

Přihlášení pro zaměstnance

Publikace detail

Person Detection for an Orthogonally Placed Monocular Camera
Autoři: Škrabánek Pavel | Doležel Petr | Němec Zdeněk | Štursa Dominik
Rok: 2020
Druh publikace: článek v odborném periodiku
Název zdroje: Journal of Advanced Transportation
Název nakladatele: Hindawi limited
Místo vydání: Londýn
Strana od-do: nestránkováno
Tituly:
Jazyk Název Abstrakt Klíčová slova
cze Detekce osob pomocí monokulární kamery Počítání cestujících nastupujících a vystupujících z dopravních prostředků je jednou ze základních funkcí monitorovacích systémů toku cestujících. Přesný počet cestujících je důležitý v oblastech, jako je dohled nad veřejnou dopravou, predikce toku cestujících, plánování dopravy a sledování zatížení přepravních vozidel. Aby bylo možné hromadně využívat systémy monitorování toku cestujících, musí být jejich cena nízká. Protože celková cena je dána hlavně cenami použitého senzoru a procesní jednotky, navrhujeme využití viditelné spektrální kamery a algoritmů zpracování dat s nízkou časovou složitostí, abychom zajistili nízkou cenu finálního produktu. Abychom zaručili anonymitu cestujících, navrhujeme ortogonální skenování scény. Protože přesnost počítání je relevantně ovlivněna přesností rozpoznávání cestujících, zaměřujeme se na vývoj vhodné metody rozpoznávání. Představujeme dva protichůdné přístupy, které lze použít k rozpoznávání cestujících v dopravních prostředcích se vstupními schody a bez nich, nebo s mezipodlahou. Prvním přístupem je využití vhodné konvoluční neurální sítě (ConvNet), která je v současné době převládajícím přístupem v počítačovém vidění. Druhým přístupem je využití histogramů funkcí orientovaných gradientů (HOG) v kombinaci s klasifikátorem podpory vektorových strojů. Tento přístup je představitelem klasických metod. Oba přístupy studujeme z hlediska praktických aplikací, kde je zpracování dat v reálném čase jedním ze základních předpokladů. Konkrétně zkoumáme výkon klasifikace a časovou složitost přístupů pro různé topologie a nastavení. Za tímto účelem vytvoříme a zpřístupníme veřejně rozsáhlou, třídně vyváženou datovou sadu označených obrázků RGB. Ukazujeme, že ve srovnání s ConvNets je rozpoznávání cestujících založené na HOG vhodnější pro praktické aplikace. Pro vhodné nastavení porazí ConvNets z hlediska časové složitosti při zachování vynikajícího výkonu klasifikace. Abychom mohli ověřit teoretické poznatky, zkonstruujeme inženýrský pro detektor osob; extrakce vlastností
eng Person Detection for an Orthogonally Placed Monocular Camera Counting of passengers entering and exiting means of transport is one of the basic functionalities of passenger flow monitoring systems. Exact numbers of passengers are important in areas such as public transport surveillance, passenger flow prediction, transport planning, and transport vehicle load monitoring. To allow mass utilization of passenger flow monitoring systems, their cost must be low. As the overall price is mainly given by prices of the used sensor and processing unit, we propose the utilization of a visible spectrum camera and data processing algorithms of low time complexity to ensure a low price of the final product. To guarantee the anonymity of passengers, we suggest orthogonal scanning of a scene. As the precision of the counting is relevantly influenced by the precision of passenger recognition, we focus on the development of an appropriate recognition method. We present two opposite approaches which can be used for the passenger recognition in means of transport with and without entrance steps, or with split level flooring. The first approach is the utilization of an appropriate convolutional neural network (ConvNet), which is currently the prevailing approach in computer vision. The second approach is the utilization of histograms of oriented gradients (HOG) features in combination with a support vector machine classifier. This approach is a representative of classical methods. We study both approaches in terms of practical applications, where real-time processing of data is one of the basic assumptions. Specifically, we examine classification performance and time complexity of the approaches for various topologies and settings, respectively. For this purpose, we form and make publicly available a large-scale, class-balanced dataset of labelled RGB images. We demonstrate that, compared to ConvNets, the HOG-based passenger recognition is more suitable for practical applications. For an appropriate setting, it defeats the ConvNets in terms of ti person detector; feature extraction