Přejít k hlavnímu obsahu

Přihlášení pro studenty

Přihlášení pro zaměstnance

Publikace detail

Memory Efficient Grasping Point Detection of Nontrivial Objects
Autoři: Doležel Petr | Štursa Dominik | Kopecký Dušan | Jecha Jiří
Rok: 2021
Druh publikace: článek v odborném periodiku
Název zdroje: IEEE ACCESS
Název nakladatele: IEEE (Institute of Electrical and Electronics Engineers)
Místo vydání: New York
Strana od-do: 82130-82145
Tituly:
Jazyk Název Abstrakt Klíčová slova
cze Paměťově efektivní detekce uchopovacích bodů netriviálních objektů Robotická manipulace s netriviálním objektem poskytujícím různé typy úchopových bodů je předmětem průmyslového zájmu. Zde je navržena účinná metoda současné detekce úchopových bodů. Konkrétně se uvažují dva různé koncové efektory se třemi stupni volnosti pro současné uchopení. Metoda využívá systém vnímání řízený daty RGB založený na speciálně navržené plně konvoluční neuronové síti nazvané attention squeeze parallel U-Net (ASP U-Net). ASP U-Net detekuje body uchopení na základě jediného obrazu RGB. Tento obraz je transformován do schematického snímku ve stupních šedi, kde jsou polohy a pozice uchopovacích bodů zakódovány do gradientních geometrických tvarů. Za účelem schválení architektury ASP U-Net byla její výkonnost porovnána s devíti konkurenčními architekturami pomocí metrik založených na zobecněném průniku přes sjednocení a střední absolutní chybě. Výsledky ukazují na její vynikající přesnost a dobu odezvy. ASP U-Net je také dostatečně výpočetně efektivní. Díky více než přijatelné velikosti paměti (77 MB) lze architekturu implementovat pomocí vlastních jednodeskových počítačů. Zde byly její schopnosti testovány a vyhodnoceny na platformě NVIDIA Jetson NANO. Uchopování; servisní roboty; koncové efektory; chapadla; trojrozměrné displeje; konvoluční neuronové sítě; počítačová architektura; robotické uchopování; detekce bodu uchopení; strojové vidění; hluboké učení; konvoluční neuronová síť
eng Memory Efficient Grasping Point Detection of Nontrivial Objects Robotic manipulation with a nontrivial object providing various types of grasping points is of an industrial interest. Here, an efficient method of simultaneous detection of the grasping points is proposed. Specifically, two different 3 degree-of-freedom end effectors are considered for simultaneous grasping. The method utilizes an RGB data-driven perception system based on a specifically designed fully convolutional neural network called attention squeeze parallel U-Net (ASP U-Net). ASP U-Net detects grasping points based on a single RGB image. This image is transformed into a schematic grayscale frame, where the positions and poses of the grasping points are coded into gradient geometric shapes. In order to approve the ASP U-Net architecture, its performance was compared with nine competitive architectures using metrics based on generalized intersection over union and mean absolute error. The results indicate its outstanding accuracy and response time. ASP U-Net is also computationally efficient enough. With a more than acceptable memory size (77 MB), the architecture can be implemented using custom single-board computers. Here, its capabilities were tested and evaluated on the NVIDIA Jetson NANO platform. Grasping; Service robots; End effectors; Grippers; Three-dimensional displays; Convolutional neural networks; Computer architecture; Robotic grasping; grasping point detection; machine vision; deep learning; convolutional neural network