Přejít k hlavnímu obsahu

Přihlášení pro studenty

Přihlášení pro zaměstnance

Publikace detail

Object detection for robotic grasping using a cascade of convolutional networks
Rok: 2023
Druh publikace: článek ve sborníku
Název zdroje: Process control 23 : proceedings of the 2023 24th international conference on process control (PC)
Název nakladatele: IEEE (Institute of Electrical and Electronics Engineers)
Místo vydání: New York
Strana od-do: 198-202
Tituly:
Jazyk Název Abstrakt Klíčová slova
cze Detekce objektů pro robotické uchopování pomocí kaskády konvolučních sítí Ovládání robotů v průmyslu je významným problémem, který je třeba řešit v moderních výrobních zařízeních. Jednou z běžných úloh v této oblasti je problém pick and place. Pro správnou realizaci aplikace automatického uchopování a umísťování objektů pomocí robotického ramene je nutné zjistit přesnou polohu objektů zájmu. V tomto příspěvku je navržen nový inženýrský přístup k určování polohy objektů založený na zpracování obrazu. Konkrétně se jedná o kaskádu konvolučních neuronových sítí. Tato kaskáda se skládá ze dvou různých typů sítí. První z nich je síť pro detekci objektů nazvaná YOLOv5. Ta slouží ke zpracování surových obrazových dat ze scény za účelem přesné lokalizace a určení polohy zájmových objektů. Poté jsou vytvořeny odhady natočení objektů, které jsou zpracovány druhou neuronovou sítí, a to EfficientNet. Tato klasifikační síť se používá k určení úhlu natočení detekovaných objektů. Navrhovaný přístup poskytuje míru přesnosti 0,997 pro lokalizaci a určení správné polohy. Pro klasifikaci úhlů poskytuje síť EfficientNet přesnost 0,951. Všechny testy jsou prováděny na testovací množině legitimního problému určování polohy. Detekce objektů; Pick and Place; Konvoluční neuronová síť; EfficientNet; YOLO
eng Object detection for robotic grasping using a cascade of convolutional networks Robot guidance in industry is a significant issue that needs to be dealt with in modern manufacturing facilities. One of the common tasks in this area is the pick and place problem. For proper implementation of an automatic pick and place application using a robotic arm for object grasping, it is necessary to detect the accurate pose of the objects of interest. In this contribution, a novel engineering approach to object positioning, based on image processing is proposed. In this approach, the operation is composed of a cascade of convolutional neural networks. This cascade consists of 2 different types of networks. The first one is the object detection network called YOLOv5. It is used to process the raw image data from the scene to provide precise localization and determine the position of the objects of interest. After that, crops of the detected objects are created and processed by the second neural network, namely EfficientNet. This classification network is used to determine the rotation angle of the detected objects. The proposed approach provides a precision rate of 0.997 and a recall rate of 0.999 for locating and determining the correct position. For angle classification, EfficientNet provides an accuracy of 0.951. All tests are performed on the testing set of the legitimate positioning problem. Object detection; Pick and Place; Convolutional neural network; EfficientNet; YOLO