We propose a method of improving detection precision (mAP) with the help of the prior knowledge about the scene geometry: we assume the scene to be a plane with objects placed on it. We focus our attention on autonomous robots, so given the robot's dimensions and the inclination angles of the camera, it is possible to predict the spatial scale for each pixel of the input frame. With slightly modified YOLOv3-tiny we demonstrate that the detection supplemented by the scale channel, further referred as S, outperforms standard RGB-based detection with small computational overhead.
Данная статья посвящена разработанному нейросетевому алгоритму распознавания трехмерных объектов. Было принято решение рассматривать задачу распознавания трехмерных объектов в контексте автономного управления автомобилем. Для этого были проанализированы наиболее популярные алгоритмы в области детектирования трехмерных объектов. Это позволило сделать вывод о том, что для обучения точного алгоритма необходимо использовать облака точек, вычисляемые с помощью Lidar-сканеров. Кроме того, требуется сохранять как можно больше пространственной информации на этапе представления облака точек в виде упорядоченной структуры. В то же время для сохранения уровня производительности, достаточного для работы в реальном времени, следует избегать использования затратных по времени операций при извлечении признаков из облака точек, а при построении собственного алгоритма необходимо сделать выбор в пользу одноступенчатых алгоритмов обнаружения объектов. В результате был получен алгоритм, который способен обрабатывать более 17 кадров в секунду, что является достаточной скоростью для работы в режиме реального времени. Помимо этого, он имеет высокую точность, сопоставимую с качеством распознавания других алгоритмов обнаружения трехмерных объектов. Ключевые слова: распознавание образов, распознавание трехмерных объектов, компьютерное зрение, свёрточные нейронные сети, Tensotflow NEURAL NETWORK SYSTEM FOR RECOGNITION 3D-OBJECTS
In this paper, we present a robot model and code base for affordable education in the field of humanoid robotics. We give an overview of the software and hardware of a robot that won several competitions with the team RoboKit in 2019−2021, provide analysis of the contemporary market of education in robotics, and highlight the reasoning beyond certain design solutions.
This article is devoted to the features that were under development between RoboCup 2019 Sydney and RoboCup 2021 Worldwide. These features include vision-related matters, such as detection and localization, mechanical and algorithmic novelties. Since the competition was held virtually, the simulation-specific features are also considered in the article. We give an overview of the approaches that were tried out along with the analysis of their preconditions, perspectives and the evaluation of their performance.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.