Human detection methods are widely used in various fields such as autonomous vehicles, video surveillance, and rescue systems. To provide a more effective detection system, different types of sensor data (i.e. optics, thermal, and depth data) may be used together as hybrid information. Fortifying object detection, based on optical data and additional sensor data, such as depth and thermal data, also represents information regarding the distance and temperature of classified objects that can be used for video surveillance, rescue systems, and various applications. In this study, a simple and effective method is introduced to fuse RGB-D and thermal sensor data to achieve a more accurate form of human detection. To accurately combine the sensors, they are physically fixed to each other, and the relationship between them is determined using a novel method. The feature points on the optical and thermal images are extracted and matched successfully using computer vision. The proposed method is completely brand-free, easy to implement, and can be used in real-time applications. Using both thermal and optical data, humans are classified as benefiting from a widely used object detection method. The performance of the presented method is tested with a newly generated dataset. The proposed method boosts human detection accuracy by 5% when compared to the use of only optical data and by 37% when compared to the use of thermal data with COCO Dataset upon YOLOv4 neural network weights. After training with the newly generated dataset, the detection accuracy increases by 18% compared with the best results of single sensor usage.INDEX TERMS Data fusion; human detection; image processing.
Nesne tespit ve sınıflandırma yöntemlerinin başarısının artırılması amacıyla model odaklı ve veri odaklı yaklaşımlar araştırmacılar tarafından son yıllarda sıklıkla çalışılmaktadır. Araştırmacıların birçoğu problemlere özgü model önerilerinde bulunmakta ve mevcut modeller üzerinde değişimler önermektedir. Öte yandan, eğitim sürecinde kullanılmakta olan veri üzerinde yapılan çalışmaların sayışa oldukça azdır. Bu çalışmada, mevcut bir tanıma ve sınıflandırma problemi üzerinde, model ve veri odaklı yaklaşımların etkileri kıyaslanmıştır. Yaygın kullanıma sahip olan YOLOv4 ağı üzerinde yapılan ağ yapısı değişikliğinin başarım ve performansa etkisiyle, veri setinde kullanılan verilerin yeniden hazırlanmasıyla elde edilen başarım karşılaştırılarak yorumlanmıştır. Ağ yapısının değişimi ile nesne tanıma başarısı yaklaşık %4 oranında artarken, hesaplama hızında ortalama %8’lik düşüş meydana gelmiştir. Öte yandan verilerin yeniden hazırlanarak nesne tanıma algoritmasının çalıştırılması %6 oranında kazanç sağlarken, hesaplama maliyetinde değişime neden olmamıştır. Günümüzde yeteri kadar dikkate alınmasa da veri üzerindeki hazırlıkların sınıflandırma doğruluğuna önemli derecede etki yaptığı gözlemlenmiştir.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2025 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.