El reconocimiento de objetos ha sido un problema ampliamente analizado en el campo de la visión por computador desde hace muchos años. En este artículo utilizamos el modelo de red neuronal Mask R-CNN para detectar y segmentar algunos objetos de cocinas usando imágenes RGB. Existen algunas bases de datos públicas con los objetos segmentados y etiquetados por clases, para entrenar este tipo de redes pero normalmente no incluyen clases para aplicaciones concretas. Crear un conjunto de datos etiquetado a mano completamente es una tarea muy tediosa y larga. Proponemos un método eficiente para crear imágenes etiquetadas con poco esfuerzo combinando imágenes de fondos con objetos segmentados. Las imágenes se pueden crear manteniendo el realismo en cuanto a la posición y la escala de los objetos, o automáticamente mediante un posicionamiento aleatorio. Se presenta finalmente una comparación de los resultados obtenidos al entrenar la red con ambos conjuntos de datos creados de forma sintética.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.