Recientemente, los co-ips del grupo de investigación I4Labs han publicado un artículo en la revista IEEE Access titulado «RGB-D-Fusion: Image Conditioned Depth Diffusion of Humanoid Subjects».
Referencia:
S. Kirch, V. Olyunina, J. Ondřej, R. Pagés, S. Martín and C. Pérez-Molina, «RGB-D-Fusion: Image Conditioned Depth Diffusion of Humanoid Subjects,» in IEEE Access, vol. 11, pp. 99111-99129, 2023, doi: 10.1109/ACCESS.2023.3312017.
En este artículo presentamos RGB-D-Fusion, un modelo probabilístico de difusión de denoising condicional multimodal para generar mapas de profundidad de alta resolución a partir de imágenes monoculares RGB de baja resolución de sujetos humanoides. RGB-D-Fusion primero genera un mapa de profundidad de baja resolución utilizando un modelo probabilístico de difusión de denoising condicionado por imagen y luego aumenta la resolución del mapa de profundidad utilizando un segundo modelo probabilístico de difusión de denoising condicionado por una imagen RGB-D de baja resolución.
Además, introducimos una técnica de aumento novedosa, el aumento de ruido de profundidad, para incrementar la robustez de nuestro modelo de super-resolución.
About the author