Secciones
Referencias
Resumen
Servicios
Descargas
HTML
ePub
PDF
Buscar
Fuente


CNN–LSTM con mecanismo de atención suave para el reconocimiento de acciones humanas en videos
Revista Elektron, vol.. 5, núm. 1, 2021
Universidad de Buenos Aires

Procesamiento de señales

Revista Elektron
Universidad de Buenos Aires, Argentina
ISSN: 2525-0159
Periodicidad: Semestral
vol. 5, núm. 1, 2021

Resumen: Términos de Indexación Texto Completo Navegador Por número Por autor Por título Por secciones Sobre los autores Carlos Ismael Orozco http://di.unsa.edu.ar Universidad Nacional de Salta Argentina Lic. en Análisis de Sistemas. Universidad Nacional de Salta (2013). Investigador Categoría V (Ingenier\'ia) de acuerdo a la Secretaría de Políticas Universitarias SPU. Actualmente Doctorando en Ciencias de la Computación – Universidad de Buenos Aires. Argentina. Grupo de Investigación Procesamiento de Imágenes y Visión por Computadora. Entre sus áreas de interés se destacan el procesamiento de imágenes y redes neuronales profundas. Se desempeña como Jefe de Trabajos Prácticos en el Departamento de Informática. Universidad Nacional de Salta. María Elena Buemi Departamento de Computación. Universidad de Buenos Aires. Argentina Julio Jacobo Berlles Departamento de Computación. Universidad de Buenos Aires.CNN--LSTM con Mecanismo de Atención Suave para el Reconocimiento de Acciones Humanas en Videos Ayuda de la revista Sitio Principal Acerca de Login Registrarse Buscar Actual Archivos Anuncios Sitio Principal > Vol 5, No 1 (2021) > Orozco CNN–LSTM con mecanismo de atención suave para el reconocimiento de acciones humanas en videos Carlos Ismael Orozco, María Elena Buemi, Julio Jacobo Berlles El reconocimiento de acciones en videos es actualmente un tema de interés en el área de la visión por computador, debido a potenciales aplicaciones como: indexación multimedia, vigilancia en espacios públicos, entre otras. Los mecanismos de atención se han convertido en un concepto muy importante dentro del enfoque de aprendizaje profundo, su operación intenta imitar la capacidad visual de las personas que les permite enfocar su atención en partes relevantes de una escena para extraer información importante. En este artículo proponemos un mecanismo de atención suave adaptado para degradar la arquitectura CNN–LSTM. Primero, una red neuronal convolucional VGG16 extrae las características del video de entrada. Para llevar a cabo las fases de entrenamiento y prueba, usamos los conjuntos de datos HMDB-51 y UCF-101. Evaluamos el desempeño de nuestro sistema usando la precisión como métrica de evaluación, obteniendo 40,7 % (enfoque base), 51,2 % (con atención) para HMDB-51 y 75,8 % (enfoque base), 87,2 % (con atención) para UCF-101.

CNN–LSTM con mecanismo de atención suave para el reconocimiento de acciones humanas en videos

El reconocimiento de acciones en videos es actualmente un tema de interés en el área de la visión por computador, debido a potenciales aplicaciones como: indexación multimedia, vigilancia en espacios públicos, entre otras. Los mecanismos de atención se han convertido en un concepto muy importante dentro del enfoque de aprendizaje profundo, su operación intenta imitar la capacidad visual de las personas que les permite enfocar su atención en partes relevantes de una escena para extraer información importante. En este artículo proponemos un mecanismo de atención suave adaptado para degradar la arquitectura CNN–LSTM. Primero, una red neuronal convolucional VGG16 extrae las características del video de entrada. Para llevar a cabo las fases de entrenamiento y prueba, usamos los conjuntos de datos HMDB-51 y UCF-101. Evaluamos el desempeño de nuestro sistema usando la precisión como métrica de evaluación, obteniendo 40,7 % (enfoque base), 51,2 % (con atención) para HMDB-51 y 75,8 % (enfoque base), 87,2 % (con atención) para UCF-101.



Buscar:
Ir a la Página
IR
Modelo de publicación sin fines de lucro para conservar la naturaleza académica y abierta de la comunicación científica
Visor de artículos científicos generados a partir de XML-JATS4R