Aplicación Web para la Implementación de un Modelo Basado en Redes Neuronales Convolutivas (Yolo) para la Clasificación y Conteo de Vehículos
Resumen
Esta investigación tiene como matiz principal la implementación de una aplicación web
basada en un modelo de aprendizaje profundo (Deep Learning) utilizando Redes
Neuronales Convolutivas (YOLO) tanto como clasificar y contar clases de vehículos. Este
enfoque busca automatizar el proceso de recopilación de datos vehiculares, superando las
limitaciones de los métodos manuales convencionales que son laboriosos, propensos a
errores humanos y poco eficientes para el análisis a gran escala.
En la actualidad, la contabilización vehicular se realiza mayormente mediante
procedimientos manuales que requieren una gran inversión de tiempo y no permiten una
respuesta en tiempo real. Esta limitación resulta problemática en entornos urbanos
congestionados, donde la gestión eficiente del tráfico es fundamental para optimizar la
señalización, la iluminación y otras infraestructuras viales. Por tanto, surge la necesidad
de desarrollar un sistema automatizado que brinde precisión y rapidez en la obtención de
datos.
Para abordar este problema, nos centramos en el desarrollo de una aplicación web
acompañado de un módulo backend basado en un modelo preentrenado YOLO (You Only
Look Once) para la detección, clasificación y conteo de vehículos según las categorías
establecidas por el Ministerio de Transportes y Comunicaciones. El desarrollo del sistema
se basa en cinco etapas: La creación de un conjunto de imágenes categorizadas, el
procesamiento de estas imágenes, el entrenamiento de modelo custom, la evaluación del
desempeño, y el desarrollo del aplicativo web con Python.
A partir de las pruebas realizadas en distintas carreteras del país, se concluye que el
desempeño del sistema depende en gran medida de factores como el entrenamiento del
modelo y la correcta configuración en campo. Para lograr una detección más estable en
el tiempo, es recomendable entrenar con conjuntos de datos que incluyan condiciones
reales de ruido visual, así como optimizar la ubicación de la línea de conteo según la
posición de la cámara. En conjunto, los resultados obtenidos en distintos escenarios
muestran niveles de precisión del conteo consistentemente altos, lo que respalda la
viabilidad de la solución en aplicaciones reales. The primary focus of this research is the implementation of a web application based on a
Deep Learning model using Convolutional Neural Networks (YOLO) to both classify and
count various types of vehicles. This approach aims to automate the vehicular data
collection process, overcoming the limitations of conventional manual methods which are
labor-intensive, prone to human error, and inefficient for large-scale analysis.
Currently, vehicle counting is mostly conducted through manual procedures that require
a significant time investment and do not allow for real-time responses. This limitation is
particularly problematic in congested urban environments, where efficient traffic
management is essential for optimizing signaling, lighting, and other road infrastructure.
Consequently, there is a pressing need to develop an automated system that provides both
precision and speed in data acquisition.
To address this problem, we focus on the development of a web application paired with a
backend module based on a pre-trained YOLO (You Only Look Once) model for the
detection, classification, and counting of vehicles according to the categories established
by the Ministry of Transport and Communications. The system development is structured
into five stages: the creation of a categorized image dataset, image processing, custom
model training, performance evaluation, and the development of the web application
using Python.
Based on tests conducted on various highways across the country, it is concluded that the
system's performance largely depends on factors such as model training and proper field
configuration. To achieve more stable detection over time, it is recommended to train the
model with datasets that include real-world visual noise conditions, as well as to optimize
the location of the counting line based on the camera's position. Overall, the results
obtained across different scenarios demonstrate consistently high levels of counting
accuracy, supporting the viability of this solution for real-world applications.
Colecciones
- Ingeniería de Sistemas [165]







