Aplicación Web para la Implementación de un Modelo Basado en Redes Neuronales Convolutivas (Yolo) para la Clasificación y Conteo de  Vehículos

Jara Huaman, Carlos Daniel

Ver/

Jara__HC.pdf (3.554Mb)

Jara_HC_REPO.pdf (551.3Kb)

Jara_HC_AUTO.pdf (326.4Kb)

Fecha

2026-03-02

Autor

Jara Huaman, Carlos Daniel

Metadatos

Mostrar el registro completo del ítem

Resumen

Esta investigación tiene como matiz principal la implementación de una aplicación web basada en un modelo de aprendizaje profundo (Deep Learning) utilizando Redes Neuronales Convolutivas (YOLO) tanto como clasificar y contar clases de vehículos. Este enfoque busca automatizar el proceso de recopilación de datos vehiculares, superando las limitaciones de los métodos manuales convencionales que son laboriosos, propensos a errores humanos y poco eficientes para el análisis a gran escala. En la actualidad, la contabilización vehicular se realiza mayormente mediante procedimientos manuales que requieren una gran inversión de tiempo y no permiten una respuesta en tiempo real. Esta limitación resulta problemática en entornos urbanos congestionados, donde la gestión eficiente del tráfico es fundamental para optimizar la señalización, la iluminación y otras infraestructuras viales. Por tanto, surge la necesidad de desarrollar un sistema automatizado que brinde precisión y rapidez en la obtención de datos. Para abordar este problema, nos centramos en el desarrollo de una aplicación web acompañado de un módulo backend basado en un modelo preentrenado YOLO (You Only Look Once) para la detección, clasificación y conteo de vehículos según las categorías establecidas por el Ministerio de Transportes y Comunicaciones. El desarrollo del sistema se basa en cinco etapas: La creación de un conjunto de imágenes categorizadas, el procesamiento de estas imágenes, el entrenamiento de modelo custom, la evaluación del desempeño, y el desarrollo del aplicativo web con Python. A partir de las pruebas realizadas en distintas carreteras del país, se concluye que el desempeño del sistema depende en gran medida de factores como el entrenamiento del modelo y la correcta configuración en campo. Para lograr una detección más estable en el tiempo, es recomendable entrenar con conjuntos de datos que incluyan condiciones reales de ruido visual, así como optimizar la ubicación de la línea de conteo según la posición de la cámara. En conjunto, los resultados obtenidos en distintos escenarios muestran niveles de precisión del conteo consistentemente altos, lo que respalda la viabilidad de la solución en aplicaciones reales.

The primary focus of this research is the implementation of a web application based on a Deep Learning model using Convolutional Neural Networks (YOLO) to both classify and count various types of vehicles. This approach aims to automate the vehicular data collection process, overcoming the limitations of conventional manual methods which are labor-intensive, prone to human error, and inefficient for large-scale analysis. Currently, vehicle counting is mostly conducted through manual procedures that require a significant time investment and do not allow for real-time responses. This limitation is particularly problematic in congested urban environments, where efficient traffic management is essential for optimizing signaling, lighting, and other road infrastructure. Consequently, there is a pressing need to develop an automated system that provides both precision and speed in data acquisition. To address this problem, we focus on the development of a web application paired with a backend module based on a pre-trained YOLO (You Only Look Once) model for the detection, classification, and counting of vehicles according to the categories established by the Ministry of Transport and Communications. The system development is structured into five stages: the creation of a categorized image dataset, image processing, custom model training, performance evaluation, and the development of the web application using Python. Based on tests conducted on various highways across the country, it is concluded that the system's performance largely depends on factors such as model training and proper field configuration. To achieve more stable detection over time, it is recommended to train the model with datasets that include real-world visual noise conditions, as well as to optimize the location of the counting line based on the camera's position. Overall, the results obtained across different scenarios demonstrate consistently high levels of counting accuracy, supporting the viability of this solution for real-world applications.

URI

https://hdl.handle.net/20.500.12893/16462

Colecciones

Ingeniería de Sistemas [170]

Excepto si se señala otra cosa, la licencia del ítem se describe como info:eu-repo/semantics/openAccess