1. Casos de Éxito
  2. Proyecto de Reconocimiento de Placas (LPR)

Historia de Éxito

 

Proyecto de Reconocimiento de Placas (LPR)

Lectura de Placas

Como equipo para implementar una solución de lectura de placas vehiculares o LPR por sus siglas en inglés “license plate recognition”, a manera simple se requiere una combinación de seis elementos. Dos de software y cuatro de hardware de video vigilancia. Del software son: (1) el VMS “video management system” y (2) el algoritmo. Del hardware son: (3) el lente, (4) la cámara de seguridad, (5) su carcasa y (6) el iluminador de luz blanca o de infrarrojos.

En el mercado podrás encontrar equipos que te incluyen estos seis elementos en un solo modulo. Es software y hardware dos en uno como el producto de la foto de abajo. Es una cámara de seguridad en el cual tiene integrado el software, dos ópticas y el iluminador infrarrojo, todo dentro de una carcasa.

También hay la forma de integrar la solución de LPR por software y hardware por separado. El hardware si lo reúnes de forma profesional se venden por separado: lente, cámara de seguridad tipo profesional o box, carcasa e iluminador. Esta es la forma que más recomendamos para implementar un proyecto de LPR.

O puedes conseguir un hardware más económico en forma de cámaras tipo bala o domo, el cual integra la óptica, el sensor de imagen, iluminadores infrarrojos, todo dentro de una carcasa. No recomendamos hacer el LPR con este hardware ya que las ópticas integradas a estas cámaras bala o domo no tienen el pulido y calidad crítica requerida para que el software saque su máximo rendimiento.  

En el software, hay de fabricante de VMS que no tienen algoritmos propios de LPR, pero integran el software de otro fabricante especializado en crear video analíticos.

También hay fabricantes de VMS que no dependen de un tercero y tienen sus algoritmos propietarios.

El reto para los fabricantes de algoritmos de LPR es poder distinguir los números y letras de las placas vehiculares en los que tienen dibujos de fondo. Si el software que usted escogió lo puede distinguir sin problema es buen indicio que ha escogido un software de buena calidad.

 

Dependiendo de cada fabricante de algoritmo para LPR se pide entre 1.5 pixeles hasta 7 pixeles de densidad por el ancho de los caracteres. En México las letras o números de las placas vehiculares tienen 6 mm de ancho para los coches y de 4mm para las motos.

 

En promedio se pide 2.8 pixeles por ancho del carácter. Para facilitar los cálculos se saca el factor por centímetro. Por regla de tres, si se pide 2.8 pixeles por 6mm que tiene el ancho del carácter de un coche, el factor por un centímetro es de 4.7 pixeles.

Un vez sabiendo el factor requerido de densidad de pixeles para que funcione el algoritmo de LPR se puede saber los pixeles requeridos por carril. Como un carril tiene 3 metros, 300 centímetros multiplicado por 4.7 pixeles por centímetro da que se necesita 1,410 pixeles por carril.

Por resolución existen cámaras de seguridad desde 1 mega pixel hasta de 30 mega pixeles (MP). Normalmente para LPR se usan las de 2MP que su sensor de imagen tiene 1,920 pixeles a lo horizontal.

Con una cámara de 2MP cumples perfectamente bien el requisito de densidad de pixeles por un carril.

Para ser más exactos con una cámara de 2MP es como poder ver un carril completo y un pedacito del segundo carril, pero no los dos carriles.

 

Por cuestiones de cotizar una solución de LPR más económico para el cliente, algunos integradores de sistemas abren la toma de un carril por cámara a dos carriles, dando como resultado que diluyen la densidad de pixeles requeridos por el algoritmo. Esto hace que los números y letras de las placas vehiculares no se marquen bien y queden un poco difuminado haciendo que al software le cueste trabajo estar seguro de los resultados, inclusive da muchos errores. En el ejemplo de abajo, la placa decía “551-UAY” pero el software confundió el “1” uno por un “7” siete y registró “557-UAY”.

La solución es cerrar la toma a un carril por cámara. De esta forma los números y letras se marcan más grueso, esto le ayuda al software a que no tenga dudas al determinar la lectura.

 

Habrán integradores de sistemas que digan es mejor usar cámaras de 6MP para cubrir dos carriles y la de 12MP para tres carriles, pero si hacen eso, ahora tendrán que considerar la capacidad de procesamiento de los servidores y complica las cosas, por lo que recomendamos que con una cámara hasta de 3MP es más que suficiente y hacer las tomas a un carril por cámara.

Para demostrar que siempre es mejor hacer las tomas a un carril por cámara hicimos una prueba colocando una cámara a 44 metros de distancia usando un lente de distancia focal a 100mm y una cámara de seguridad de 2MP.

Se usó un software que marca el resultado de la lectura de LPR en su interface con letras negras cuando el algoritmo está seguro al cien porciento. Se cerró la toma a un carril y todos los resultados estuvieron correctos y en negrita.

Luego abrimos la toma a dos carriles por cámara. El software seguí leyendo las placas de los vehículos pero en los resultados comenzaron a aparecer letras azules que significa que el software tiene duda y letras en rojo que no tiene seguridad. En resumen la efectividad baja.

 

Una vez llegando a la conclusión que lo mejor es colocar la solución de LPR de una cámara por carril. El primer reto es el ángulo desde donde se hace la toma a tal forma que no se tapen las placas de coches que estén en hilera. En el ejemplo de abajo se perciben cuatro coches, pero sólo se ve la placa de uno y por la lejanía de la toma el software no da resultados con alto grado de efectividad.

Para que el software funcione se pide que la toma sea de frente con un ángulo de cero grados. Cuando esto no es posible lo más ladeado para una toma a lo vertical es hasta 40 grados y a lo horizontal hasta 30 grados.

A continuación la historia de un integrador de sistemas que llegó a la conclusión a base de prueba y error que usar el lente M118VG1250IR del fabricante japonés de lentes para cámaras de seguridad marca TAMRON en una cámara tipo box o profesional es lo más efectivo para sacar el máximo provecho a un software de LPR.

 

Las cámaras de vigilancia tipo domo o bala no son adecuados para proyectos de LPR por su baja calidad en nitidez, sin embargo, el integrador tomo la decisión de usarlas en un proyecto por razones de costos, ya que una cámara domo o bala cuestan en promedio la mitad de una cámara profesional o tipo box.

Una de las razones principales por las que dichas cámaras son más económicas es precisamente por la ÓPTICA, ya que la calidad de los lentes es 6 veces menor comparada con una tipo box, que cuenta con un lente de montura C/CS fabricados especialmente para uso profesional.  Otra razón es porque todas las mejoras tecnológicas, el fabricante de cámaras decide incluirlas en las de tipo box por su versatilidad de poderle intercambiar los lentes.

Existen casos en los que la imagen tomada con una cámara tipo domo de una placa vehicular que incluye la letra M puede parecer una W.

Si existe duda a simple vista sobre el monitor para cuando la información llega al software de reconocimiento de placas vehiculares existe una gran probabilidad de generar información errónea. Este tema se puede resolver al implementar una cámara tipo box que cuenta con mejor nitidez, ya que las ópticas de montura C/CS tienen en general mejor calidad que las board mount integradas en las cámaras tipo domo o bala.

En el caso que estamos tratando, el integrador tenía un escenario en donde tenía que hacer las tomas mirando hacia tres carriles desde un arco a una distancia de 19 metros. Para ello, abrió la toma a un ancho de 9 metros para lograr abarcar en una sola toma los tres carriles, pero el video analítico no hacía ninguna lectura, ya que no tenía la densidad de pixeles suficientes para hacer funcionar el software.

 

Entonces recurrió al fabricante de software y este le recomendó cerrar la toma que originalmente era de 9 metros de ancho a tan solo 3 metros de ancho, de tres carriles a un solo carril, y de esta forma darle a la toma la densidad de pixeles suficiente para hacer correr el software de LPR.

 

Se encontró con el inconveniente de que las cámaras tipo domo que escogió tenían distancia focal de 3 a 9 milímetros, pero en su caso particular el proyecto requería una distancia focal en un rango de 40 a 50 milímetros.

 

Cabe mencionar que el zoom óptico se mide en distancia focal y existen en el mercado opciones que van desde 1 milímetro hasta 1,600 milímetros, que traducido a una toma de 2 metros de ancho es como captar imágenes desde distancias de 30 centímetros hasta 520 metros.

La distancia focal es la distancia que hay entre el plano focal del sensor de imagen dentro de la cámara hasta el punto nodal posterior sobre el eje óptico. En las fichas técnicas vienen señalados como “f=”. Existen lentes con distancias focales fijas y las que son varifocales. Para lectura de placas vehiculares y de reconocimiento facial se recomienda usar el lente varifocal de f=12mm a 50mm, modelo M118VG1250IR, por su versatilidad para abrir y cerrar o acercar y alejar las tomas a distancias entre 1 metro hasta 24 metros de lejanía, el cual cubre adecuadamente la mayoría de los escenarios posibles de LPR considerando mirar un ancho de 3 metros.

 

La cámara tipo bala que usaba venía con distancia focal de 3mm hasta 9mm, que traducido a tomas con ancho de 3 metros, es como alcanzar a ver desde 1.5 hasta 4 metros de distancia. Pero en el caso de este proyecto las necesidades de captura de imagen variaban dependiendo de la locación, a  tomas que requerían distancias desde 7 metros hasta 19 metros, lo que significa tener que contar con una cámara con distancia focal de 15 milímetros a 40 milímetros.

La opción entonces era intercambiar lentes para lograr la distancia requerida.

 

Sin embargo, a las cámaras domo o bala no se les pueden cambiar los lentes pues están integrados dentro de la cámara.

A diferencia de las tipo box que usan montura C/CS a las que SI es viable cambiar el lente.

 

Las cámaras de vigilancia a las que los lentes se les pueden intercambiar por una de mayor o menor distancia focal, están las cámaras y lentes con monturas C y de CS, desenrroscables.

 

Por no poder cerrar la toma a 3 metros desde una distancia de 19 metros con una cámara tipo domo, el integrador tuvo que desechar el modelo que contempló originalmente.

Y sustituirla por una cámara tipo box. La que ocupó fue de 1/3”, de 2 mega pixeles con IR infrarrojo para tener función de día y noche.

Hay cámaras que tienen sensores de imágenes de 1/3” y las de 1/2". En resoluciones que van de 1 megapixel hasta de 16 megapixeles en monturas de C/CS, y en las cámaras de montura fotográfica que son de full frame de 35mm, monturas EF (Canon) o E (Sony) las hay desde 8 megapixeles hasta 30 megapixeles. 

 

El integrador necesitaba un lente con distancia focal de 15mm a 40mm y consiguió un lente varifocal de 5mm a 50mm del fabricante de lentes “F” el cual cubría su requerimiento de distancia focal. Colocó el lente en la cámara y comenzó con la grabación.

Como referencia, en el mundo existen aproximadamente 40 fabricantes dedicados a manufacturar lentes para cámaras de seguridad, en cuanto a fabricantes de cámaras se dice que hay aproximadamente 400.

Hay una página on-line llamada “asmag” que lista los mejores 50 fabricantes de equipos de seguridad. La lista del 1 al 50 se llama el “asmag rankings 50 security” que incluye una mezcla de fabricantes de cámaras, control de acceso, incendio, etc.

De los fabricantes de lentes en los últimos 6 años, únicamente el fabricante japonés de lentes Tamron se clasifica en promedio dentro de las mejores 20 empresas por su volumen de ventas y ninguno de sus competidores ha logrado colocarse en los top 50. Tamron en el 2016 estuvo listado en el número 18, el cual es un gran logro para un fabricante de lentes considerando lo barato que son los lentes.

Con el nuevo lente, el integrador tenía que comprobar su calidad y en su primer ejercicio dejo pasar 24 horas de grabación. Al día siguiente tomó un muestreo de 100 coches. Lectura de placas vehiculares que pasaron durante el día y otros tanto durante la noche. Verificó uno por uno los registros. Hizo un zoom digital a las placas para leerlas con sus propios ojos y las cotejaba contra lo que el software había interpretado. Comparando lo que verdaderamente eran los datos de las placas, se dio cuenta que sólo el 40% estaba acertada, y con esta efectividad de coincidencia tan baja su cliente no le iba a aceptar su sistema de LPR.

 

El problema era que algunas letras y números habían sido deformados por la mala calidad en el pulido del lente, por lo que el sistema de LPR entregaba información que no coincidía, por ejemplo, las “N” el software las leía como “H”, las “K” como “X”, la “W” por “M”, la “B” por “8” y muchos casos más.

 

Nuevamente el integrador contactó al fabricante de software para reclamarle de que su producto no daba el 100% de efectividad. El fabricante del software le pidió que volviera a realizar el ejercicio dándole instrucciones sobre los ángulos correctos de las tomas.

El integrador realizó una segunda grabación y en comparación con la primera vez, la toma mejoró de un 40% a un 50% por los adecuados declives de las tomas, pero aun así no llegaba al 100%.

Ahora llamó al fabricante de la cámara para reclamarle que con su equipo no podía conseguir el 100% y éste lo asesoró en hacer ajustes en la configuración. En su tercer intento logró subir la efectividad de la lectura de LPR hasta un 60%, pero aun así no era lo suficiente bueno para él, ya que deseaba llegar a un 100% o mínimo a un 95% para estar convencido.

Para el cuarto intento pensó que quizá el “truco” para mejorar estaba en la calidad del lente, así que consiguió lentes de otros dos fabricantes, la marca “C” y la “T”. En el cuarto intento hizo pruebas con dichos lentes a fin de comparar las imágenes obtenidas con los lentes originales, pero aun así la “N” se interpretaba como “H”. Para intentar resolver todavía dedicó 3 horas más a hacer ajustes finos de enfoque, pero el error continuaba.

Este tipo de deformaciones las ocasiona la mala calidad del pulido de la óptica o del tipo de esfericidad. Normalmente todos los lentes son tipo esféricos. Las cámaras tipo domo y bala de entrada son todos tipo esféricos, y los lentes de montura C/CS mientras no digan que son lo contrario también son de tipo esféricos.

 

El integrador aparte del problema de la “N” que se interpretaba como “H” durante el día, detectó que durante la noche existían dos problemas adicionales. Uno era que le aparecía frecuentemente el fenómeno del “ruido”, el cual consiste en que se ven miles de diminutos puntos blancos en la imagen cuando el escenario es muy oscuro, por lo que cambió el modelo de la cámara por otra de un sensor de imagen de mejor sensibilidad ante la obscuridad. Para el quinto intento, esto le había mejorado algo, pero aun así no se sentía satisfactoriamente liberado del fenómeno del ruido.

 

El ruido se ocasiona porque los sensores de imágenes al ser foto sensibles no reciben suficiente luz a través del lente, esta falta de luz la traducen en puntos blancos. La competencia entre fabricantes de cámaras es conseguir sensores de imágenes cada vez más sensibles a la obscuridad, que en vez de grabar en blanco y negro entre las 9pm a 7am, pueda llegar a captar a color durante toda la noche. En situaciones extremas de oscuridad se usan las cámaras térmicas, pero la idea es que algún día se puedan hacer tomas las 24 horas con cámaras de luz visible.

 

Para el sexto intento, decidió combatir el problema del ruido colocando iluminación blanca. Al iluminar de frente molestaba a la vista de los choferes, decidió cambiar la ubicación de la toma de hacerlas de frente lo hizo desde atrás, para hacer las tomas a las placas traseras. El ruido mejoró bastante, pero aun así se les escapaba algunas tomas que generaban ruido. Un inconveniente era que muchos coches traen las placas delanteras, pero a algunas les hace falta la trasera. 

 

Por último, además del problema del ruido y las deformaciones de las letras de “N” por “H”, otro problema durante la noche era que cuando la cámara entraba en modo blanco y negro, en modo infrarrojo, las letras de las placas se veían tan borrosas que de plano a simple vista no se podían distinguir y por consiguiente el software desde las 9 pm hasta las 7 am no leía placas. Haciendo que sea una solución NO de 24 horas.

Para el séptimo intento, le llegó la “buena suerte” al integrador, un fabricante de video analíticos ruso le recomendó un lente del fabricante japonés “Tamron”, modelo M118VG1250IR con el cual había conseguido buenos resultados.
Consiguió el lente Tamron y mejoró la efectividad de un 60% con los lentes de las otras marcas a un 97% con el nuevo lente. Una mejora de un 37% simplemente por sustituir un lente a una de buena calidad.

Las bases científicas de la mejoría en ese momento no las sabía, pero vio que con el nuevo lente M118VG1250IR el software comenzó a leer las placas las 24 horas y la distorsión de las letras del “N” por una “H” había desaparecido. Ahora si el “N” era una “N” y la “H” una “H”. Después de investigar supo que el lente tenía una característica técnica llamado “aesférico”, que es un tipo de lente con un pulido que adelgaza los bordes dando como resultado un elemento aesférico. Para los fabricantes de lentes para cámaras de seguridad el chiste consiste en ver quien logra dar mejores terminados aesféricos.

De esta forma el lente mejoró la efectividad del software de LPR. Para el integrador lo curioso era de que todos los lentes que había probado anteriormente del fabricante “C”, “T” y “F” también eran aesféricos, y aunque en fichas técnicas se trataban de la misma categoría de lente, no tenían la misma calidad que la Tamron.

 

 

Los lentes aesféricos mejoran mucho la resolución. También generan menos “flare” un fenómeno que hace que la toma se vean opaco.
Aunque todos los lentes que había probado previamente, los de la marca “C”, “T” y “F” en sus fichas técnicas decían que algunos eran de 3 mega pixeles y otros de 5 mega pixeles. Durante la noche, en modo nocturno a infrarrojo, en donde las tomas se vuelen a blanco y negro. Por ejemplo, el lente de la marca “F” bajaba su resolución de 3 mega pixeles durante el día a 1 mega pixel durante la noche, su infrarrojo corregido era la razón por la cual durante la noche el LPR no funcionaba, ya que las letras se veían borrosas.

En cambio, hizo pruebas con el lente de Tamron modelo M13VG850IR de 3 mega pixeles, y vio que mantenía la misma resolución de 3 mega pixeles tanto de día como de noche, y por ende la solución se volvía de 24 horas.

Durante un año de estar persiguiendo proyectos de LPR este integrador originalmente usaba lentes Tamron de 1/3”, el M13VG850IR, para las cámaras de 1/3”, pero descubrió un “truco” que consistía en usar lentes de mayor diámetro como las de 1/2" o de 1/1.8” como lo es el Tamron modelo M118VG1250IR, el cual capta mayor cantidad de luz por ser de mayor diámetro y así este lente de 1/2” usarlas en las cámaras de 1/3”.

El resultado es que la imagen se ve más luminosa, casi el doble. Las cámaras con sensores de imágenes de 1/2" son más caros que las de 1/3”, pero los lentes en promedio cuestan de una tercera a una décima parte de la cámara, por lo que le salía más económico comprar cámaras de 1/3” y colocarle lentes de 1/2", pero si el cliente podía comprar y darse el lujo, metía cámaras de 1/2" y mejoraba aún más la solución.

 

En conclusión el integrador logró mejorar resultados usando el lente aesférico y varifocal Tamron M118VG1250IR, que sirven para cámaras hasta resoluciones de 8 mega pixeles, para tamaño de sensores de 1/1.8”, distancia focal de 12mm a 50mm, DC auto iris, F/1.4, IR infrarrojo corregido. Este es la mejor óptica para proyectos de LPR.