Seleccionar página

Qué es OCR y cómo optimiza la validación de identidad

por | Verificación de Identidad

El OCR es un mecanismo que permite el reconocimiento óptico de los caracteres que contienen los documentos de identidad, de manera que estos caracteres pueden ser facilmente reconocibles por un dispositivo.

Como sabrás, los documentos de identidad son esenciales para acreditar nuestros datos personales y nuestra identidad. Si no existiesen no podríamos acreditar quiénes somos ni identificarnos al realizar ciertos trámites.

Son considerados documentos públicos, oficiales, personales e intransferibles que permiten a las personas mayores de edad tener capacidad de obrar. Sin embargo, estos documentos no han sido siempre los mismos y como muchos otros, el DNI español ha sufrido cambios con el fin de adaptarse a los nuevos tiempos. En medio de estos cambios, encontramos la introducción del sistema OCR que definíamos la inicio.

Es posible que no conozcas casi nada sobre la tecnología OCR ni como se utiliza para extraer los datos recogidos en los documentos de identidad. Por eso, en este artículo te contamos que es OCR, su funcionamiento, aplicaciones y como Mobbeel hace uso de está tecnología a través de MobbScan.

 

Qué es la tecnología OCR y qué significan sus siglas

Las siglas OCR provienen del inglés y se traducen como Optical Character Recognition. Este concepto es también conocido como reconocimiento óptico de caracteres o simplemente reconocimiento de caracteres en español.

Antes de conocer qué es el reconocimiento óptico de caracteres, es preciso desglosar sus siglas para que comprendas mejor a qué hace referencia. Así:

O: Óptico

Las personas utilizamos los ojos y las conexiones neuronales para reconocer imágenes y leer documentos. Por el contrario, los ordenadores utilizan una cámara de escáner para reconocerlos, considerando a ambos un conjunto de píxeles.

C: Caracteres

Los caracteres son unidades de información, símbolos o grafemas, es decir, son las composiciones de píxeles, curvas y líneas que forman los dígitos escritos y las letras del alfabeto.

R: Reconocimiento

El reconocimiento de los caracteres se lleva a cabo una vez que el escáner óptico digitaliza la imagen.

Cuando los caracteres han sido escaneados, el software OCR reconoce las letras y dígitos de la imagen y las convierte en palabras.

Seguramente ya te hayas hecho una idea de lo que es OCR, pero es importante profundizar un poco en más su significado.

De este modo, la tecnología OCR convierte una imagen de texto en un formato de texto que pueda ser leído por un ordenador. 

Sin embargo, para que se reconozca los caracteres y sea capaz de transcribirlos en formato digital, el sistema debe haber aprendido e interiorizado los caracteres que va a reconocer con antelación. En otras palabras, este sistema analiza documentos e imágenes en distintos soportes y formatos y reconoce en ellos caracteres que coinciden con la información que tiene almacenada.

 

¿Cómo funciona el sistema OCR?

El sistema de reconocimiento de caracteres se lleva a cabo a través de dos etapas:

  1. Procesado de imagen: consiste en modificar la imagen de entrada para eliminar todos aquellos elementos que puedan afectar al reconocimiento de los caracteres. Normalmente, supone un proceso de umbralización (para convertir la imagen en binaria), limpieza y eliminación de ruido y, finalmente, transformaciones morfológicas para mejorar el trazado, sobre todo en el caso de reconocimiento de texto manuscrito.
  2. Clasificación: en esta etapa se clasifican los caracteres mediante técnicas de reconocimiento de patrones. Existen distintas clasificaciones, algunas muy sencillas basadas en comparación mediante métodos geométricos o estadísticos y otras más avanzadas que utilizan técnicas en aprendizaje automático.

Beneficios de la tecnología OCR para verificación de identidad

El OCR software ofrece diversos beneficios para la verificación de identidad, entre ellos:

  • Reducción de errores: al automatizar la entrada de datos, el OCR reduce la posibilidad de errores de entrada manual, garantizando una mayor precisión y fiabilidad en la verificación de identidad.
  • Eficiencia: esta tecnología acelera el proceso de verificación al permitir que los documentos se procesen de manera rápida y eficiente. Esto se traduce en que las empresas pueden verificar más identidades en menos tiempo.
  • Mejora de la experiencia del usuario: este sistema solo necesita que los usuarios tomen una foto de su DNI con su dispositivo móvil y lo envíen para su verificación. Por lo que no es necesario que completen largos formularios, mejorando significativamente la UX.
  • Mayor seguridad: ofrece mayores niveles de seguridad al verificar la autenticidad del documento de identidad. Esto reduce el riesgo de fraude y protege a las organizaciones y usuarios de amenazas a la seguridad.

Aplicaciones del sofware OCR para documentos de identidad

El software de reconocimiento de caracteres se emplea para diferentes fines. Destacan aquellas actividades que incluyen la extracción y verificación de datos. A continuación, puedes encontrar los casos de uso más representativos:

Digitalización de documento de identidad

Muchas empresas llevan a cabo campañas de actualización de los DNI de sus clientes. El sistema OCR facilita el proceso de digitalización, ya que a través de la web se escanean los documentos, se validan y se extrae la información mediante OCR de una forma rápida y eficiente, ahorrando tiempo y esfuerzos.

Verificación de edad

Los menores de edad tienen prohibido el acceso a los juegos de azar y a los sites de apuestas online. Los operadores del juego tienen que controlar que los usuarios superan los dieciocho años, por lo que es preciso verificar y validar su identidad en los procesos de alta. Para llevar a cabo este proceso, se escanea el documento de identidad y se extraen los datos necesarios mediante el sistema de reconocimiento óptico de caracteres.

Extracción de la información de un documento de identidad de forma digital y automática

Una vez que tenemos un documento o una imagen de un documento de identidad válido escaneado, se extraen todos los campos de información junto con la foto del DNI mediante OCR.

Por poner un ejemplo, muchos de nuestros clientes envían los documentos de identidad escaneados a la API de MobbScan para que la tecnología recorte las imágenes capturadas del DNI y extraiga toda la información del documento por OCR para posteriormente integrarla en los sistemas del cliente.

 

Tipos de documentos automáticamente verificables mediante OCR

De acuerdo con el documento 9303 de la OACI, hay tres tipos principales de documentos estandarizados cuyos datos se codifican mediante un sistema de reconocimiento óptico de caracteres (OCR).

Documento de viaje tamaño 1 (TD1)

El TD1 se utiliza sobre todo en tarjetas de identidad. El espacio en este documento es limitado, por lo que la ZLM se mueve hacia atrás, siendo necesario capturar anverso y reverso para extraer la información y validarla. La MRZ del documento de viaje 1 posee tres líneas y cada línea tiene a su vez treinta caracteres. El país emisor puede añadir contenido adicional a la MRZ.

Documento de viaje tamaño 2 (TD2)

El tamaño del TD2 es inferior al del documento de viaje 1. Una de sus ventajas es que la MRZ se encuentra en el anverso, por lo que solo es necesario escanear la parte delantera. La MRZ en este documento se compone de dos líneas con un total de 35 caracteres.

Documento de viaje tamaño 3 (TD3)

El documento TD3 es el que se utiliza en la mayoría de los pasaportes. Este documento posee toda la información relevante en el anverso, por lo que solo es necesario el escaneo de esta parte del documento. Lo anterior agiliza el proceso de control de pasaportes y la extración de datos por parte de soluciones como MobbScan. La MRZ en este documento está formada por dos líneas y 44 caracteres.

 

¿Cómo extrae MobbScan la información a través de OCR?

MobbScan extrae todos los datos que recoge un documento identificativo a través del escaneo óptico de caracteres con el fin de agilizar y optimizar la validación de la identidad.

La tecnología avanzada de Mobbeel escanea el documento, detectando y leyendo en tiempo real la información que se encuentra en la zona de lectura mecánica o MRZ. Tras extraer el texto, lo descodifica y lo convierte en información legible por el usuario.

El escaneo se puede llevar a cabo de dos formas en base a las necesidades y exigencias del cliente. Así, encontramos:

  • Escaneo exclusivo de MRZ: donde la tecnología extrae la información que incluye la zona de lectura mecánica del documento de identidad o pasaporte con el que estemos trabajando. La MRZ contiene todos los datos básicos de una persona (nombre, fecha de nacimiento, fecha de caducidad, país emisor, número de documento, etc.) y en ella existen dígitos de control que permiten asegurar que los datos que se extraen son correctos. Para ello, es esencial que el documento incluya una MRZ que cumpla con el estándar internacional 9303 ICAO.
  • Escaneo completo del documento de identificación oficial: permite extraer información adicional como la dirección y el equipo emisor. Este tipo de escaneo permite hacer validaciones para comprobar que los datos entre ambas caras del documento coinciden.

La tecnología OCR de Mobbeel trabaja de forma fiable y precisa con el objetivo de cumplir con la normativa Know Your Customer tanto con documentos que cumplen con ICAO 9303 (documentos de viajes) como con documentos que no cumplen este estándar como el carnet de conducir europeo.

 

Si quieres saber más sobre nuestra tecnología OCR y cómo la utilizamos en MobbScan para escanear documentos de identidad, contacta con nosotros a través de nuestro formulario de contacto.

DOSIER PRODUCTO

Descubre nuestra solución de verificación de identidad

Verifica la identidad de tus clientes en segundos a través del escaneo y validación de documentos de identidad y matching biométrico facial con prueba de vida.