Saltar a contenido

Visión

Resumen

El sensor de visión Sentry2 integra una variedad de algoritmos de visión offline para reconocer objetos sin necesidad de conexión a la red, y el chip ESP8285-WiFi integrado permite realizar la función de reconocimiento de imágenes basada en la nube.

Listado

ID Nombre Resumen
1 Color Devuelve el valor R (rojo), G (verde) y B (azul) y la etiqueta de cada región. Hasta 25 regiones
2 Blob
(Burbuja)
Detectar un bloque de color específico. Admite la selección simultánea de bloques de color negro, blanco, rojo, verde, azul y amarillo
3 Apriltag Compatible con familia Apriltag 16H5, 25H9, 36H11. Hasta 25 etiquetas
4 Line Busca líneas y devuelve sus extremos y grados, admite entre 1 y 5 líneas
5 Learning Entrenar objetos y clasificarlos. Hasta 25 datos de modelo
6 Card Identificar patrones especiales de tarjetas, incluyendo 10 de tráfico, 9 de formas y 10 de números
7 Face Detección y reconocimiento facial, compatible con detección de máscaras, puede almacenar datos de 25 modelos
8 20Class Clasifica 20 objetos comunes, como gato, coche, persona, etc
9 QrCode Reconocimiento de un código QR sencillo
10 Custom Ejecutar algoritmos personalizados que se ejecutan en el chip ESP8285-WiFi integrado
11 Motion Determinar si hay áreas en movimiento en la imagen

Introducción detallada

ID:1 Color

  • Resumen
    El usuario puede establecer desde una hasta 25 regiones para el reconocimiento de colores y obtener los valores R (rojo), G (verde) y B (azul) y la etiqueta de cada región. Las coordenadas y el tamaño de cada región se pueden configurar.

ID:1 Color. Resumen

  • Etiqueta Color
    Una etiqueta de color es un número que se utiliza para representar un color:

ID:1 Color. Etiqueta Color

Etiqueta Nombre Etiqueta Nombre Etiqueta Nombre
1 Negro (Black) 2 Blanco (White) 3 Rojo (Red)
4 Verde (Green) 5 Azul (Blue) 6 Amarillo (Yellow)
0 Desconocido (Unknown)
  • Parámetros
    El usuario puede configurar las regiones para el reconocimiento:
Parámetro Resumen
1 Coordenada X del centro de la región
2 Coordenada Y del centro de la región
3 Ancho de la región
4 Alto de la región
5 Ninguno

ID:1 Color. Parámetros

Existen varios parámetros preestablecidos en la página de configuración de la interfaz de usuario:

Cuadrícula (X x Y): 1x1, 2x2, 3x3, 4x4, 5x5, 1x10, 2x10, 6x1, 6x2

Tamaño (Ancho x Alto): 2x2, 4x4, 8x8, 16x16, 32x32

NOTA:

Para representar un cuadrado en el sistema de coordenadas porcentuales, la anchura y la altura no son iguales, sino que se ajustan a la relación 3:4. Por ejemplo, si la anchura de un cuadrado es del 12%, entonces su altura h debe ser 12/3 × 4 = 16 %. En el sistema de coordenadas absolutas, los tamaños preestablecidos del área de reconocimiento son: 1x1, 2x3, 3x4, 6x8, 9x12.

  • Resultados
    En la pantalla aparecerá un recuadro rectangular que identifica el color, y un recuadro de cuatro esquinas que identifica el color desconocido.

ID:1 Color. Resultados

Resultado Resumen
1 R, valor del canal rojo con rango 0 a 255
2 G, valor del canal verde con rango 0 a 255
3 B, valor del canal azul con rango 0 a 255
4 Ninguno
5 Etiqueta de color

ID:2 Blob (bloques de color)

  • Resumen
    Busca un bloque de color determinado en una imagen y devuelve sus coordenadas y tamaño. Admite la detección de múltiples colores y múltiples resultados. La etiqueta de color tiene la misma definición que en Color vision.

ID:2 Blob. Resumen

  • Parámetros
    El usuario debe decidir primero qué color desea detectar. El ancho y el alto de la pieza de color mínima se pueden configurar para reducir los resultados falsos:
Resultado Resumen
1 Ninguno
2 Ninguno
3 Ancho mínimo
4 Alto mínimo
5 La etiqueta Color será detectada

ID:2 Blob. Parámetros

Existen varios parámetros preestablecidos en la página Interfaz de Usuario:

  • Nivel de rendimiento del algoritmo: Para seleccionar el rendimiento de la visión según los diferentes requisitos de la aplicación, entre 'Sensible', 'Equilibrado' y 'Preciso'.
  • Número máximo de bloques: Admite de 1 a 5 bloques para cada color.
  • Tamaño mínimo del bloque: En sistema de coordenadas absolutas: 2x2, 4x4, 8x8, 16x16, 32x32, 64x64, 128x128 píxeles. En sistema de coordenadas porcentuales: 1x1, 2x3, 3x4, 6x8, 9x12, 21x28, 42x56 %.
  • Color a detectar: Se muestra un icono de ojo abierto si la etiqueta de color está activada.
  • Resultados

ID:2 Blob. Resultados

Obtén los resultadfos:

Resultado Resumen
1 Coordenada X del centro del bloque
2 Coordenada Y del centro del bloque
3 Ancho del bloque
4 Alto del bloque
5 Etiqueta Color

ID:3 Apriltag (etiquetas)

Los AprilTag son marcadores visuales para detección e identificación mediante sistemas de visión artificial desarrollados por investigadores de la universidad de Michigan.

Tecnicamente su diseño fiducial y sistema de codificación se basan en lexicografia. El sistema se describe en los artículos enlazados en la web anterior.

Conceptualmente son similares a los códigos QR pero diseñados para cargas de datos mucho mas pequeñas (entre 4 y 12 bits), lo que permite una detección mejor a mayor distancia. Están diseñados para calcular su posición 3D precisa respecto a la cámara.

Se utilizan como marcadores fiduciales en robótica y otras aplicaciones.

Un marcador fiducial o solamente fiducial es un objeto colocado en el campo de visión de un sistema de imágenes que aparece en la imagen producida, para su uso como punto de referencia o medida.

Su nombre procede del laboratorio de robótica "April" de la Universidad de Michigan, siendo AprilTag una biblioteca y algoritmo que permite a un sistema identificar características en hasta seis grados de libertad.

  • Resumen
    Busca etiquetas AprilTag en una imagen, compatible con las familias de codificación 16H5, 25H9 y 36H11, y hasta 25 resultados. Debes decidir qué familia de codificación utilizar antes de habilitar esta función, y solo se puede procesar una familia.

ID:3 AprilTag. Resumen

Etiqueta

Etiquetas AprilTag soportadas

En el enlace puedes descargar imágenes de AprilTag y aprender mas sobre el tema.

  • Parámetros

ID:3 AprilTag. Parámetros

Existen varios parámetros preestablecidos en la página de configuración de la interfaz de usuario:

  • Nivel de rendimiento del algoritmo: Para seleccionar el rendimiento de la visión según los diferentes requisitos de la aplicación: 'Sensible (Sensitive)', 'Equilibrado (Balance)' y 'Preciso (Accurate)'.
  • Familia de codificación: Compatible con 16H5, 25H9 y 36H11.
  • Resultados

ID:3 AprilTag. Resultados

Obtén los resultadfos:

Resultado Resumen
1 Coordenada X del centro del marcador
2 Coordenada Y del centro del marcador
3 Ancho del marcador
4 Alto del marcador
5 Etiqueta

ID:4 Line (lineas)

  • Resumen
    Busca desde una hasta 5 líneas en una imagen y devuelve las coordenadas y los grados de sus dos extremos. Si se trata de una curva, devuelve un segmento de línea aproximado.

ID:4 Linea. Resumen

  • Parámetros
    En la página de configuración de la interfaz de usuario se pueden establecer varios parámetros.

ID:4 Linea. Parámetros

  • Nivel de rendimiento del algoritmo: Para seleccionar el rendimiento de la visión según los diferentes requisitos de la aplicación: 'Sensible (Sensitive)', 'Equilibrado (Balance)' y 'Preciso (Accurate)'.
  • Número máximo de líneas: Rango de 1 a 5
  • Resultados

ID:4 Linea. Resultados

NOTA:

La horizontal hacia la derecha es 0 grados, el valor aumenta en sentido antihorario. Hacia arriba es 90 grados, y la horizontal hacia la izquierda es 180 grados.

Se utilizan 5 colores diferentes para distinguir las líneas: rojo, amarillo, verde, azul y púrpura.

ID:4 Linea. Colores de las líneas

Resultado Resumen
1 Coordenada X del punto final de la línea (superior)
2 Coordenada Y del punto final de la línea (superior)
3 Coordenada X del punto inicial de la línea (inferior)
4 Coordenada Y del punto inicial de la línea (inferior)
5 Grados de la línea

ID:5 Learning (aprendizaje)

  • Resumen
    Los objetos pueden ser entrenados y reconocidos por esta cámara de visión artificial y se pueden guardar hasta 25 datos de modelos.

ID:5 Learning. Resumen

  • Parámetros

Entrenamiento de un nuevo objeto: El nuevo objeto se puede entrenar en la página en ejecución:

ID:5 Learning. Parámetros

Se asignará automáticamente una etiqueta al nuevo objeto. El principio es: seleccionar el número más pequeño de los ID disponibles.

Eliminar todos los objetos: Manten pulsado verticalmente el joystick durante más de 2 segundos en la página en ejecución.

ID:5 Learning. Eliminar todos los objetos

Parámetro Resumen
1 Ninguno
2 Ninguno
3 Ninguno
4 Ninguno
5 Escribe 0 para borrar el objeto actual o 100 para entrenamiento

Puedes renombrar o borrar el objeto entrenado.

ID:5 Learning. Renombrar o borrar el objeto entrenado

  • Renombrar:

ID:5 Learning. Renombrar el objeto entrenado

  • Borrar:

ID:5 Learning. Borrar el objeto entrenado

  • Resultados
    La visión solo puede juzgar la existencia del objeto entrenado, pero no sus coordenadas y tamaño, por lo que el cuadro de reconocimiento es un valor de salida fijo.

ID:5 Learning. Resultados

Resultado Resumen
1 Fijado, 160
2 Fijado, 120
3 Fijado, 224
4 Fijado, 224
5 Etiqueta

ID:6 Card (tarjeta)

  • Resumen
    Reconocer una tarjeta específica en la imagen y devolver sus coordenadas, tamaño, etiqueta y otra información. Incluye tarjetas de tráfico, de formas y de números.

ID:6 Tarjeta (Card). Resumen

Las etiquetas se muestran en la siguiente tabla. Del 1 al 10 para Tráfico, del 11 al 19 para Formas y del 20 al 29 para Números.

Etiqueta Nombre Etiqueta Nombre Etiqueta Nombre
1 Avanzar (Forward) 2 Izquierda (Left) 3 Derecha (Right)
4 Dar la vuelta (Turn Around) 5 Aparcamiento (Park) 6 Verde (Green)
7 Rojo (Red) 8 Velocidad 40 (Speed 40) 9 Velocidad 60 (Speed 60)
10 Velocidad 80 (Speed 80)
11 Comprueba (Check) 12 Aspa (Cross) 13 Círculo (Circle)
14 Cuadrado (Square) 15 Triángulo (Triangle) 16 Suma (Plus)
17 Resta (Minus) 18 División (Divide) 19 Igual (Equal)
20 Número 0 21 Número 1 22 Número 2
23 Número 3 24 Número 4 25 Número 5
26 Número 6 27 Número 7 28 Número 8
29 Número 9
  • Parámetros
    Ninguno.

  • Resultados
    Esta visión puede reconocer varias tarjetas al mismo tiempo, incluso se están rotadas hasta 30 grados, pero no las gires demasiado.

ID:6 Tarjeta (Card). Resultados

Resultado Resumen
1 Coordenada X del centro de la tarjeta
2 Coordenada Y del centro de la tarjeta
3 Ancho de la tarjeta
4 Alto de la tarjeta
5 Etiqueta de de la tarjeta

ID:7 Face (Caras)

  • Resumen
    Esta visión permite entrenar y reconocer rostros, se pueden guardar hasta 25 datos de modelos y también admite la detección de máscaras.

ID:7 Face (Cara). Resumen

  • Parámetros
  • Entrenando nueva cara: Un nuevo objeto se puede entrenar desde la página de ejecución.

ID:7 Face (Cara). Parámetros

Una nueva etiqueta se asigna a la nueva cara tomando como criterio escoger el número mas pequeño de los ID disponibles.

  • Borrar todas las caras: Una pulsación superior a 2 segundos del botón del joystick.
Parámetro Resumen
1 Ninguno
2 Ninguno
3 Ninguno
4 Ninguno
5 Escribe 0 para borrar el objeto actual o 100 para entrenamiento

Puedes renombrar o borrar el objeto entrenado desde la página de configuración de la interfaz de usuario.

ID:7 Face (Cara). Renombrar o borrar

  • Resultados

ID:7 Face (Cara). Resultados

Esta cámara de visión artificial admite la detección de rostros (rostros nuevos) y el reconocimiento de rostros (rostros entrenados) que se ejecutan al mismo tiempo. A los rostros nuevos se les asignará la etiqueta 0. En particular, si se detecta un rostro nuevo que lleva una mascarilla, se mostrará 'Rostro nuevo (mascarilla)' y la etiqueta se fijará en 200.

ID:7 Face (Cara). Resultados

Resultado Resumen
1 Coordenada X del centro de la cara
2 Coordenada Y del centro de la cara
3 Ancho de la cara
4 Alto de la cara
5 Etiqueta 0: nueva cara, 200: cara con máscarilla

ID:8 20Class (objetos)

  • Resumen
    Identifica 20 tipos comunes de objetos y devuelve sus coordenadas, tamaño y etiquetas, tal y como se muestra en la tabla siguiente.

ID:8 20Class. Resumen

Resultado Resumen Resultado Resumen Resultado Resumen
1 Avión (Airplane) 2 Bicicleta (Bicycle) 3 Pájaro (Bird)
4 Barco (Boat) 5 Botella (Bottle) 6 Autobús (Bus)
7 Coch (Car) 8 Gato (Gat) 9 Silla (Chair)
10 Vaca (Cow) 11 Mesa de comedor (DiningTable) 12 Perro (Dog)
13 Caballo (Horse) 14 Motocicleta (Motorbike) 15 Persona (Person)
16 Maceta (PottedPlant) 17 Oveja (Sheep) 18 Sofá (Sofa)
19 Tren (Train) 20 Monitor de televisión (Tvmonitor)
  • Parámetros

ID:8 20Class. Parámetros

Nivel de rendimiento del algoritmo: Para seleccionar el rendimiento de la visión según los diferentes requisitos de la aplicación: 'Sensible (Sensitive)', 'Equilibrado (Balance)' y 'Preciso (Accurate)'.

  • Resultados

ID:8 20Class. Resultados

Resultado Resumen
1 Coordenada X del centro del objeto
2 Coordenada Y del centro del objeto
3 Ancho del objeto
4 Alto del objeto
5 Etiqueta

ID:9 Código QR

SOLAMENTE DISPONIBLE PARA LA VERSIÓN ENTERPRISE

  • Resumen

ID:9 Código QR. Resumen

Se puede reconocer un código QR estándar (menos de 25 caracteres ASCII).

Tabla ASCII

Etiqueta ASCII Etiqueta ASCII Etiqueta ASCII
32 Espacio 33 ! 34
35 # 36 $ 37 %
38 & 39 40 (
41 ) 42 * 43 +
44 , 45 - 46 .
47 / 48 0 49 1
50 2 51 3 52 4
53 5 54 6 55 7
56 8 57 9 58 :
59 ; 60 < 61 =
62 > 63 ? 64 @
65 A 66 B 67 C
68 D 69 E 70 F
71 G 72 H 73 I
74 J 75 K 76 L
77 M 78 N 79 O
80 P 81 Q 82 R
83 S 84 T 85 U
86 V 87 W 88 X
89 Y 90 Z 91 [
92 \ 93 ] 94 ^
95 _ 96 ` 97 a
98 b 99 c 100 d
101 e 102 f 103 g
104 h 105 i 106 j
107 k 108 l 109 m
110 n 111 o 112 p
113 q 114 r 115 s
116 t 117 u 118 v
119 w 120 x 121 y
122 z 123 { 124
125 } 126 ~
  • Parámetros
    Ninguno

  • Resultados
    A diferencia de otras cámaras de visión artificial, esta devuelve dos tipos de información, paquete de atributos y datos de caracteres.

ID:9 Código QR. Resultados

Paquete de atributos

Resultado Resumen
1 Coordenada X del centro del QR
2 Coordenada Y del centro del QR
3 Ancho del QR
4 Alto del QR
5 Número de caracteres

Datos de caracteres

Resultado Resumen
1 Dato de caracter
2 Dato de caracter
3 Dato de caracter
4 Dato de caracter
5 Dato de caracter

ID:10 Custom (Personalizado)

  • Resumen
    Si este modo está habilitado, el chip wifi estará en modo ejecución. Mas detalles en:

Versión en Inglés:

Sentry2 WiFi Firmware Developing User Guide_V1.1.pdf

Versión en Castellano:

Guía de desarrollo del firmware WiFi Sentry2_V1.1.pdf

ID:10 Personalizado. Resumen

  • Parámetros
    Personalizados

  • Resultados
    Personalizados

ID:11 Motion (Movimiento)

SOLAMENTE DISPONIBLE PARA LA VERSIÓN ENTERPRISE

  • Resumen
    Compara la diferencia de píxeles de los fotogramas adyacentes para determinar si hay una región con movimiento en la imagen, devolviendo su coordenada y tamaño.

ID:11 Movimiento. Resumen

  • Parámetros
    Ninguno

  • Resultados

ID:11 Movimiento. Resultados

Resultado Resumen
1 Coordenada X del centro de la región
2 Coordenada Y del centro de la región
3 Ancho de la región
4 Alto de la región
5 Ninguno

Resumen de la interfaz de ejecución (Running)

Interfaz de ejecución (Running)

Hay varias formas de habilitar/desactivar la visión:

  • Desde la página de la interfaz de usuario

Desde la página de la interfaz de usuario

  1. Selecciona la vista en los menús de la izquierda de la página de configuración de la visión.
  2. Algunas visiones se pueden configurar. Pulsa en "Setting / configuración" para entrar.
  3. Si se muestra el botón rojo "STOP / detener" en la parte inferior izquierda del área de control derecha, significa que el algoritmo está cerrado actualmente. Después de clicar en él, cambiará a un botón verde "RUN / ejecuta", lo que significa que el algoritmo se inicia. Pulsa de nuevo y volverá a cambiar en el botón rojo "STOP / detener".

  4. Con el joystick

Con el joystick

  1. Pulsa brevemente en el joystick hacia arriba y hacia abajo para activar o desactivar una visión. La visión anterior se cerrará si se está ejecutando una visión nueva.
  2. La secuencia de cambio de visión se ordena por Vision-ID.

  3. Mediante las instrucciones de programación del controlador

De esta forma, el controlador necesita leer y escribir registros para habilitar o desactivar la visión. Se ofrecen las bibliotecas de controladores para distintas plataformas de programación.

En el modo UART, la lectura o la escritura de registros se realiza de acuerdo con el protocolo estándar o el protocolo simple. Para obtener más información, consulte las secciones relacionadas.

El modo I2C puede leer o escribir registros directamente.

Activa la visión:

  1. Escribe Vision ID en el registro 0x20-VISION_ID
  2. Escribe 0x01 en el registro 0x21-VISIO_CONF1 para habilitar la visión. De lo contrario, escribe 0x00 para desactivarla.