Visión
Resumen¶
El sensor de visión Sentry2 integra una variedad de algoritmos de visión offline para reconocer objetos sin necesidad de conexión a la red, y el chip ESP8285-WiFi integrado permite realizar la función de reconocimiento de imágenes basada en la nube.
Listado¶
ID | Nombre | Resumen |
---|---|---|
1 | Color | Devuelve el valor R (rojo), G (verde) y B (azul) y la etiqueta de cada región. Hasta 25 regiones |
2 | Blob (Burbuja) |
Detectar un bloque de color específico. Admite la selección simultánea de bloques de color negro, blanco, rojo, verde, azul y amarillo |
3 | Apriltag | Compatible con familia Apriltag 16H5, 25H9, 36H11. Hasta 25 etiquetas |
4 | Line | Busca líneas y devuelve sus extremos y grados, admite entre 1 y 5 líneas |
5 | Learning | Entrenar objetos y clasificarlos. Hasta 25 datos de modelo |
6 | Card | Identificar patrones especiales de tarjetas, incluyendo 10 de tráfico, 9 de formas y 10 de números |
7 | Face | Detección y reconocimiento facial, compatible con detección de máscaras, puede almacenar datos de 25 modelos |
8 | 20Class | Clasifica 20 objetos comunes, como gato, coche, persona, etc |
9 | QrCode | Reconocimiento de un código QR sencillo |
10 | Custom | Ejecutar algoritmos personalizados que se ejecutan en el chip ESP8285-WiFi integrado |
11 | Motion | Determinar si hay áreas en movimiento en la imagen |
Introducción detallada¶
ID:1 Color¶
- Resumen
El usuario puede establecer desde una hasta 25 regiones para el reconocimiento de colores y obtener los valores R (rojo), G (verde) y B (azul) y la etiqueta de cada región. Las coordenadas y el tamaño de cada región se pueden configurar.
- Etiqueta Color
Una etiqueta de color es un número que se utiliza para representar un color:
Etiqueta | Nombre | Etiqueta | Nombre | Etiqueta | Nombre |
---|---|---|---|---|---|
1 | Negro (Black) | 2 | Blanco (White) | 3 | Rojo (Red) |
4 | Verde (Green) | 5 | Azul (Blue) | 6 | Amarillo (Yellow) |
0 | Desconocido (Unknown) |
- Parámetros
El usuario puede configurar las regiones para el reconocimiento:
Parámetro | Resumen |
---|---|
1 | Coordenada X del centro de la región |
2 | Coordenada Y del centro de la región |
3 | Ancho de la región |
4 | Alto de la región |
5 | Ninguno |
Existen varios parámetros preestablecidos en la página de configuración de la interfaz de usuario:
Cuadrícula (X x Y): 1x1, 2x2, 3x3, 4x4, 5x5, 1x10, 2x10, 6x1, 6x2
Tamaño (Ancho x Alto): 2x2, 4x4, 8x8, 16x16, 32x32
NOTA:
Para representar un cuadrado en el sistema de coordenadas porcentuales, la anchura y la altura no son iguales, sino que se ajustan a la relación 3:4. Por ejemplo, si la anchura de un cuadrado es del 12%, entonces su altura h debe ser 12/3 × 4 = 16 %. En el sistema de coordenadas absolutas, los tamaños preestablecidos del área de reconocimiento son: 1x1, 2x3, 3x4, 6x8, 9x12.
- Resultados
En la pantalla aparecerá un recuadro rectangular que identifica el color, y un recuadro de cuatro esquinas que identifica el color desconocido.
Resultado | Resumen |
---|---|
1 | R, valor del canal rojo con rango 0 a 255 |
2 | G, valor del canal verde con rango 0 a 255 |
3 | B, valor del canal azul con rango 0 a 255 |
4 | Ninguno |
5 | Etiqueta de color |
ID:2 Blob (bloques de color)¶
- Resumen
Busca un bloque de color determinado en una imagen y devuelve sus coordenadas y tamaño. Admite la detección de múltiples colores y múltiples resultados. La etiqueta de color tiene la misma definición que en Color vision.
- Parámetros
El usuario debe decidir primero qué color desea detectar. El ancho y el alto de la pieza de color mínima se pueden configurar para reducir los resultados falsos:
Resultado | Resumen |
---|---|
1 | Ninguno |
2 | Ninguno |
3 | Ancho mínimo |
4 | Alto mínimo |
5 | La etiqueta Color será detectada |
Existen varios parámetros preestablecidos en la página Interfaz de Usuario:
- Nivel de rendimiento del algoritmo: Para seleccionar el rendimiento de la visión según los diferentes requisitos de la aplicación, entre 'Sensible', 'Equilibrado' y 'Preciso'.
- Número máximo de bloques: Admite de 1 a 5 bloques para cada color.
- Tamaño mínimo del bloque: En sistema de coordenadas absolutas: 2x2, 4x4, 8x8, 16x16, 32x32, 64x64, 128x128 píxeles. En sistema de coordenadas porcentuales: 1x1, 2x3, 3x4, 6x8, 9x12, 21x28, 42x56 %.
- Color a detectar: Se muestra un icono de ojo abierto si la etiqueta de color está activada.
- Resultados
Obtén los resultadfos:
Resultado | Resumen |
---|---|
1 | Coordenada X del centro del bloque |
2 | Coordenada Y del centro del bloque |
3 | Ancho del bloque |
4 | Alto del bloque |
5 | Etiqueta Color |
ID:3 Apriltag (etiquetas)¶
Los AprilTag son marcadores visuales para detección e identificación mediante sistemas de visión artificial desarrollados por investigadores de la universidad de Michigan.
Tecnicamente su diseño fiducial y sistema de codificación se basan en lexicografia. El sistema se describe en los artículos enlazados en la web anterior.
Conceptualmente son similares a los códigos QR pero diseñados para cargas de datos mucho mas pequeñas (entre 4 y 12 bits), lo que permite una detección mejor a mayor distancia. Están diseñados para calcular su posición 3D precisa respecto a la cámara.
Se utilizan como marcadores fiduciales en robótica y otras aplicaciones.
Un marcador fiducial o solamente fiducial es un objeto colocado en el campo de visión de un sistema de imágenes que aparece en la imagen producida, para su uso como punto de referencia o medida.
Su nombre procede del laboratorio de robótica "April" de la Universidad de Michigan, siendo AprilTag una biblioteca y algoritmo que permite a un sistema identificar características en hasta seis grados de libertad.
- Resumen
Busca etiquetas AprilTag en una imagen, compatible con las familias de codificación 16H5, 25H9 y 36H11, y hasta 25 resultados. Debes decidir qué familia de codificación utilizar antes de habilitar esta función, y solo se puede procesar una familia.
Etiqueta
En el enlace puedes descargar imágenes de AprilTag y aprender mas sobre el tema.
- Parámetros
Existen varios parámetros preestablecidos en la página de configuración de la interfaz de usuario:
- Nivel de rendimiento del algoritmo: Para seleccionar el rendimiento de la visión según los diferentes requisitos de la aplicación: 'Sensible (Sensitive)', 'Equilibrado (Balance)' y 'Preciso (Accurate)'.
- Familia de codificación: Compatible con 16H5, 25H9 y 36H11.
- Resultados
Obtén los resultadfos:
Resultado | Resumen |
---|---|
1 | Coordenada X del centro del marcador |
2 | Coordenada Y del centro del marcador |
3 | Ancho del marcador |
4 | Alto del marcador |
5 | Etiqueta |
ID:4 Line (lineas)¶
- Resumen
Busca desde una hasta 5 líneas en una imagen y devuelve las coordenadas y los grados de sus dos extremos. Si se trata de una curva, devuelve un segmento de línea aproximado.
- Parámetros
En la página de configuración de la interfaz de usuario se pueden establecer varios parámetros.
- Nivel de rendimiento del algoritmo: Para seleccionar el rendimiento de la visión según los diferentes requisitos de la aplicación: 'Sensible (Sensitive)', 'Equilibrado (Balance)' y 'Preciso (Accurate)'.
- Número máximo de líneas: Rango de 1 a 5
- Resultados
NOTA:
La horizontal hacia la derecha es 0 grados, el valor aumenta en sentido antihorario. Hacia arriba es 90 grados, y la horizontal hacia la izquierda es 180 grados.
Se utilizan 5 colores diferentes para distinguir las líneas: rojo, amarillo, verde, azul y púrpura.
Resultado | Resumen |
---|---|
1 | Coordenada X del punto final de la línea (superior) |
2 | Coordenada Y del punto final de la línea (superior) |
3 | Coordenada X del punto inicial de la línea (inferior) |
4 | Coordenada Y del punto inicial de la línea (inferior) |
5 | Grados de la línea |
ID:5 Learning (aprendizaje)¶
- Resumen
Los objetos pueden ser entrenados y reconocidos por esta cámara de visión artificial y se pueden guardar hasta 25 datos de modelos.
- Parámetros
Entrenamiento de un nuevo objeto: El nuevo objeto se puede entrenar en la página en ejecución:
Se asignará automáticamente una etiqueta al nuevo objeto. El principio es: seleccionar el número más pequeño de los ID disponibles.
Eliminar todos los objetos: Manten pulsado verticalmente el joystick durante más de 2 segundos en la página en ejecución.
Parámetro | Resumen |
---|---|
1 | Ninguno |
2 | Ninguno |
3 | Ninguno |
4 | Ninguno |
5 | Escribe 0 para borrar el objeto actual o 100 para entrenamiento |
Puedes renombrar o borrar el objeto entrenado.
- Renombrar:
- Borrar:
- Resultados
La visión solo puede juzgar la existencia del objeto entrenado, pero no sus coordenadas y tamaño, por lo que el cuadro de reconocimiento es un valor de salida fijo.
Resultado | Resumen |
---|---|
1 | Fijado, 160 |
2 | Fijado, 120 |
3 | Fijado, 224 |
4 | Fijado, 224 |
5 | Etiqueta |
ID:6 Card (tarjeta)¶
- Resumen
Reconocer una tarjeta específica en la imagen y devolver sus coordenadas, tamaño, etiqueta y otra información. Incluye tarjetas de tráfico, de formas y de números.
Las etiquetas se muestran en la siguiente tabla. Del 1 al 10 para Tráfico, del 11 al 19 para Formas y del 20 al 29 para Números.
Etiqueta | Nombre | Etiqueta | Nombre | Etiqueta | Nombre |
---|---|---|---|---|---|
1 | Avanzar (Forward) | 2 | Izquierda (Left) | 3 | Derecha (Right) |
4 | Dar la vuelta (Turn Around) | 5 | Aparcamiento (Park) | 6 | Verde (Green) |
7 | Rojo (Red) | 8 | Velocidad 40 (Speed 40) | 9 | Velocidad 60 (Speed 60) |
10 | Velocidad 80 (Speed 80) | ||||
11 | Comprueba (Check) | 12 | Aspa (Cross) | 13 | Círculo (Circle) |
14 | Cuadrado (Square) | 15 | Triángulo (Triangle) | 16 | Suma (Plus) |
17 | Resta (Minus) | 18 | División (Divide) | 19 | Igual (Equal) |
20 | Número 0 | 21 | Número 1 | 22 | Número 2 |
23 | Número 3 | 24 | Número 4 | 25 | Número 5 |
26 | Número 6 | 27 | Número 7 | 28 | Número 8 |
29 | Número 9 |
-
Parámetros
Ninguno. -
Resultados
Esta visión puede reconocer varias tarjetas al mismo tiempo, incluso se están rotadas hasta 30 grados, pero no las gires demasiado.
Resultado | Resumen |
---|---|
1 | Coordenada X del centro de la tarjeta |
2 | Coordenada Y del centro de la tarjeta |
3 | Ancho de la tarjeta |
4 | Alto de la tarjeta |
5 | Etiqueta de de la tarjeta |
ID:7 Face (Caras)¶
- Resumen
Esta visión permite entrenar y reconocer rostros, se pueden guardar hasta 25 datos de modelos y también admite la detección de máscaras.
- Parámetros
- Entrenando nueva cara: Un nuevo objeto se puede entrenar desde la página de ejecución.
Una nueva etiqueta se asigna a la nueva cara tomando como criterio escoger el número mas pequeño de los ID disponibles.
- Borrar todas las caras: Una pulsación superior a 2 segundos del botón del joystick.
Parámetro | Resumen |
---|---|
1 | Ninguno |
2 | Ninguno |
3 | Ninguno |
4 | Ninguno |
5 | Escribe 0 para borrar el objeto actual o 100 para entrenamiento |
Puedes renombrar o borrar el objeto entrenado desde la página de configuración de la interfaz de usuario.
- Resultados
Esta cámara de visión artificial admite la detección de rostros (rostros nuevos) y el reconocimiento de rostros (rostros entrenados) que se ejecutan al mismo tiempo. A los rostros nuevos se les asignará la etiqueta 0. En particular, si se detecta un rostro nuevo que lleva una mascarilla, se mostrará 'Rostro nuevo (mascarilla)' y la etiqueta se fijará en 200.
Resultado | Resumen |
---|---|
1 | Coordenada X del centro de la cara |
2 | Coordenada Y del centro de la cara |
3 | Ancho de la cara |
4 | Alto de la cara |
5 | Etiqueta 0: nueva cara, 200: cara con máscarilla |
ID:8 20Class (objetos)¶
- Resumen
Identifica 20 tipos comunes de objetos y devuelve sus coordenadas, tamaño y etiquetas, tal y como se muestra en la tabla siguiente.
Resultado | Resumen | Resultado | Resumen | Resultado | Resumen |
---|---|---|---|---|---|
1 | Avión (Airplane) | 2 | Bicicleta (Bicycle) | 3 | Pájaro (Bird) |
4 | Barco (Boat) | 5 | Botella (Bottle) | 6 | Autobús (Bus) |
7 | Coch (Car) | 8 | Gato (Gat) | 9 | Silla (Chair) |
10 | Vaca (Cow) | 11 | Mesa de comedor (DiningTable) | 12 | Perro (Dog) |
13 | Caballo (Horse) | 14 | Motocicleta (Motorbike) | 15 | Persona (Person) |
16 | Maceta (PottedPlant) | 17 | Oveja (Sheep) | 18 | Sofá (Sofa) |
19 | Tren (Train) | 20 | Monitor de televisión (Tvmonitor) |
- Parámetros
Nivel de rendimiento del algoritmo: Para seleccionar el rendimiento de la visión según los diferentes requisitos de la aplicación: 'Sensible (Sensitive)', 'Equilibrado (Balance)' y 'Preciso (Accurate)'.
- Resultados
Resultado | Resumen |
---|---|
1 | Coordenada X del centro del objeto |
2 | Coordenada Y del centro del objeto |
3 | Ancho del objeto |
4 | Alto del objeto |
5 | Etiqueta |
ID:9 Código QR¶
SOLAMENTE DISPONIBLE PARA LA VERSIÓN ENTERPRISE
- Resumen
Se puede reconocer un código QR estándar (menos de 25 caracteres ASCII).
Tabla ASCII
Etiqueta | ASCII | Etiqueta | ASCII | Etiqueta | ASCII |
---|---|---|---|---|---|
32 | Espacio | 33 | ! | 34 | “ |
35 | # | 36 | $ | 37 | % |
38 | & | 39 | ‘ | 40 | ( |
41 | ) | 42 | * | 43 | + |
44 | , | 45 | - | 46 | . |
47 | / | 48 | 0 | 49 | 1 |
50 | 2 | 51 | 3 | 52 | 4 |
53 | 5 | 54 | 6 | 55 | 7 |
56 | 8 | 57 | 9 | 58 | : |
59 | ; | 60 | < | 61 | = |
62 | > | 63 | ? | 64 | @ |
65 | A | 66 | B | 67 | C |
68 | D | 69 | E | 70 | F |
71 | G | 72 | H | 73 | I |
74 | J | 75 | K | 76 | L |
77 | M | 78 | N | 79 | O |
80 | P | 81 | Q | 82 | R |
83 | S | 84 | T | 85 | U |
86 | V | 87 | W | 88 | X |
89 | Y | 90 | Z | 91 | [ |
92 | \ | 93 | ] | 94 | ^ |
95 | _ | 96 | ` | 97 | a |
98 | b | 99 | c | 100 | d |
101 | e | 102 | f | 103 | g |
104 | h | 105 | i | 106 | j |
107 | k | 108 | l | 109 | m |
110 | n | 111 | o | 112 | p |
113 | q | 114 | r | 115 | s |
116 | t | 117 | u | 118 | v |
119 | w | 120 | x | 121 | y |
122 | z | 123 | { | 124 | |
125 | } | 126 | ~ |
-
Parámetros
Ninguno -
Resultados
A diferencia de otras cámaras de visión artificial, esta devuelve dos tipos de información, paquete de atributos y datos de caracteres.
Paquete de atributos
Resultado | Resumen |
---|---|
1 | Coordenada X del centro del QR |
2 | Coordenada Y del centro del QR |
3 | Ancho del QR |
4 | Alto del QR |
5 | Número de caracteres |
Datos de caracteres
Resultado | Resumen |
---|---|
1 | Dato de caracter |
2 | Dato de caracter |
3 | Dato de caracter |
4 | Dato de caracter |
5 | Dato de caracter |
ID:10 Custom (Personalizado)¶
- Resumen
Si este modo está habilitado, el chip wifi estará en modo ejecución. Mas detalles en:
Versión en Inglés:
Versión en Castellano:
-
Parámetros
Personalizados -
Resultados
Personalizados
ID:11 Motion (Movimiento)¶
SOLAMENTE DISPONIBLE PARA LA VERSIÓN ENTERPRISE
- Resumen
Compara la diferencia de píxeles de los fotogramas adyacentes para determinar si hay una región con movimiento en la imagen, devolviendo su coordenada y tamaño.
-
Parámetros
Ninguno -
Resultados
Resultado | Resumen |
---|---|
1 | Coordenada X del centro de la región |
2 | Coordenada Y del centro de la región |
3 | Ancho de la región |
4 | Alto de la región |
5 | Ninguno |
Resumen de la interfaz de ejecución (Running)¶
Hay varias formas de habilitar/desactivar la visión:
- Desde la página de la interfaz de usuario
- Selecciona la vista en los menús de la izquierda de la página de configuración de la visión.
- Algunas visiones se pueden configurar. Pulsa en "Setting / configuración" para entrar.
-
Si se muestra el botón rojo "STOP / detener" en la parte inferior izquierda del área de control derecha, significa que el algoritmo está cerrado actualmente. Después de clicar en él, cambiará a un botón verde "RUN / ejecuta", lo que significa que el algoritmo se inicia. Pulsa de nuevo y volverá a cambiar en el botón rojo "STOP / detener".
-
Con el joystick
- Pulsa brevemente en el joystick hacia arriba y hacia abajo para activar o desactivar una visión. La visión anterior se cerrará si se está ejecutando una visión nueva.
-
La secuencia de cambio de visión se ordena por Vision-ID.
-
Mediante las instrucciones de programación del controlador
De esta forma, el controlador necesita leer y escribir registros para habilitar o desactivar la visión. Se ofrecen las bibliotecas de controladores para distintas plataformas de programación.
En el modo UART, la lectura o la escritura de registros se realiza de acuerdo con el protocolo estándar o el protocolo simple. Para obtener más información, consulte las secciones relacionadas.
El modo I2C puede leer o escribir registros directamente.
Activa la visión:
- Escribe Vision ID en el registro 0x20-VISION_ID
- Escribe 0x01 en el registro 0x21-VISIO_CONF1 para habilitar la visión. De lo contrario, escribe 0x00 para desactivarla.