El interés en productos basados en visión artificial, realidad aumentada o realidad virtual ha crecido considerablemente en los últimos años. La visión artificial se utiliza hoy en día para dar solución a una gran variedad de problemas en diferentes ámbitos y con distintas aplicaciones (e. g. seguridad, análisis de calidad, inteligencia de negocio, educación, salud, etc.), siendo además una de las tecnologías clave en la evolución de los entornos industriales hacia lo que se conoce como Industria 4.0. El nuevo concepto de fábrica inteligente 4.0 integra una nueva manera de organizar los medios de producción con el objetivo de incrementar la adaptabilidad a las necesidades y procesos de producción, así como optimizar la asignación de recursos, abriendo la vía a lo que se considera la cuarta revolución industrial. Este objetivo se pretende conseguir integrando tecnologías digitales que permitan no sólo la automatización de los procesos industriales y la conectividad de todos los sistemas, si no la explotación de la información recogida. En este contexto, la visión artificial juega un papel clave tanto en los procesos de recogida e interpretación de la información como en la visualización de los datos.
El análisis mediante técnicas de visión artificial resulta costoso, sobre todo en casos que requieren un procesamiento de grandes cantidades de imágenes, tiempos reducidos de respuesta o tasas de error mínimas, como ocurre en la gran mayoría de las soluciones integradas en los procesos industriales. Este coste se puede analizar desde dos perspectivas: en primer lugar, desde la fase de diseño de algoritmos, en la que es necesario utilizar máquinas potentes capaces de ejecutar los exigentes cálculos necesarios para obtener/entrenar clasificadores o redes neuronales cuya preparación por medio de técnicas de ensayo y error conllevan un gasto de tiempo considerable. Por otra parte, en cuanto a la ejecución de los algoritmos una vez desarrollados, que a mayor complejidad más coste computacional requieren, lo que dificulta en gran medida su implementación en algunos dispositivos y limita la puesta en marcha de ciertas aplicaciones basadas en reconocimiento de imagen.
El presente proyecto pretende abordar esta problemática mediante la creación de una plataforma que reduzca los costes de creación y ejecución de algoritmos de visión, centralizándolos y haciéndolos accesibles de manera sencilla a través de la red. Esto permitirá aprovechar esfuerzos en el desarrollo de nuevos algoritmos así como en la implementación de soluciones que requieran capacidad de procesamiento automático de imágenes, de manera que puedan ser utilizados en dispositivos con recursos limitados y/o por desarrolladores de aplicaciones que no tengan conocimientos de visión por computador.
Por tanto, el proyecto VIMO tiene dos objetivos principales:
- Facilitar la reutilización de algoritmos de procesamiento de imagen y aprendizaje automático (machine learning) para la creación de soluciones técnicamente más complejas;
- Dotar de la capacidad de análisis de imagen a cualquier dispositivo que pueda conectarse a la plataforma independientemente de sus recursos. Teniendo esto en cuenta, aspectos como la escalabilidad, la mantenibilidad o la disponibilidad de la plataforma serán considerados tanto en la fase de diseño como en la de validación.
El presente proyecto se basa en el concepto de “algoritmos como servicio” (AaaS), que aprovecha las características de las infraestructuras y tecnologías de la nube para ofrecer un servicio de procesamiento de calidad y con la menor latencia posible. En este caso, la plataforma se centrará en la provisión de servicios basados en algoritmos de visión artificial que puedan ser aplicados en el contexto de la Industria 4.0.
La plataforma VIMO pretende aportar valor en los siguientes escenarios:
- Aquellos en los que el coste de desarrollo de la solución sea alto debido, por ejemplo, a la complejidad del problema a resolver o a estrictos requisitos de rendimiento.
- Escenarios en los que hay una necesidad de dotar de capacidad de reconocimiento de imagen a dispositivos que cuentan con recursos y potencia limitados.
De igual forma también podría utilizarse esta plataforma junto con sistemas de captura de imagen ya desplegados en alguna instalación, permitiendo de esta forma el aprovechamiento de infraestructuras ya existentes para el desarrollo de nuevas aplicaciones basadas en análisis de imagen (por ejemplo: en instalaciones que ya cuentan con un sistema de vigilancia con videocámaras).