Sabemos que la tecnología, cada vez que da un paso hacia su desarrollo, es capaz de anular muchos de los límites que nuestra imaginación había podido pautar. Es así como la ia y una de sus ramas, el procesamiento de lenguaje natural (PLN), han sido uno de los campos que más nos han sorprendido estos últimos años. Sus avances han sido reconocidos a través de chatbots, asistentes virtuales o sistemas de análisis de texto, pero existe una startup sevillana que pretende llevar esta tecnología a un nivel, hasta ahora, ficcional.
La empresa 4i.ai ha desarrollado un asistente de voz con un funcionamiento multimodal, DiViVo (Dialog Voice and Vision) es una revolucionaria tecnología conversacional que combina la voz y visión artificial para crear una experiencia de interacción más rica, que comprende mejor el contexto tanto del diálogo como del entorno físico donde se realiza la interacción. A causa de su innovadora propuesta 4i.ai estará presente los días 11 y 12 en el congreso granadino para startups e inversores, Alhambra Venture. Su XI edición se llevará a cabo en el Museo Memoria de Andalucía.
Alhambra Venture, que se celebra anualmente en Granada, se ha consolidado como uno de los eventos más importantes para inversores, emprendedores y agentes del ecosistema emprendedor del sur de España. Este encuentro, que reúne a cientos de participantes, ofrece un espacio único para conectar, explorar oportunidades de inversión y fomentar el crecimiento de startups nacionales. 4i.ai ha logrado permear en el ecosistema tecnológico español, siendo seleccionada como una de las startups finalistas del evento.
Impacto y eficiencia en la industria PLN
DiViVo es un motor de diálogo multimodal que combina las capacidades de diálogo, visión y voz para crear experiencias de usuario únicas y atractivas. A diferencia de los sistemas tradicionales basados en texto, DiViVo puede comprender y responder a gestos, expresiones faciales y tonos de voz, lo que permite una interacción más natural y realista.
4i.ai permite crear aplicaciones robustas y útiles en entornos reales, lo que no es fácil, pues hay circunstancias frecuentes que pueden provocar errores en la comunicación, como la corrección y reparación de errores que hacemos continuamente cuando hablamos, por ejemplo, “trae el vaso de la cocina, no, del salón”, o el ruido de fondo, porque hay menos diferencia de la que pueda parecer entre el sonido “sí” y “no” cuando a la vez damos un golpe en la mesa. La realidad es compleja, aunque ha habido avances muy significativos, como los modelos de lenguaje grande (LLMs), éstos no están aún entrenados para resolver estos asuntos, además, debido a su arquitectura, no estarán libres de alucinaciones y sesgos, lo que representa un factor limitante en entornos empresariales donde es muy importante acertar. Sin embargo, con DiViVo, podemos construir aplicaciones libres de estos problemas, lo que es especialmente útil en escenarios reales.
Desde su creación, 4i ha demostrado el poder de su tecnología en aplicaciones industriales. En 2019, comenzó a implementar su sistema en Airbus, mejorando la productividad y eficiencia en la fábrica. Con DiViVo, los trabajadores pueden interactuar con los sistemas de información para consultar o introducir información mientras realizan la tarea principal, aumentando la productividad y la seguridad, al evitar que los operarios tengan que quitarse sus equipos de protección. Su sistema permite que puedan tener las manos libres lo que reduce el riesgo de accidente y mejora la ergonomía, siendo esto fundamental para reducir el número de bajas laborales en la industria.
Empresas de alto perfil como Skylife, GSC y Mercedes Benz han adoptado esta tecnología, evidenciando su eficacia en diferentes sectores. La capacidad de DiViVo para recopilar datos de alta calidad de manera sencilla facilita la toma de decisiones informadas y la mejora de la integridad de los procesos industriales.
Además, es multilingüe, multiplataforma y se puede ejecutar localmente en el dispositivo, garantizando la privacidad. Este enfoque asegura que la información sensible no vaya a la nube, proporcionando una capa adicional de seguridad que muchos buscan en la era digital. En nuestro entorno personal, familiar y laboral, estamos rodeados de máquinas, lo estaremos aún más, y querremos interactuar con ellas de una forma natural, cómoda y eficiente para los humanos.
Trayectoria de éxito
Con un equipo de 15 ingenieros, incluidos cuatro doctores, y una impresionante trayectoria de patentes, premios internacionales y más de 100 publicaciones científicas, 4i está bien posicionada para un futuro brillante. Su transición de un modelo de negocio basado en proyectos a uno centrado en productos resalta su compromiso con la escalabilidad. En Alhambra Venture 2024, 4i podrá presentar su tecnología, conjunto a su visión de cómo la interacción entre humanos y máquinas puede ser más natural y segura, así como eficiente.
La expectativa es alta para esta startup sevillana que ha demostrado ser una fuerza revolucionaria en el campo de la tecnología conversacional. Con su participación en Alhambra Venture, 4i tiene la oportunidad de atraer la atención de inversores y expertos del sector, solidificando su posición como líder en innovación tecnológica y comunicación multimodal.