La aplicación de la Inteligencia Artificial Generativa busca cada vez nuevos lugares para probar su utilidad y ahora encontramos que la IA impulsa a ChatGPT al mundo físico. Los chatbots han venido respondiendo a texto y voz y generando texto e  imágenes en el mundo digital, ahora se están utilizando también para desarrollar tecnología que opera en el mundo físico.  Combinando cámaras y data  sensorial con inmensas cantidades  de texto utilizados para entrenar chatbots cómo ChatGPT, se ha construído tecnología que les provee a los robots un entendimiento del  mundo que los rodea.

La IA Generativa aprende de la data digital – cientos de miles de ejemplos de lo que ocurre en el  mundo físico – y así  los robots pueden comenzar a manejar lo inesperado.  Aquello que está en la data digital es ahora transferible al mundo real. Esto es  muy diferente a la forma en la cual los robots han operado hasta el presente.  Típicamente, los  ingenieros programaban a los robots para ejecutar el mismo movimiento con precisión una y otra vez –  cómo recoger una caja de un cierto tamaño o hacer un remache particular en el guardafango trasero del auto. Pero los robots no podían reaccionar frente a situaciones no previstas.

Covariant fue fundada en 2027 por un profesor de la  Universidad de California en Berkeley y tres antiguos alumnos suyos, con experiencia como investigadores en OpenAI. Covariant construye software para impulsar los robots físicos.  Los grandes integradores de almacenes (ABB, KNAPP, Bastian) e importantes cliente globales han seleccionado a Covariant Brain como su plataforma de Robótica IA para automatizar el “picking” robótico.  Ello le ha permitido a Covariant dedicar muchos años a recoger data (a través de cámaras y sensores) que demuestra cómo funcionan estos robots. Al combinar dicha data con grandes cantidades de texto, utilizada para entrenar chatbots como ChatGPT, la empresa ha construido tecnología que le da  a  los robots un conocimiento  mucho más amplio del  mundo que los rodea.

Covariant ahora está creando formas que le permitan a los robots recoger, mover y  clasificar items que se están trasladando dentro  de almacenes y centros de distribución. Su objetivo es ayudar a los robots en el entendimiento  de lo que está ocurriendo alrededor  de ellos y decidir la próxima acción. La tecnología le provee al robot un conocimiento amplio del idioma inglés, permitiendo que las personas puedan chatear con ellos, tal cómo pudieran estuvieran haciendo con ChatGPT. Esta tecnología igualmente aprende sus habilidades analizando una inmensa cantidad de  data, todavía no es perfecta por  cuánto está en desarrollo.

Después de identificar patrones en ese conjunto de imágenes, data sensorial y texto, la tecnología le da al robot la capacidad de manejar situaciones inesperadas en el mundo físico. El robot sabe como seleccionar una banana, aun cuando nunca antes haya visto una banana. Adicionalmente puede responder en inglés, y eventualmente en otros idiomas, tal como lo hace un chatbot. La  tecnología conocida como RFM (Modelo Fundacional Robótico) comete errores, al igual que otros chatbots y el robot  puede llegar a dejar caer algo por esa razón. La tecnología es útil en almacenes y otras  situaciones donde los errores son aceptables. El  objetivo es desarrollar nueva tecnología para robots de almacenes, como punto de partida, para posteriormente aplicarla  a manufactura y vehículos autotripulados, donde  sería más difícil y  riesgoso su uso. Por supuesto, en la medida  que las empresas  entrene este tipo de sistema con una creciente y variada colección de data, los investigadores creen que mejorará rápidamente.

Se hace referencia a  How the A.I. That Drives ChatGPT Will Move Into the Physical World. La imagen es cortesía  de Bing Image Creator.