¿ChatGPT podría controlar tu Casa Inteligente?
Hoy, puedes pedirle a Alexa que encienda las luces o hacer que Siri te diga la temperatura de tu habitación y, a veces, acertará. O puede escuchar: “Tienes 15 dispositivos llamados luces; ¿Cuál te gustaría controlar?” o “La temperatura actual en Katmandú es de 53 grados”. Pero, ¿qué pasaría si su asistente de voz no solo fuera siempre preciso, sino que también pudiera responder a comentarios nebulosos como “Tuve un día difícil; ¿Cuál es una buena manera de relajarse?” con respuestas “inteligentes”? Por ejemplo, ¿bajando las persianas, atenuando las luces, ajustando el termostato y haciendo cola en Netflix?
Ese es el potencial de los asistentes de voz impulsados por nuevos modelos de lenguaje de IA, según Alex Capecelatro, cofundador del sistema de automatización del hogar Josh.ai. Josh.ai ya comenzó a trabajar en un prototipo de integración utilizando ChatGPT de OpenAI. Este video de prueba de concepto muestra a Capecelatro pidiéndole al asistente de Josh que abra las persianas, apague la música y le diga el clima (controlar tres cosas a la vez es una capacidad que Josh ya tiene). Luego pasa a usar comandos de voz más naturales para el hogar inteligente, como “Estoy filmando un video; está un poco oscuro aquí”, a lo que el asistente de voz responde, con cierta torpeza, encendiendo las luces de la habitación.
La posibilidad de mejorar el control del hogar inteligente mediante el uso de modelos de lenguaje de IA para analizar el lenguaje natural es tentadora. Capecelatro cree que es el futuro. “Estamos tratando de averiguar qué tan bien podemos lograr controlar su entorno de una manera más natural e intuitiva”, dice.
Hoy en día, los asistentes de voz generalmente requieren un lenguaje preciso y, a menudo, confunden los comandos básicos del hogar inteligente con solicitudes de información, lo que resulta en respuestas frustrantes y, a veces, inútiles. Este fue el problema que Josh.ai se propuso resolver cuando Capecelatro y Tim Gill ( fundador de Quark ) iniciaron la empresa en 2015. Su asistente de voz del mismo nombre pretende ser excelente para controlar sus dispositivos conectados, sin importar cómo formule la solicitud.
Tecnologías como ChatGPT Es fundamental para el futuro de cualquier persona que controle la voz en el hogar
Mediante amplios modelos de gráficos de conocimiento, Josh puede analizar cuando escucha “satélites” en lugar de “encender las luces” y hacer lo apropiado. “Abre las cortinas” puede sonar como “Toma algunas uvas”, pero Josh es lo suficientemente inteligente como para saber que no vives en un viñedo. “Pasamos mucho tiempo trabajando bajo el capó para arreglar problemas de audición, trabajar con diferentes acentos, entender oraciones imperfectas y cosas por el estilo, así que incluso cuando dices ‘enciende las malditas luces’, sabemos lo que quieres decir”, dice Capecelatro.
Actualmente, Josh solo está disponible como una capa de control de voz en instalaciones personalizadas de hogares inteligentes con tecnología de Crestron y Control4. En ese entorno más protegido, donde el sistema está configurado y controlado en gran medida por un instalador profesional y utiliza el hardware patentado de Josh.ai , Josh se ha ganado la reputación de ser un asistente de voz más confiable y privado, aunque con un costo de entrada más alto. . (Si bien Josh tiene un componente de nube, la mayoría de las solicitudes se procesan localmente en Josh Core , y la información identificable se elimina cuando se usan API basadas en la nube, dice Capecelatro).
La compañía, que recientemente anunció una asociación con Amazon , ahora está apostando fuerte por la nueva generación de modelos de lenguaje grande (LLM) que utilizan ChatGPT y otros chatbots. Capecelatro cree que estos sistemas transformarán a los asistentes de voz de hoy en algo mucho más útil. “Dentro de un año, nadie estará dispuesto a tolerar la antigua forma en que operaban Alexa, Google, Siri e incluso Josh. Simplemente no va a ser suficiente”, dice Capecelatro. “Si no adoptamos tecnología tipo ChatGPT, negocios como el mío no existirán en un año. Es fundamental para el futuro de cualquier persona que controle la voz en el hogar”.
Para Josh.ai, que no tiene la profundidad de conocimiento general que tienen sus competidores, la base de conocimiento que agrega una integración de ChatGPT al asistente de voz es un gran paso adelante. “Siempre quisimos que Josh fuera lo más inteligente posible, pero somos un equipo pequeño”, dice Capecelatro.
Pero para el hogar inteligente en general, la promesa radica en combinar las habilidades conversacionales de los modelos de lenguaje de IA con el contexto que puede proporcionar un sistema de automatización del hogar. Por ejemplo, al saber qué dispositivos inteligentes tiene en su hogar y los detalles sobre cómo los usa, Josh podría analizar los comandos del lenguaje natural en acciones en su hogar. Diga, “Hola Josh, es casi la hora de que los niños regresen a casa y está oscureciendo. ¿Puedes asegurarte de que todo esté listo? y el asistente de voz podría encender las luces del porche, comenzar a precalentar el horno, bajar las persianas y encender las luces de la cocina, por ejemplo.
Josh también ha trabajado para usar ChatGPT para el descubrimiento de medios en el hogar inteligente. Algo que ha sido un eslabón perdido hasta la fecha. “El control por voz no es ideal si no sabes lo que quieres”, dice Capecelatro. “Construimos una integración con el control remoto de Ava que puedes usar para explorar el contenido que deseas ver. Al agregar ChatGPT a la mezcla, puede decir: “¿Cuáles son algunos programas realmente buenos en Netflix que quizás sean comedias románticas y presenten a (este) actor?”. ChatGPT puede compilar una lista y presentársela en la pantalla del control remoto”. Esa es la noche de cine familiar resuelta, entonces.
La actualización de IA de Josh aún no está disponible, y Capecelatro dice que la compañía está vigilando de cerca la tecnología floreciente de otras compañías en este espacio en caso de que puedan ofrecer un modelo mejor. Además de que ChatGPT actualmente es muy lento (el video fue editado para acelerarlo), existe el problema muy real de que la IA genera, bueno, tonterías . (Y el hecho de que el conjunto de datos en el que se entrenó ChatGPT finaliza a mediados de 2021. Vale la pena señalar que en el video de demostración cuando se le pregunta a Josh: “¿Cuáles son algunos programas para ver en Netflix?”, el programa más nuevo que aparece debutó en 2019 .) Pero Capecelatro dice que alguna forma de asistente de voz de IA generativa está llegando a la casa inteligente.
La precaución está definitivamente garantizada. Ninguna empresa quiere un asistente de voz racista, homofóbico y homicida que arroje sus “opiniones” en los hogares de las personas a través de su hardware, una posibilidad clara dados los ejemplos de IA generativa que esencialmente regurgita contenido sin filtro . “Estamos siendo extremadamente cautelosos. Podríamos haber lanzado la integración de ChatGPT de inmediato”, dice Capecelatro. “No vamos a hacer eso. Porque no queremos dar a la gente datos realmente malos. No queremos mentir”.
La compañía planea tomarse su tiempo para averiguar cómo colocar las barandillas protectoras adecuadas, que serán esenciales para que esta tecnología se traduzca en el hogar inteligente. “Creo que Microsoft y Google se apresuraron un poco [con sus modelos de ChatBot de búsqueda], y ahora están viendo las consecuencias”, dice Capecelatro sobre los recientes lanzamientos de alto perfil que fracasaron rápidamente.
No es un salto asumir que Google, Apple y Amazon están buscando la forma de incorporar nuevos modelos de lenguaje de IA en sus asistentes de voz (diablos, tal vez Microsoft traerá de vuelta a Cortana), y los entusiastas de los hogares inteligentes ya han descubierto formas de usar Atajos de Siri para llevar ChatGPT a su hogar inteligente . Es mucho más fácil hablar con un altavoz inteligente que escribir en un navegador web.
Pero, ¿realmente queremos este tipo de inteligencia artificial en nuestros hogares? ¿Es nuestro deseo de un asistente de voz que “simplemente funcione” tan grande que estaríamos felices con uno que también podría intentar enseñarle a mi hijo de ocho años sobre física cuántica? Personalmente, creo que un sistema doméstico inteligente confiable y controlado por voz que sabe a lo que me refiero cuando digo “apaga las malditas luces”, es el Santo Grial aquí, no una inteligencia omnisciente que dirige mi hogar.
Si bien la promesa de un asistente de voz inherentemente competente y eminentemente intuitivo, un mayordomo impecable para su hogar, es muy atractiva, me temo que la realidad podría ser más Space Odyssey que Downton Abbey . Pero veamos si se demuestra que estoy equivocado.