Lo que harán es hablar con él – Desde dentro
Microsoft sabe que el mouse y el teclado pueden ser dos mensajes. Las PC y las computadoras portátiles aún


Microsoft sabe que el mouse y el teclado pueden ser dos mensajes. Las PC y las computadoras portátiles aún tienen sentido, pero les gustaría prepararse con una versión de Windows que está adaptada a lo que viene. Y lo que viene es ai y voz. Entonces comienza y ya tiene su visión especial de cómo se verá Windows en 2030.
De mouse y teclado, (poco o) nada. «El mundo de los ratones y los teclados será tan extraño para las personas como para la Generación Z». Este tocón fue David Weston, director de Microsoft, En un video publicado esta semana De la compañía con el título «2030 Vision» (algo así como «Nuestra visión, como 2030»). Este gerente explicó que el sistema operativo Windows probablemente será muy diferente que ahora tenemos. Al menos en su interfaz de usuario.
Multimodal o lo que es lo mismo: voz. Weston también enfatizó cómo «la futura versión de Windows interactuará de manera multimodal. La computadora puede ver lo que vemos, escuchar lo que escuchamos y podemos hablar con él y pedir cosas mucho más sofisticadas». La interacción del idioma sin duda será uno de los botones, y aunque el mouse y el teclado siguen siendo relevantes, el progreso probablemente sea claro: lo usaremos menos porque simplemente seremos preguntar cosas de Windows.
Máquina, haz eso por mi. Por un lado, después de cosas simples como «La resolución a 1920×1080», «Abrir Slack», «escriba un correo electrónico con el siguiente texto» y para otras cosas más complejas como «organizar un fin de semana en Salamanca y reservar los hoteles y reservar después de mi confirmación» o «crear una presentación con Canva con los datos». En estas consultas probablemente hay momentos en los que el usuario continúa interviniendo para corregir o confirmar las tareas dentro de la secuencia que el sistema realiza de forma autónoma.
Una ventana agrícola. Y es el caso de que el componente clave de estas ventanas futuras será una IA agrícola, las tareas encadenadas de forma autónoma para completar los procesos que un usuario requiere. Los agentes de IA ya muestran su potencial a este respecto, y hemos visto que tanto aquellos que están presentes en el navegador de confusión como en el agente de Chatt pueden ver lo que vemos en la pantalla y actuar en consecuencia moviendo el mouse o escribiendo si es necesario. ¡Incluso superan a algunos Captchas si lo necesitan!
Una visión factible pero incierta. El progreso de la IA es desesperado, pero los agentes de IA no cumplen con las expectativas y, según algunos estudios, cumplen con el 70% de las tareas. Con este tipo de procesos automatizados, también existe el riesgo de que el error compuesto: si un error contiene un error en uno, este error será mayor en cada siguiente fase. Los riesgos son enormes en todos los tipos de escenarios, pero aún más si los usuarios usan esta capacidad para tareas confidenciales con datos confidenciales del tipo «Hazme la Declaración de Enconomía».
Nadella ya lo advirtió. Hace más de un año, Satya Nadella, CEO de Microsoft, ya señaló este futuro. Lo hizo cuando intervino en la cumbre de Snapdragon 2023, donde dicho «Lo cambiará radicalmente lo que es un sistema operativo, el aspecto de una interfaz de usuario y cómo interactúa con las aplicaciones».
Los navegadores amenazan. Ya estamos comenzando a ver esta interacción agrícola, que a menudo es el centro de nuestra experiencia con PC y computadoras portátiles, y que integran gradualmente estas funciones de automatización en los agentes de IA. Tanto el agente de ChatGPT como el comité de confusión lo muestran, y Google también se está preparando para hacer algo similar en Chrome. Se espera que en Microsoft Tú también aplicas La historia con Edge, el copiloto integrado largo. Sin embargo, la visión de Microsoft es más amplia e influye en todo el sistema operativo, no solo el navegador.
Imagen | Microsoft
En | La paradoja GPT-5: OpenAi necesita el mayor salto en la historia de la IA cuando parece más imposible