Los gigantes tecnológicos invierten millones de dólares en desarrollar asistentes de voz cada vez más precisos. Del otro lado se encuentran consumidores abiertos al cambio. ¿Qué pueden hacer las demás empresas para aprovechar esta tendencia creciente?
Por Andrea Norzagaray
Antes de Silicon Valley, de Apple, de Amazon, de Google y de Microsoft estaba Bell Labs. Dentro de los muros de esta compañía estadounidense sus científicos crearon el transistor, la batería solar y el fax.
Estas y otras innovaciones les valieron premios Nobel y suficiente credibilidad, tanto en la industria de fabricantes de electrónicos como en la científica.
En ese campo fértil plagado de mentes brillantes, recursos y presupuesto fue inventada Audrey (Automatic Digit Recognition), uno de los primeros sistemas que pretendían reconocer voz humana. Eran los años cincuenta.
Los ingenieros detrás de este invento decidieron que un primer paso para llegar al reconocimiento de voz digno de películas de ciencia ficción sería la comprensión de dígitos del uno al nueve por parte de las “máquinas”.
En ese momento Audrey consumía demasiada energía, ocupaba un espacio físico enorme, el sistema era lento y caro.
Sin embargo, su precisión era excepcional con 90% de asertividad al reconocer un dígito hablado por su desarrollador, H.K. Davis (el porcentaje disminuía con voces con las que no estaba familiarizado).
Audrey sentaría las bases para lo que parece ser la gran esperanza de las Big Tech.
Gene Munster, de la firma de inversión Loup Ventures, estima que los gigantes tecnológicos están gastando 10% combinado de su presupuesto anual de investigación y desarrollo –más de 5,000 millones de dólares en total– específicamente en reconocimiento de voz.
“Parece que el ciclo de vida de los smartphones se agota. La gente repone menos sus teléfonos y todos se parecen demasiado.
Al mismo tiempo, algunos de los gigantes de la tecnología que se han quedado afuera en la competencia de los dispositivos (como Amazon) quieren explorar si la voz les puede permitir entrar en la vida de sus clientes”, afirma Ricardo Pérez, profesor de IE Business School.
Esta ubicuidad ha levantado algunas reservas alrededor de la seguridad de los usuarios. De hecho, Apple, Amazon y Google han estado involucrados en escándalos por la violación de la privacidad de sus usuarios a través de tales dispositivos.

ROBOTINA 2024
Como si fuera una escena revolucionada de Los Supersónicos, los asistentes de voz representan una infinidad de posibilidades para volver a los hogares ambientes totalmente inundados por la tecnología.
CIRCO, MAROMA Y TEATRO
Décadas después de Audrey y de los esfuerzos para perfeccionar la precisión del reconocimiento de voz, esta innovación está al alcance de usuarios dispuestos a pagar unos cuantos pesos (menos de 100 dólares) por un aparato habilitado con un asistente de voz.
Siri, de Apple, fue la aplicación pionera al estar incluida su asistente en el iPhone 4S, pero más tarde otros se unirían a la tendencia: Google Assistant; Alexa, de Amazon, y Cortana, de Microsoft.
Gracias a la Inteligencia Artificial (AI), estos asistentes pueden mantener conversaciones – con algunas limitaciones– y resolver peticiones de los usuarios.
La mayoría tiene funciones similares entre sí: cumplir peticiones musicales, dar el reporte de clima, ofrecer noticias, contar chistes y hacer trucos.
En las pasadas fiestas patrias podías ordenar: “Alexa, da el grito”, o “Alexa, cantinflea”; mientras que con Google Assistant puedes debatir con un simple: “Ok, Google: ¿La quesadilla debe llevar queso?”.
¿Cómo no enamorarse de estas funciones? Ahora cobra mayor sentido el amorío del protagonista de la cinta de Spike Jonze, Her, Theodore Twombly (Joaquin Phoenix), con Samantha (Scarlett Johansson), donde ésta era un avanzado sistema que funciona a través del audio.
Para Carlos Pérez, country manager de Alexa México, su asistente busca simplificar las rutinas diarias de los consumidores. “Pueden solicitar Uber y, mientras se alistan, pedir la cena a Domino’s.
Los usuarios de Alexa pueden crear rutinas personalizadas basadas en las necesidades de cada uno”, comenta el ejecutivo.
Esto se logra a través de las Skills, funcionalidades que son añadidas por terceros al asistente de voz, similares a las aplicaciones en un smartphone.
La asistente de Amazon también se encuentra en soundbars de Sonos, audífonos de Jabra y autos como BMW, Ford y Toyota, lo que asegura que hay vida afuera de Echo, la bocina insigne de la marca de Jeff Bezos.
UN ALIADO EN EL SERVICIO
Además de estas alianzas existe una oportunidad para las marcas.
De acuerdo con Elizabeth Hopkins, country manager de Alexa Skills México, “las empresas aprovechan nuestra experiencia en diseño de voz para reinventar la relación con sus clientes, con nuevas formas de interacción basadas en la voz e incluso con comandos táctiles y visuales”.
El equipo de Starbucks México desarrolló “Skill” de trivias para reforzar el conocimiento de sus principales atributos de una forma dinámica y, de paso, premiar a sus seguidores más leales.
El usuario activa el Skill en su bocina al decirle “Alexa, inicia la trivia de Starbucks”.
En ese momento comienza a hacer preguntas como “¿Cuál es nuestra famosa bebida de otoño?” Si el usuario (o cliente) las responde correctamente, lo recompensa con un cupón que puede canjear en una tienda.
Otros ejemplos en el país están en marcas como Domino’s Pizza, Open English, Kiwilimón, Axtel y el juego de mesa Maratón.
¿Cómo lo logran? La plataforma de Alexa Skills Kit es gratuita y está disponible para todo el público, así que permite a las empresas el desarrollo de sus propias Skills.
Por su parte, el omnipresente Google ha tenido éxito gracias a su presencia en sistemas operativos de iOS y Android, y en marcas como Sony, Bang & Olufsen –de audio–, August –candados inteligentes– y Philips LED –iluminación–.
Emiliano Arriaga, gerente de Mercadotecnia de Asistente de Google, agrega que “es una plataforma abierta a nuevas experiencias.
Hoy podemos interactuar con uno de los personajes favoritos de los mexicanos, como es el caso de Club de Cuervos”. Con esta funcionalidad, una de las series de Netflix llevó su contenido fuera de la pantalla.
Google Assistant también ofrece una alternativa para que otras compañías liberen su creatividad con Actions on Google, plataforma disponible para que desarrolladores diseñen sus propias experiencias con el usuario.
Las marcas, claro, se han subido a esta facilidad.
Para Arriaga es emocionante pensar en un México donde tecnologías como ésta puedan ayudar a millones de ciudadanos cada día, desde temas básicos como pedir el súper, agilizar trámites o detectar situaciones de riesgo de salud.
“Puede que falten 40 años para eso, o quizá cuatro. Esto dependerá de la creatividad y entusiasmo de usuarios y desarrolladores”.

EL CASO DEL BANCO QUE HABLA
El recientemente rebautizado banco BBVA lanzó en agosto del año pasado un asistente virtual disponible por WhatsApp y Alexa –se debe activar el Skill correspondiente en la categoría de Negocios y Finanzas–.
Esta institución fue reconocida como la primera del sector financiero en México en utilizar la IA a través de WhatsApp para atender al cliente (y además lo hace 24/7). Con la ayuda de machine learning brindan un servicio que mejora constantemente gracias a las interacciones con sus usuarios.
Esta tecnología, conocida como el Asistente Virtual de BBVA, es capaz de procesar mensajes de texto y voz, y brindar una respuesta en menos de 15 segundos.
Permite al usuario obtener información sobre ubicación de sucursales, tipo de cambio, asesoría en la contratación de cuentas y sugerencias en el uso de soluciones digitales.
Hugo Nájera Alva, director general de Desarrollo de Negocios de BBVA, ha declarado su interés porque esta institución financiera continúe incrementando las capacidades de los asistentes virtuales para permitir transacciones.
Es decir, un usuario puede dar una instrucción de voz para hacer movimientos financieros entre sus propias cuentas.
No solo eso. Es debido al acceso y análisis del comportamiento de los clientes que en este caso BBVA puede aprender e incluso predecir lo que requiera el usuario.
“Cambiamos el paradigma en el que anteriormente los clientes tenían que aprender nuestros procesos, ya que ahora nosotros aprendemos de ellos para generar experiencias de servicio que sean ágiles, pero sobre todo seguras”, señala Sergio Torres Lebrija, director de Estrategia e Innovación de BBVA México.
Además, al estar disponible no solo en la bocina de la casa, sino en los smartphones que cada vez están más presentes, le pueden llegar a personas con problemas de visión y le pueden dar una “cara” más humana, al utilizar la voz.
En un futuro no muy lejano será factible decirle “adiós” no solo a la fila del banco, sino también a los teclados de los teléfonos inteligentes, aunque sigan pendientes aún temas de privacidad, seguridad y, claro, acentos regionales.
Como era de esperarse, los asistentes de voz no han estado libres de críticas sobre su uso y recopilación de datos. Recientemente, Google generó más restricciones sobre el acceso que sus empleados puedan tener sobre las grabaciones de los usuarios.
Lo mismo ha pasado desde la creación de Siri, pues todos estos asistentes de voz requieren un acceso casi ilimitado al sonido ambiente de sus dispositivos, donde se pueden grabar desde momentos íntimos hasta posibles evidencias de crímenes.
Esto abre nuevas incógnitas y posibilidades que aún quedan por resolverse. Pero como suele suceder con la tecnología, primero avanzan las implementaciones y después se hace una reparación de daños.