Cuando zigzagueo entre la gente en Nueva York, no puedo estar mirando mi teléfono para enviar mensajes de texto. Las herramientas de conversión de voz a texto se han vuelto cruciales para una comunicación rápida mientras se hace doble cara. teléfono inteligente y una hamburguesa de ternera jamaicana.
El problema es que a veces el sistema interpreta mal las palabras, omite la puntuación o deja de grabar por completo. Esto me hace detenerme en medio del tráfico de peatones, donde tengo que regresar y comenzar a editar, eliminando todas las comodidades que me brindaba la conversión de voz a texto. Francamente, esto debería solucionarse con la IA, la tecnología que está revolucionando la forma en que comercio, navegar por la web y lea sobre el fallecimiento de nuestros seres queridospara bien o para mal.
Ha habido algunos avances. Google presentó escritura de voz avanzada a principios de este año para propietarios de Pixel 6 y dispositivos más nuevos. Una vez habilitado, puedes editar textos con tu voz y la IA integrada podrá retroceder y corregir palabras mal pronunciadas. Por ejemplo, decir “eliminar la última palabra” elimina la última palabra y decir “borrar” borra la última oración. Para los propietarios de Pixel 8 y superiores, al decir “arreglarlo” aparecen sugerencias para mejorar sus mensajes de texto, con simples toques limpiando sus mensajes. Aquellos con teléfonos Pixel más nuevos también pueden indicarle a su dispositivo mediante voz que reorganice o reemplace palabras. Los propietarios de píxeles pueden incluso enseñarle a la IA a cambiar la ortografía de los nombres, como cambiar Christine por Christyne. Propietarios de Pixel 9 y 10 (excluyendo el Pixel 9A, lo cual es extraño porque Ambos tienen el mismo procesador y RAM.) pueden utilizar la IA para corregir, reformular o formalizar mensajes.
Aprender todas las funciones nuevas puede llevar un poco de tiempo. Pero una vez arraigado, el proceso de utilizar voz a texto es menos engorroso. Pero no funciona perfectamente y hay margen de mejora.
Si bien los dispositivos Pixel no tienen procesadores de última generación ni cámaras con la mayor cantidad de megapíxeles, Google se diferencia de competidores como Samsung y Motorola por su sólido soporte de software, que se ve impulsado aún más por la IA. Curiosamente, las ventas de Pixel son creciendo rápidamentesin embargo, la empresa no necesariamente quiere dominar el mercado cercano Mercado de teléfonos inteligentes de 600 mil millones de dólares. Google lo admitió en una entrevista con Bloomberg a principios de este año. En cambio, la principal estrategia comercial de Google ahora se centra en la IA. Ya sea Apple o Samsung, ambos lo harán (según se informa) utilizará Google Gemini.
A pesar de que los teléfonos Pixel no tienen suficiente potencia y considerando el poder de Google en la carrera de la IA, necesita descubrir cómo hacer que la voz a texto impulsada por la IA funcione para mostrar las posibilidades de su tecnología, algo que Google aún no ha logrado. Eso significa que le corresponde a Google mostrarle al resto de la industria que sus soluciones de inteligencia artificial en dispositivos móviles son las mejores, y sus teléfonos Pixel muestran ese desarrollo. Así es como puede funcionar para usted.
Cuando funciona el dictado por voz avanzado, es fantástico
Ver la IA de Google reemplazar o cambiar palabras con tu voz es genial. Verlo escribir el comando que le di en lugar de ejecutarlo no es tanto.
Eso es lo que hace que la escritura por voz avanzada parezca un juego de azar. Cuando funciona, es genial. Pero la cantidad de veces en las que la IA lucha por diferenciar entre las palabras destinadas a enviar mensajes y aquellas que necesitan ser arregladas es abundante.
Esta aleatoriedad es extraña porque la aplicación Gemini de Google en mi Pliegue del Pixel 10 Pro La unidad de revisión parece entenderme muy bien. Según Google, la discrepancia se debe a que el teléfono realiza la transcripción en el dispositivo, lo que significa que ejecuta un modelo de IA local más pequeño. Obviamente, un pequeño modelo de IA en un teléfono no puede competir con un centro de datos multimillonario utilizado para modelos basados en la nube. Google dice que publica mejoras con frecuencia.
La falta de signos de puntuación es una verdadera molestia
Tuve problemas con la puntuación en sistemas antiguos de voz a texto y tuve que decir en voz alta las palabras “coma”, “signo de exclamación” y “punto”. Con el dictado por voz avanzado, es automático. Pero incluso esta característica puede resultar irregular.
Cuando funciona, es una gran comodidad, ya que no necesito volver al mensaje de texto y agregar puntuación. Sin embargo, cuando no funciona, crea una frase larga, difícil de leer y continua que resulta frustrante de seguir y me hace parecer descuidado.
Esto podría cambiar las reglas del juego si Google lo hace bien
Los consumidores han sido desconcertados por la ola de funciones de IA que impregnan sus teléfonos. Claro, las ediciones rápidas de fotografías o la reescritura de correos electrónicos son útiles, pero a menudo estas funciones parecen aditivas en lugar de transformadoras.
Siento que a menudo, cuando los consumidores piensan en IA, piensan en TARS de la película Interstellar de 2014 o HAL 9000 en 2001: A Space Odyssey de 1968. A menudo, los sistemas de inteligencia artificial con los que interactuamos en nuestros teléfonos son simplemente formas más avanzadas de hacer lo que nuestros dispositivos ya han estado haciendo por otros medios.
Para que Google pueda escribir correctamente por voz avanzada, los modelos deben poder discernir la intención del dictado sin problemas. No puede haber este constante malabarismo donde funciona la mitad del tiempo. Para la mayoría, será sólo una molestia. Para mí, terminará con un error culinario y una hamburguesa de carne interceptada por una rata.
Cómo habilitar la escritura por voz avanzada en Pixel
- Ve a la aplicación Mensajes.
- Haz clic en cualquier contacto como si estuvieras a punto de empezar a enviar mensajes de texto.
- Toque el ícono que parece cuatro cuadrados en la esquina izquierda del teclado.
- Grifo Ajustes.
- Toca Escritura por voz.
- Doblar Funciones avanzadas de escritura por voz en.
Comandos de voz (Pixel 6 y superiores)
- Para eliminar la última palabra, diga: “Eliminar la última palabra”.
- Para eliminar la última frase, diga: “Borrar”.
- Para borrar el texto, diga: “Borrar todo”.
- Para enviar un mensaje, diga: “Enviar”.
- Para completar el siguiente campo abierto en un formulario, diga: “Siguiente”.
- Para agregar un emoji, diga el nombre del emoji, como “Emoji sonriente”.
- Para dejar de escribir por voz, diga: “Detener”.
Cómo utilizar “arreglarlo” (Pixel 8 y superiores, inglés, solo EE. UU.)
- Después de dictar un texto, diga: “Arréglalo”.
- Debería aparecer una ventana emergente con sugerencias.
- Es posible que esta característica no funcione para todos.
Utilice IA para realizar ediciones, revisiones y reescrituras detalladas (Pixel 8 y superiores, solo en EE. UU.)
- Di uno de los siguientes comandos.
- Debería ser automático, pero es posible que veas un Aplicar botón.
- Después de las ediciones, también puede decir “Deshacer” para revertir el comando.
- Elimine el mensaje completo diciendo “Borrar todo”.
- La función es experimental y es posible que no siempre funcione.
Comandos:
Comandos avanzados de escritura por voz para dispositivos Google Pixel.












