Machine learning en tu smartphone: cómo los algoritmos predicen lo que escribirás

Ciudad de México, 04-05-2019 |

El aprendizaje automático, incluso sin una comprensión del lenguaje, logra hacer funcionar los predictores de texto

¿Alguna vez te has preguntado cómo es posible que tu teléfono inteligente tenga la capacidad de predecir lo que escribirás en redes sociales? Agradéceselo al aprendizaje automático. Tu smartphone cuenta con algoritmos de machine learning, estos aprenden a partir de modelos lingüísticos combinados con datos de ejemplo, datos del usuario y datos de "amigos" del usuario. Cuando de predictores de texto se trata, es de suma importancia el conjunto de datos del idioma de entrada para las predicciones resultantes. Por ello, a continuación te explicamos cómo, incluso sin una comprensión del lenguaje, los predictores de texto funcionan.

Para poder hacer predicciones útiles, un predictor de texto necesita tanto conocimiento sobre el lenguaje en cuestión como sea posible, y esto a menudo se logra mediante tecnologías de aprendizaje automático. Luego de observar las últimas palabras escritas por el usuario y compararlas con todos los grupos de palabras vistas durante su fase de capacitación, el algoritmo produce la mejor conjetura a partir de lo que anteriormente siguió a grupos de palabras similares.

Denominado predicción de texto sensible al contexto, este enfoque presenta una desventaja: depende de grupos similares de palabras disponibles. ¿Cómo pasar a un predictor de texto lo suficientemente bueno para ser usado en la práctica? Se requieren dos cosas más: una lista de palabras utilizadas frecuentemente por el usuario (a manera de respaldo) y limitar el conjunto de predicciones probables en función de lo que el usuario ya ha escrito hasta ese momento. El resultado es un modelo de lenguaje estadístico muy simple.

¿Cuáles son los perfiles laborales tecnológicos más buscados por empresas en #México?

En el mundo, el auge de las #tecnologías cognitivas exige cada vez más especialistas en #MachineLearning o #IoT.

?? https://t.co/gUgAaGy7Wn pic.twitter.com/hGYSvMrtoO
— My Press (@mypress_mx) March 22, 2019

¿Qué pasa cuando los algoritmos de aprendizaje automático además echan mano de datos de los "amigos" del usuario? Tomemos por ejemplo Twitter: cuanto más similares sean dos cuentas del estrato conversacional de Internet, más probabilidades habrá de predecir correctamente los tweets de forma mutua. Es decir, un "amigo" sería un usuario con intereses, temas o etiquetas similares a los tuyos: #ciencia, #tecnología, #literatura, #GoT (Game of thrones), #IoT (Internet of Things), #Netflix, #ApexLegends, #Homecoming, #Avengers y un largo etcétera.

Lo anterior funciona muy bien cuando los usuarios tienen miles de tweets, pero ¿cómo hacerlo funcionar para personas con menos datos disponibles? La respuesta está en las interacciones: personas que conversan entre sí tienden a hacerlo más por igual, una idea muy útil en este caso. Las menciones (al usar "@") se convierten en una nueva fuente de información útil para los modelos lingüísticos de los predictores de texto en Twitter.

#Negocios | 5 formas en que el machine learning puede acelerar los emprendimientos. Todos y todo #emprendimiento desean aprovechar los avances recientes en el campo del aprendizaje automático.
????https://t.co/bfJUznRlBN pic.twitter.com/I5ZNVCSeol
— My Press (@mypress_mx) April 13, 2019

Tal técnica, la de emplear datos de "amigos" del usuario, hace posible predecir lo que alguien quiere decir, incluso si no se tiene material previo de una persona en particular. Personas con afasia o quienes no pueden hablar bien a causa de una parálisis podrían encontrar de gran ayuda estas tecnologías, pues los algoritmos de aprendizaje automático puede ser entrenados con el lenguaje de las personas a su alrededor; esto se conoce como "trasplante de lenguaje".

Machine learning o aprendizaje automático, esta es la tecnología detrás de la capacidad de los algoritmos para predecir lo que escribirás. Se trata de una técnica simple de predicción del lenguaje, basada en la reproducción de las entradas y el material de entrenamiento; en conjunto, estos datos influyen en las predicciones resultantes. No es solo una cuestión de alimentar al predictor de texto con el lenguaje, sino también de asegurarse de que este lenguaje sea similar al necesitado en las predicciones.