«La curiosidad de las personas es infinita. Cada día somos testigos de miles de millones de búsquedas y el 15 por ciento de estas consultas son nuevas: nunca las habíamos visto antes. Por lo tanto, estamos construyendo sistemas para ofrecer resultados a esas búsquedas que no podemos anticipar.».
Así comenta Pandu Nayak, vicepresidente del área de Búsqueda de la empresa de Mountain View, el lanzamiento de BERT, sobre el blog oficial de Google. Una actualización del algoritmo que sabe a revolución. El mismo Nayak explica que se trata “del mayor avance en los últimos cinco años y uno de los más importantes en la historia de la Search” en Google.
Google Bert: qué es y cómo funciona
BERT es un sistema que aprovecha el NLP, el Natural Language Processing: el tratamiento informático del lenguaje natural. Qué se entiende ¿para lenguaje natural? Es el idioma que efectivamente usamos cada día: no es el conjunto de normas y del vocabulario, sino que se refiere más a lo que nos decimos cada día y que escribimos, por ejemplo, en chat. En comparación con el lenguaje formal, el lenguaje natural es mucho más complejo de comprender y elaborar para una máquina, porque contiene muchos subentendidos, ambigüedades y a menudo no puede ser interpretado sin contexto.
Aquí: Google quiere volverse experto en comprender el lenguaje natural, que es el que a menudo utilizamos cuando realizamos una búsqueda (pensemos en el aumento exponencial de las búsquedas por voz en los últimos años). BERT ayudará por lo tanto al algoritmo a comprender mejor nuestras palabras clave de búsqueda, dicho en jerga consulta. Explicado en palabras simples: Google debería a partir de hoy dar más importancia al contexto y a las frases completas en lugar de a las palabras individuales.
Nayak subraya cómo el nuevo sistema también aprovecha el llamado aprendizaje automático, el aprendizaje automático por parte de una "máquina": en práctica, las inteligencias artificiales pueden (dentro de ciertos límites) aprender por sí solas, analizando los datos disponibles, por ejemplo en Internet.
Por el momento, el nuevo algoritmo funciona a pleno rendimiento solo con el inglés y hoy ya es capaz de aprender mejor alrededor del diez por ciento de las consultas en Estados Unidos. Pero, como explica aún Nayak, la nueva actualización estará pronto operativa en varias localidades del Planeta, con varios idiomas (ya se están realizando pruebas al respecto).
Cómo nace BERT
En 2018, Google inicia una interesante experimentación, llamada Representaciones de Codificadores Bidireccionales de Transformadores, de donde proviene el acrónimo BERT. Se trata de una plataforma código abierto, para probar las posibilidades de las técnicas de redes neuronales aplicadas al lenguaje natural. Una tecnología que ha permitido a cualquiera probar sus propios sistemas de respuesta automática.
La verdadera innovación aportada por esta tecnología reside en la T de Transformers. Estos son los modelos lógicos que permiten analizar las palabras en relación con todas las demás de la frase y ya no una detrás de otra.
Para implementar efectivamente la nueva actualización, Google tuvo que intervenir también con el fortalecimiento del hardware, no solo del software. BERT de hecho utilizará el TPU (Tensor Processing Unit), acelerador de inteligencia artificial constituido por un circuito ASIC (que la misma Google ha desarrollado). El sistema es indispensable para las aplicaciones en el sector de las redes neuronales. El TPU empleado para BERT está además en nube.
¿Qué cambia con Google Bert?
Intentemos ahora comprender efectivamente qué cambia con la llegada de BERT. Google ya ha ilustrado algunos ejemplos, para hacer todo más claro. Entre los más interesantes, está este sobre Taylor Swift:
Buscando en el motor de búsqueda la consulta "¿Cuántos años tenía Taylor Swift cuando Kanye subió al escenario?", antes Google devolvía un video de Kanye West en los MTV Video Music Awards. Después de la actualización, el primer resultado es un artículo de la BBC que responde exactamente a la pregunta.
Un segundo ejemplo interesante proviene de Search Engine Journal, periódico en línea especializado en la optimización SEO y SEM. El autor, Roger Montti, ilustra un pequeño "experimento" personal suyo:
La consulta en este caso es intraducible, "how to catch a cow fishing?”. Se trata de una expresión coloquial en el ámbito de la pesca, limitada al territorio de Nueva Inglaterra. Hasta hace poco tiempo, la palabra “cow” (vaca) engañaba a Google. Mientras el pesca de vacas es de hecho una técnica de pesca, el motor de búsqueda devolvía una serie de resultados relativos a las granjas.
El experimento fue repetido por Montti el 25 de octubre, después del lanzamiento de BERT: en este caso, Google “entendió” efectivamente lo que el usuario estaba buscando.
Aquí se explica más claramente cómo BERT comprende el contexto general de cada consulta, en lugar de las palabras individuales. Es fundamental entender esto porque significa que Google se centrará más en aclarar el llamado "intento de búsqueda", es decir, la intención o la necesidad detrás de la búsqueda. Para Google, ya no será importante entender las frases palabra por palabra, sino intuir qué impulsa la curiosidad humana, cuál es la necesidad detrás de la búsqueda.
Como es fácil de intuir, los profesionales de optimización SEO deberán tener cuidado en comprender el nuevo enfoque a las consultas de Google.
Según los primeros análisis de los expertos, el motor de búsqueda premiará a quienes utilicen una terminología apropiada según el contexto específico del que se habla en los artículos. El lenguaje genérico podría ser penalizado frente a una mayor atención hacia expresiones especializadas (como hemos visto en el caso del pesca de vacas). En cualquier caso, será cada vez más importante intentar "entrar en la mente del usuario": ¿por qué está buscando precisamente ese contenido? ¿Para qué le sirve? ¿Qué necesidad satisface? A estas preguntas habrá que responder de manera precisa.
Cada vez será menos importante llenar los artículos de palabras clave, cada vez más será útil comprender la intención de búsqueda. Será más eficaz crear contenidos en los que se utilice la terminología adecuada según el contexto específico al que se refieren, ofreciendo obviamente una respuesta más a las intenciones de búsqueda, en lugar de basarse exclusivamente en el número de palabras clave empleadas.
Sin embargo, la estructura de la página no se volverá obsoleta. Después de todo, un contenido claro, que ofrece respuestas simples e inmediatas, también está bien organizado. Como subraya nuevamente al Search Engine Journal, la experta en algoritmos Dawn Anderson “debemos enfatizar la importancia de utilizar estructuras claras”.