Como funciona o algoritmo do Google?

Como funciona o algoritmo do Google?

Como funciona o algoritmo do Google?

O algoritmo do Google é um conjunto de operações que define a forma como os resultados das buscas serão apresentados aos usuários. Para entender como ele funciona, vamos explicar como tudo começou.

Era uma vez a web. Um local inóspito, com apenas alguns sites perdidos e GIFs malfeitos. Porém, não demoraria para esse lugar ser ocupado por centenas de páginas e internautas em busca de muita informação e entretenimento.

Para facilitar a vida de quem chegava a esse novo mundo, surgiram os mecanismos de busca, com algoritmos especializados em indexar e organizar as páginas da web.

página inicial do google antigamente
Fonte: The Telegraph

Com eles, ficou mais fácil encontrar qualquer coisa entre uma infinidade de conteúdos que começavam a povoar a internet.

Porém, não era tudo uma maravilha. Os algoritmos ainda se baseavam em fórmulas simples para o rankeamento.

Por isso, não precisava ser nenhum expert para se aproveitar deles e conquistar as melhores posições. Valia tudo para ganhar mais visibilidade e cliques! Surgia assim o black hat, o grande inimigo do Google.

Para salvar a qualidade da experiência do usuário, então, os buscadores passaram a empreender uma batalha contra os vilões da internet.

Assim, os algoritmos foram se tornando cada vez mais complexos para bloquear as más práticas e, ao mesmo tempo, valorizar os sites que entregassem os melhores resultados aos usuários.

Essa historinha dos primórdios do SEO ajuda a explicar o grande propósito do algoritmo do Google: melhorar a experiência de busca e a navegação.

É com esse objetivo que o algoritmo funciona. Ele serve para descobrir, entender e organizar todo o conteúdo da internet, a fim de entregar as melhores respostas para as pesquisas dos usuários.

Buscadores, em suma, são máquinas especializadas em responder dúvidas dos usuários. Então, o melhor resultado é aquele que traz a melhor resposta, que está não só no conteúdo que a página entrega, mas também na qualidade da experiência de navegação.

Para chegar aos resultados ideais, o Google percorre um caminho que começa muito antes de o usuário digitar sua pesquisa no buscador.

Neste vídeo, você pode ver uma explicação do Google sobre como isso acontece. Na sequência, vamos detalhar um pouco mais esse processo.

1. Rastreamento (Crawling)

Imagine vários robozinhos atrás de todo código e conteúdo que existem na internet. É isso que acontece no processo de rastreamento, que é feito a todo momento, independentemente das buscas dos usuários.

Nessa etapa, o Googlebot busca novas URLs para serem indexadas em seu enorme banco de dados. As páginas descobertas que contêm links indicam novos caminhos para que os robôs continuem o rastreamento encontrando outras URLs.

Portanto, a primeira medida de uma estratégia de SEO deve ser esta: ser encontrado pelos robôs do Google. Para isso, você precisa ter códigos e conteúdos que o Googlebot consiga ler e indexar.

O robô não consegue ler conteúdos em flash, por exemplo, o que impede que eles sejam rastreados.

Então, o desenvolvimento de sites com códigos HTML — preferencialmente simples e limpos, organizados em sitemaps — garante que seu conteúdo esteja acessível aos rastreadores.

2. Indexação (Indexing)

A indexação é o segundo passo, que também acontece a todo momento. Após o rastreamento, as URLs já podem ir para o banco de dados do buscador, que é chamado de Índice da Pesquisa.

Trata-se de uma grande biblioteca de páginas e arquivos que guarda uma infinidade de conteúdos da web.

Como, então, organizar todos esses conteúdos para que eles possam ser facilmente encontrados e acessados pelos usuários?

Durante o rastreamento, os robôs processam os dados das páginas, da mesma forma que os navegadores. Então, os servidores do Google detectam esses dados — como a idade do conteúdo, o tempo de carregamento e os textos — e registram no índice da pesquisa.

Cada página é registrada no índice para todas as palavras que ela contém. Porém, a inteligência do buscador permite que ele entenda quais são as palavras-chave mais importantes, conforme seu contexto geral, a frequência e os locais (títulos, cabeçalhos, corpo do texto etc.) em que elas aparecem. Então, esses termos funcionam como entradas para a página.

Assim, quando um usuário faz uma pesquisa, o termo de busca representa a entrada para todas as páginas que contêm aquela palavra-chave pesquisada. Quais serão exibidas e em que ordem, são os algoritmos de busca que vão definir no rankeamento.

3. Rankeamento (Ranking)

O rankeamento é o próximo passo. É aqui que o algoritmo do Google entra em ação! Aliás, o buscador usa não apenas um, mas uma série de algoritmos para fazer a classificação dos sites.

A intenção é entregar as melhores respostas ao usuário, em uma ordem que coloque os links mais relevantes nos primeiros lugares. Então, entenda que quanto mais perto do topo uma página estiver, mais relevante ela será para aquela busca.

Para isso, toda vez que um usuário faz uma pesquisa, esses algoritmos vasculham o índice e analisam vários fatores de rankeamento — estima-se que sejam mais de 200, mas o Google não revela exatamente quais são eles.

Tudo isso acontece em apenas uma fração de segundo, para que o usuário tenha as respostas o mais rápido possível.

Primeiramente, o algoritmo do Google trata de entender as pesquisas dos usuários, considerando que as palavras têm diferentes significados e que as pessoas usam uma linguagem natural na busca.

Uma atualização recente do algoritmo, chamada de BERT, tornou essa compreensão ainda mais sofisticada (mais adiante vamos falar sobre ela).

Depois, o algoritmo faz a correspondência entre o termo de busca e o conteúdo das páginas. É nesse momento que ele procura no índice as páginas indexadas para aquela palavra-chave. Quando essa correspondência ocorre, significa que a página é relevante para aquela consulta.

Então, é hora de classificar essas páginas em uma ordem que seja relevante para o usuário. Para isso, o Google procura entender se as páginas são informativas, confiáveis e de qualidade.

A análise dos elementos do site e da página, os links que recebe de outros sites e os sinais da experiência do usuário são determinantes para isso.

Esses fatores ainda recebem diferentes pesos conforme a intenção da busca. A idade de criação do conteúdo, por exemplo, é um fator muito mais relevante para pesquisas por notícias atuais do que para consultas sobre o significado de uma palavra.

Além disso, o Google exibe SERPs personalizadas. Isso significa que um site que aparece em primeiro lugar para um usuário pode não aparecer para outro, porque o rankeamento é influenciado pela localização, histórico de buscas e configurações de pesquisa de cada pessoa.

Depois de todo esse processo, o Google garante que os resultados e a ordem que são exibidos sejam relevantes para o usuário. Mas, para ter certeza disso, o buscador roda uma série de testes automatizados e ainda conta com milhares de avaliadores externos no mundo inteiro, que monitoram e julgam manualmente a qualidade dos resultados das buscas.

Embora o rastreamento e a indexação sejam essenciais, é no rankeamento que se concentra o foco do SEO. Afinal, ninguém quer ser apenas rastreado ou indexado ― a intenção do SEO é chegar nas primeiras posições do ranking!

Por esse motivo, existem várias pesquisas e estudos, como os realizados pela Moz. Eles analisam, na prática, os efeitos de determinada ação de otimização no posicionamento.

Velocidade do site, design responsivo, usabilidade, qualidade dos backlinks, taxa de cliques na SERP e tempo de permanência na página são alguns prováveis fatores de rankeamento identificados nos estudos.

Além dessas análises, algumas declarações do próprio Google e de seus funcionários também ajudam a decifrar os fatores de rankeamento. É o caso dos canais do Google e do Google Webmasters no YouTube, cheios de orientações e dicas sobre o sistema de busca.

Um documento do Google que deve ser norteador para os profissionais de SEO é o Search Quality Rater Guidelines.

Esse documento informa as diretrizes do Google para a avaliação de qualidade dos resultados da busca pelos avaliadores externos, que mencionamos antes.

Então, elas servem também como balizadoras para as estratégias de otimização, já que mostram os critérios do Google para dizer o que é uma página de qualidade.

4. Respostas úteis

Até alguns anos atrás, os sistemas de busca do Google cumpriam seu trabalho nesse ciclo de rastreamento, indexação e rankeamento.

Porém, em 2012, o buscador começou um movimento que mudou a forma de exibir os resultados da busca, o que adicionaria uma nova etapa nesse processo.

Naquele ano, era lançado o Knowledge Graph, ou Mapa de Conhecimento. Trata-se de um grande banco de dados sobre fatos e conexões que permite ao buscador entregar respostas prontas aos usuários, quando fazem perguntas como “Quem foi Marie Curie?” ou “Quando nasceu Leonardo da Vinci?”.

Perceba, no exemplo abaixo, que as respostas já estão na SERP — a pessoa não precisa nem ver a lista de links orgânicos ou pagos para ter a informação que deseja.

Knowledge Graph para marie curie

O buscador percebeu que seu papel é entender o que o usuário busca e responder aquilo que ele espera. E, muitas vezes, o que ele espera é uma resposta pronta e rápida, não uma lista de sites.

Então, com essa atualização, o Google começou a aprimorar o algoritmo para entregar respostas mais úteis e no formato ideal para o tipo de informação buscada.

Esse é o caso das buscas por rotas e trânsito, por exemplo. Quando alguém pesquisa por “como chegar à rodoviária”, é provável que a pessoa queira ver as melhores rotas de acesso à rodoviária da cidade em que ela está.

Por isso, o Google já entrega um mapa do Google Maps na SERP, acima dos resultados orgânicos. Entregar uma lista de links, em que ela ainda teria que procurar e ler as orientações, poderia ser frustrante.

Knowledge Graph com mapa do google maps

Outro exemplo é a busca por horários no cinema. Para que o usuário não precise visitar cada sala de cinema da cidade, o Google licencia as informações desses sites e oferece todos os horários já na SERP. Quando é possível, há também o link para comprar ingressos.

Knowledge Graph com horários de cinema

Além desses exemplos, existe uma infinidade de consultas que ativam as respostas rápidas do Google. E cada vez mais o buscador aprimora o algoritmo para entender as buscas dos usuários e entregar respostas úteis a eles.