O Google usa cerca de 40 sinais para determinar URLs canônicos
Em um episódio recente do podcast Search Off the Record do Google, Allan Scott, da equipe “Dups”, explicou como o Google decide qual URL considerar como principal quando há páginas duplicadas.
Ele revelou que o Google analisa cerca de 40 sinais diferentes para escolher o URL principal de um grupo de páginas semelhantes.
Cerca de 40 sinais para seleção de URL canônico
O conteúdo duplicado é um problema comum para os mecanismos de pesquisa porque muitos sites possuem várias páginas com conteúdo igual ou semelhante.
Para resolver isso, o Google usa um processo chamado canonicalização. Este processo permite que o Google escolha um URL como versão principal para indexar e mostrar nos resultados de pesquisa.
O Google discutiu a importância de usar sinais como tags rel=”canonical”, sitemaps e redirecionamentos 301 para canonicalização. No entanto, o número de sinais envolvidos neste processo é maior do que você imagina.
Scott revelou durante o podcast:
“Não tenho certeza de qual é o número exato agora porque ele sobe e desce, mas suspeito que seja algo em torno de 40.”
Alguns dos sinais conhecidos mencionados incluem:
- rel = tags “canônicas”
- Redirecionamentos 301
- HTTPS x HTTP
- Mapas de site
- Vinculação interna
- Comprimento do URL
O peso e a importância de cada sinal podem variar, e alguns sinais, como tags rel=”canonical”, podem influenciar tanto o processo de agrupamento quanto de canonicalização.
Sinais de equilíbrio
Com tantos sinais em jogo, Allan reconheceu os desafios na determinação do URL canônico quando os sinais entram em conflito.
Ele afirmou:
“Se os seus sinais entrarem em conflito entre si, o que vai acontecer é que o sistema começará a recorrer a sinais menores.”
Isso significa que, embora sinais fortes como tags rel=”canonical” e redirecionamentos 301 sejam cruciais, outros fatores podem entrar em jogo quando esses sinais não são claros ou contraditórios.
Como resultado, o processo de canonização do Google envolve um delicado ato de equilíbrio para determinar o URL canônico mais apropriado.
Melhores práticas para canonização
Sinais claros ajudam o Google a identificar o URL canônico preferido.
As melhores práticas incluem:
- Use tags rel=”canonical” corretamente.
- Implemente redirecionamentos 301 para conteúdo movido permanentemente.
- Certifique-se de que as versões HTTPS das páginas estejam acessíveis e vinculadas.
- Envie sitemaps com URLs canônicos preferidos.
- Mantenha os links internos consistentes.
Esses sinais ajudam o Google a encontrar os URLs canônicos corretos, melhorando o rastreamento, a indexação e a visibilidade de pesquisa do seu site.
Erros a evitar
Aqui estão alguns erros comuns a serem observados.
1. Tags canônicas incorretas ou conflitantes:
- Apontando para páginas inexistentes ou 404
- Várias tags canônicas com URLs diferentes em uma página
- Apontando para um domínio totalmente diferente
Consertar: verifique novamente as tags canônicas, use apenas uma por página e use URLs absolutos.
2. Cadeias ou loops canônicos
Quando a página A aponta para a página B como canônica, mas a página B aponta de volta para A ou outra página, criando um loop.
Consertar: certifique-se de que os URLs canônicos sempre apontem para a versão final preferida da página.
3. Usando tags noindex e canônicas juntas
Envio de sinais confusos para mecanismos de pesquisa. Noindex significa não indexar a página, tornando os canônicos irrelevantes.
Consertar: Use tags canônicas para consolidação e noindex para exclusão.
4. Canonização para páginas redirecionadas ou noindex
Apontar canônicos para páginas redirecionadas ou sem índice confunde os mecanismos de pesquisa.
Consertar: URLs canônicos devem ter status 200 e indexáveis.
5. Ignorando a distinção entre maiúsculas e minúsculas
Caixas de URL inconsistentes podem causar problemas de conteúdo duplicado.
Consertar: mantenha a consistência do URL e da tag canônica.
6. Ignorando paginação e parâmetros
Conteúdo paginado e URLs com muitos parâmetros podem causar duplicação se manuseados incorretamente.
Consertar: use tags canônicas apontando para a primeira página ou “Ver tudo” para paginação e mantenha os parâmetros consistentes.
Principais conclusões
É improvável que a lista completa de mais de 40 sinais usados para determinar URLs canônicos seja disponibilizada publicamente.
No entanto, esta ainda foi uma discussão perspicaz que vale a pena destacar.
Aqui estão as principais conclusões:
- O Google usa aproximadamente 40 sinais diferentes para determinar URLs canônicos, com tags rel=”canonical” e 301 redirecionamentos entre os indicadores mais fortes
- Quando os sinais entram em conflito, o Google recorre a sinais secundários para tomar sua decisão
- A implementação clara e consistente de sinais de canonização (tags, redirecionamentos, mapas de sites, links internos) é crucial
- Erros comuns como cadeias canônicas, sinais mistos ou implementações incorretas podem confundir os mecanismos de pesquisa
Ouça a discussão completa no vídeo abaixo:
Imagem em destaque: chatiyanon/Shutterstock