Conteúdos
SEMBrasil
Contato
Pesquisas
Newsletter

HOME > ARTIGOS > CANONICAL ELEMENT E CONTEÚDO DUPLICADO
Em SEO
Canonical element e Conteúdo duplicado
27/04/2009 - 11:57

Conteúdo Duplicado
Pode-se entender conteúdo duplicado como páginas com URLs distintas que possuem um mesmo conteúdo. Veja um trecho, por exemplo, de uma definição do Centro de Ajuda ao Webmaster do Google, sobre conteúdo duplicado:
"Duplicar conteúdo, geralmente refere-se a blocos substanciais de conteúdo dentro ou através de domínios que complementam outro conteúdo ou são notadamente similares. Geralmente, não é uma prática enganosa, a princípio."
Fonte: http://www.google.com/support/webmasters/
A ajuda do Google ainda exemplifica que o conteúdo duplicado não malicioso pode ocorrer em alguns casos, como:
Um outro exemplo, onde pode ocorrer conteúdo duplicado é em algumas ferramentas de blog. Por se tratar de um mecanismo que possui diversidade de navegação e categorização de artigos arquivados por: data, categoria, hora, entre outros, o "spider" pode encontrar duas páginas com endereços diferentes, mas, com o mesmo conteúdo.
Em outros tipos de websites isso também pode ocorrer, mas não entraremos a fundo nessa questão. O importante neste caso é que o leitor entenda que se trata de duas páginas iguais com URLs diferentes. Podemos definir conteúdo nesse caso como o conteúdo textual, o texto propriamente dito, o título da página e a meta tag descrição, por exemplo. O Google Webmaster Tools oferece um relatório onde é possível identificar se há conteúdo duplicado na descrição e nos títulos do seu site:
Jerry Ledford (2008) comenta que a distribuição de conteúdo pela internet também pode causar a duplicação de conteúdo. Em alguns casos porque alguns sites copiam trechos de conteúdos de outros, em outros casos porque uma chamada para um artigo, por exemplo, pode aparecer várias vezes em um ou mais websites.
Problemas causados pelo Conteúdo Duplicado
Penso que o maior inconveniente causado por esse problema é a queda no posicionamento do seu site, nos resultados orgânicos dos mecanismos de busca. Isso pode acontecer já que o robô do mecanismo de busca encontrará dois conteúdos iguais em URLs diferentes, entendendo isso como conteúdo duplicado ou mesmo como spam, uma técnica ilegal para repetição de palavras-chave em um mesmo domínio, com o objetivo de obter um melhor posicionamento nos resultados de busca.
Soluções conhecidas
Em sites com páginas feitas exclusivamente para impressão esse tipo de problema também pode ocorrer. Falo daqueles sites, onde em alguma notícia, por exemplo, você encontra um link com uma versão da página para a impressão. Trata-se de duas páginas, uma com a notícia dentro da estrutura do site, e outra com uma versão mais "clean" para a impressão. Se não houver nenhuma especificação para o robô, certamente isso poderá ser considerado conteúdo duplicado passível até de uma punição.
Nesse caso, imagine que todas as páginas para impressão fiquem em uma pasta "/ver-impressao". Sendo assim, basta bloquear a indexação e consideração dessa pasta pelo robots.txt, onde haverá uma regra:
User-agent: *
Disallow: /ver-impressao
Uma alternativa é o uso da meta tag "noindex". Para isso basta colocar dentro do <head>:
<head>
...
<meta name="robots" content="noindex">
</head>
Nesse último caso o robô só não irá indexar as páginas que possuírem esta meta informação.
Canonical Element
Este recurso pode e certamente irá ajudar muitos sites que sofrem com esse tipo de problema. A configuração básica trata de um colocar a tag no conteúdo original e na página onde o conteúdo é duplicado. Para um e-commerce, por exemplo, com URLs derivadas de parâmetros, a solução seria na página direcionada aos detalhes de algum produto, a implementação do canonical element. Vamos utilizar para este exemplo, uma loja de instrumentos musicais.
Página para marca de guitarras Gibson:
http://www.instrumentosmusicais.com/guitarras.php?marca=gibson
Vamos dizer que nesta página é possível escolher a cor da Guitarra, e que apesar da nova URL a página é a mesma, mudando somente a cor do instrumento:
http://www.instrumentosmusicais.com/guitarras.php?marca=gibson$var=vermelha
Nesse caso o robô pode considerar que essas duas páginas possuem o mesmo conteúdo. Sendo assim, basta "canonizar" uma das URLs, usando o canonical element dentro do cabeçalho das duas páginas:
<head>
...
...
<link rel="canonical" href="http://www.instrumentosmusicais.com/guitarras.php?marca=gibson"/>
</head>
Dessa forma o robô irá entender que se trata apenas de uma variação do conteúdo e que pode indexar só uma das páginas.
Em minha opinião, apesar de um recurso muito útil o canonical element não pode ainda resolver todos os problemas de conteúdo duplicado, mas certamente este avanço já mostra que os mecanismos de busca correm atrás de cada vez mais soluções para problemas como esse, a fim de qualificar ainda mais seus resultados.
Vejam o vídeo do Matt Cutts apresentando e explicado o canonical element: http://google.com/support/webmasters/bin/answer.py?answer=139394
Até a próxima!
Clique na estrela correspondente ao seu voto:




(2 votos)
Comentários
1 pessoa(s) comentaram até agora
pass4sure (anônimo)
12/03/2010 - 04:45
640-802 SY0-201 350-001 642-901 642-825 642-845 642-812 640-822 640-816 VCP-410 642-892 N10-004 642-642 642-436 350-030 640-863 220-701 CISSP 640-553 642-504 646-204 350-018 642-426 642-524 642-456 642-873 640-460 220-702 642-446 642-533 220-602 220-601 EX0-101 642-383 646-671 642-373 PMI-001 310-200 642-691 350-029 640-721 JK0-016 156-215.65 642-566 642-971 642-654 642-415 642-105 HP0-J33 642-661 642-515 646-230 642-062 352-001 650-621 642-611 310-202 650-251 312-50 HP0-S21 642-067 650-180 EC0-350 646-363 VCP-310 642-164 PK0-002 HP0-S20 642-072 646-046 646-563 650-175 650-393 646-656 350-050 642-481 642-357 642-655 000-331 132-S-911 SK0-002 JN0-522 BR0-001 HP0-D04 1Y0-A05 1Z0-042 1Y0-259 642-359 350-030 TK0-201 JN0-342 JN0-331 642-591 1Y0-A08 350-001 642-746 HP0-J22 BH0-006 642-974 640-802 642-631 642-681 646-985 1Z0-053 642-973 132-S-900 310-065 642-975 350-040 1Z0-051 642-145 XK0-002 1Y0-A11 PW0-104 156-315 NS0-163 SY0-101 642-736 JN0-532 BH0-004
Avisos
Os itens com asterisco (*) são campos de preenchimento obrigatório.
Todos devem se identificar através do e-mail válido.
Os e-mails dos usuários não serão divulgados no site.
Os comentários estão sujeitos à moderação.
Enviar Comentário
Calendário
|
|||||||||||||||||||||||||||||||||||||||||||||||||
Eventos pagos
Eventos gratuitos
Eventos pagos e gratuitos
Painel do Usuário
Colunistas
Canonical element e Conteúdo duplicado
Mais com menos: a palavra-chave é Performance
Como contratar um fornecedor de SEO?
Google SearchWiki: impacto em resultados orgânicos?
Patrocínio