SEM Brasil - Home

Primeiro portal sobre Search Engine Marketing do Brasil

HOME   |   CADASTRO   |   BLOGS   |   FÓRUM   |   RSS  

HOME > ARTIGOS > CANONICAL ELEMENT E CONTEÚDO DUPLICADO

Em SEO

Canonical element e Conteúdo duplicado

27/04/2009 - 11:57

Por Erick Beltrami Formaggio

Erick Beltrami Formaggio - Colunista do SEMBrasil

Imprimir esta páginaApontar erroAumentar/Diminuir o tamanho da fonte


Canonical element tem como objetivo "resolver" um problema incômodo: o conteúdo duplicado.

Canonical element é um novo recurso disponibilizado pelos mecanismos de busca, que tem como objetivo "resolver" um problema incômodo: o conteúdo duplicado. Vou comentar alguns pontos deste novo recurso, mas antes acredito que seja conveniente fazer algumas definições rápidas para aqueles que ainda não conhecem bem o que é conteúdo duplicado. Sendo assim, vou:

  • Falar sobre os problemas causados pelo conteúdo duplicado;
  • Definir o que é conteúdo duplicado;
  • Mostrar os problemas que isso pode causar;
  • Comentar algumas soluções conhecidas; e
  • Falar sobre o recurso recentemente lançado o Canonical element.

    Conteúdo Duplicado

    Pode-se entender conteúdo duplicado como páginas com URLs distintas que possuem um mesmo conteúdo. Veja um trecho, por exemplo, de uma definição do Centro de Ajuda ao Webmaster do Google, sobre conteúdo duplicado:

    "Duplicar conteúdo, geralmente refere-se a blocos substanciais de conteúdo dentro ou através de domínios que complementam outro conteúdo ou são notadamente similares. Geralmente, não é uma prática enganosa, a princípio."
    Fonte: http://www.google.com/support/webmasters/

    A ajuda do Google ainda exemplifica que o conteúdo duplicado não malicioso pode ocorrer em alguns casos, como:

  • Fóruns de discussão que podem gerar páginas tanto regulares quanto reduzidas, em dispositivos móveis;
  • Produtos exibidos ou relacionados por link via URLs distintos; e
  • Versões de sites apenas para impressão.

    Um outro exemplo, onde pode ocorrer conteúdo duplicado é em algumas ferramentas de blog. Por se tratar de um mecanismo que possui diversidade de navegação e categorização de artigos arquivados por: data, categoria, hora, entre outros, o "spider" pode encontrar duas páginas com endereços diferentes, mas, com o mesmo conteúdo.

    Em outros tipos de websites isso também pode ocorrer, mas não entraremos a fundo nessa questão. O importante neste caso é que o leitor entenda que se trata de duas páginas iguais com URLs diferentes. Podemos definir conteúdo nesse caso como o conteúdo textual, o texto propriamente dito, o título da página e a meta tag descrição, por exemplo. O Google Webmaster Tools oferece um relatório onde é possível identificar se há conteúdo duplicado na descrição e nos títulos do seu site:

    Jerry Ledford (2008) comenta que a distribuição de conteúdo pela internet também pode causar a duplicação de conteúdo. Em alguns casos porque alguns sites copiam trechos de conteúdos de outros, em outros casos porque uma chamada para um artigo, por exemplo, pode aparecer várias vezes em um ou mais websites.

    Problemas causados pelo Conteúdo Duplicado

    Penso que o maior inconveniente causado por esse problema é a queda no posicionamento do seu site, nos resultados orgânicos dos mecanismos de busca. Isso pode acontecer já que o robô do mecanismo de busca encontrará dois conteúdos iguais em URLs diferentes, entendendo isso como conteúdo duplicado ou mesmo como spam, uma técnica ilegal para repetição de palavras-chave em um mesmo domínio, com o objetivo de obter um melhor posicionamento nos resultados de busca.

    Soluções conhecidas

    Em sites com páginas feitas exclusivamente para impressão esse tipo de problema também pode ocorrer. Falo daqueles sites, onde em alguma notícia, por exemplo, você encontra um link com uma versão da página para a impressão. Trata-se de duas páginas, uma com a notícia dentro da estrutura do site, e outra com uma versão mais "clean" para a impressão. Se não houver nenhuma especificação para o robô, certamente isso poderá ser considerado conteúdo duplicado passível até de uma punição.

    Nesse caso, imagine que todas as páginas para impressão fiquem em uma pasta "/ver-impressao". Sendo assim, basta bloquear a indexação e consideração dessa pasta pelo robots.txt, onde haverá uma regra:

    User-agent: *
    Disallow: /ver-impressao

    Uma alternativa é o uso da meta tag "noindex". Para isso basta colocar dentro do <head>:

    <head>
    ...
    <meta name="robots" content="noindex">
    </head>

    Nesse último caso o robô só não irá indexar as páginas que possuírem esta meta informação.

    Canonical Element

    Este recurso pode e certamente irá ajudar muitos sites que sofrem com esse tipo de problema. A configuração básica trata de um colocar a tag no conteúdo original e na página onde o conteúdo é duplicado. Para um e-commerce, por exemplo, com URLs derivadas de parâmetros, a solução seria na página direcionada aos detalhes de algum produto, a implementação do canonical element. Vamos utilizar para este exemplo, uma loja de instrumentos musicais.
    Página para marca de guitarras Gibson:

    http://www.instrumentosmusicais.com/guitarras.php?marca=gibson

    Vamos dizer que nesta página é possível escolher a cor da Guitarra, e que apesar da nova URL a página é a mesma, mudando somente a cor do instrumento:

    http://www.instrumentosmusicais.com/guitarras.php?marca=gibson$var=vermelha

    Nesse caso o robô pode considerar que essas duas páginas possuem o mesmo conteúdo. Sendo assim, basta "canonizar" uma das URLs, usando o canonical element dentro do cabeçalho das duas páginas:

    <head>
    ...
    ...
    <link rel="canonical" href="http://www.instrumentosmusicais.com/guitarras.php?marca=gibson"/>
    </head>

    Dessa forma o robô irá entender que se trata apenas de uma variação do conteúdo e que pode indexar só uma das páginas.

    Em minha opinião, apesar de um recurso muito útil o canonical element não pode ainda resolver todos os problemas de conteúdo duplicado, mas certamente este avanço já mostra que os mecanismos de busca correm atrás de cada vez mais soluções para problemas como esse, a fim de qualificar ainda mais seus resultados.

    Vejam o vídeo do Matt Cutts apresentando e explicado o canonical element: http://google.com/support/webmasters/bin/answer.py?answer=139394

    Até a próxima!

     

  • CONTRIBUA COM A SUA AVALIAÇÃO

    Clique na estrela correspondente ao seu voto:   VotarVotarVotarVotarVotar (2 votos)


    Comentários

    1 pessoa(s) comentaram até agora

    pass4sure (anônimo)

    12/03/2010 - 04:45

    640-802 SY0-201 350-001 642-901 642-825 642-845 642-812 640-822 640-816 VCP-410 642-892 N10-004 642-642 642-436 350-030 640-863 220-701 CISSP 640-553 642-504 646-204 350-018 642-426 642-524 642-456 642-873 640-460 220-702 642-446 642-533 220-602 220-601 EX0-101 642-383 646-671 642-373 PMI-001 310-200 642-691 350-029 640-721 JK0-016 156-215.65 642-566 642-971 642-654 642-415 642-105 HP0-J33 642-661 642-515 646-230 642-062 352-001 650-621 642-611 310-202 650-251 312-50 HP0-S21 642-067 650-180 EC0-350 646-363 VCP-310 642-164 PK0-002 HP0-S20 642-072 646-046 646-563 650-175 650-393 646-656 350-050 642-481 642-357 642-655 000-331 132-S-911 SK0-002 JN0-522 BR0-001 HP0-D04 1Y0-A05 1Z0-042 1Y0-259 642-359 350-030 TK0-201 JN0-342 JN0-331 642-591 1Y0-A08 350-001 642-746 HP0-J22 BH0-006 642-974 640-802 642-631 642-681 646-985 1Z0-053 642-973 132-S-900 310-065 642-975 350-040 1Z0-051 642-145 XK0-002 1Y0-A11 PW0-104 156-315 NS0-163 SY0-101 642-736 JN0-532 BH0-004

    Avisos

    Os itens com asterisco (*) são campos de preenchimento obrigatório.
    Todos devem se identificar através do e-mail válido.
    Os e-mails dos usuários não serão divulgados no site.
    Os comentários estão sujeitos à moderação.

    Enviar Comentário

    Nome *

    E-mail *

    Comentário: *

    Código de segurança: *

    Calendário

    « Março 2010 »
    S T Q Q S S D
    1234567
    891011121314
    15161718192021
    22232425262728
    293031 1 2 3 4
    Evento pago  Eventos pagos
    Evento gratuito  Eventos gratuitos
    Eventos pagos e gratuitos  Eventos pagos e gratuitos

    Painel do Usuário

    Usuario: 
    Senha: 
    Esqueceu sua senha?
    Cadastre-se

    Colunistas

    Erick Beltrami Formaggio - Colunista do SEMBrasil

    Canonical element e Conteúdo duplicado

    Thiago Bacchin - Colunista do SEMBrasil

    Mais com menos: a palavra-chave é Performance

    Gustavo Loureiro - Colunista do SEMBrasil

    Como contratar um fornecedor de SEO?

    Gustavo Bacchin - Colunista do SEMBrasil

    Google SearchWiki: impacto em resultados orgânicos?

    barra

    Patrocínio


    SEM