estratégia, marketing e competitividade
55 (61) 3436.5062 | (11) 4063-9818

Robots.txt – evitando indexação indesejada do seu site ou parte dele

robots.txt

Muitas vezes temos pastas ou arquivos em nossos sites que não queremos que os buscadores indexem por um motivo qualquer – uma pasta desnecessária ou um site em construção (exe. Numa pasta /site ou /blog).

Alguns exemplos que não queremos indexar: Uma página de login, Páginas de conteúdo duplicado, páginas de impressão, pastas operacionais de um CMS (administrador de conteúdo, etc.

Como fazer?

Usando um arquivo robots.txt na raiz do site para indicar o que o buscador deve indexar ou não. A seguir um robots.txt que usamos nos sites joomla.

User-agent: *  <= Qualquer dos buscadoes
Disallow: /administrator/
Disallow: /cache/
Disallow: /components/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /libraries/
Disallow: /logs/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/

Allow: /xxxx/ <= Habilita o scaneamento
Disallow: /ccc/ <= Desabilita o scaneamento

 

Deixe uma Resposta.

Você deve estar logado para postar um comentário.

Brasília:

Rua das Carnaúbas, Qd. 301, Lt. 04, Sala 408 - Ed. Plaza Mall & Office
Águas Claras - DF CEP 71904-540
Fone: 55 (61) 3436-5062  |  (61) 8143-1919

Outros estados:

São Paulo: (11) 4063-9818
Recife - PE: (81) 4062-9370
Goiânia:
(62) 4053-9156

Empresa coligada:

Grupo Finisart