Para configurar este rastreador de forma a evitar a importação de páginas da Web indesejadas para o portal:
Por padrão, este rastreador segue as recomendações
do servidor da Web sobre quais páginas podem ser úteis para rastreadores
automatizados. Para ignorar essas recomendações, desmarque a caixa de
seleção Obedecer aos protocolos de exclusão
do robô do site de destino.
Em geral, essas recomendações ajudam a limitar o rastreamento de conteúdos
indesejados para o portal. Entretanto, alguns sites apresentam recomendações
muito severas. Se o rastreador não estiver importando nenhum conteúdo
de um site, tente desativar essa opção.
Por padrão, o rastreador salva os URLs de páginas da Web importadas no formato usado no site da Web de origem. Para alterar os URLs para minúsculas, selecione Converter todos os URLs em minúsculas.
Para evitar a importação de conteúdos de uma área de um site da Web ou evitar a importação de páginas específicas:
Para especificar uma área a ser evitada, clique
em Adicionar
exclusão. Em seguida, na caixa de texto, digite o URL da área do
site da Web a ser evitada.
É possível usar a notação de caractere curinga (*) para generalizar
a exclusão. Por exemplo, para evitar o rastreamento das informações de
vendas de um site, você pode digitar http://minhaempresa.com.br*vendas.
Como resultado, o rastreador não importará nenhuma página de minhaempresa.com.br
com "vendas" em algum ponto do URL.
Observação: Ele pressupõe a existência de curingas nos dois
lados do texto. Por exemplo, se você digitar vendas, o rastreador não importará páginas
de qualquer site acessível dos
URL de destino que tenham "vendas" em qualquer ponto do URL.
Importante: Se você listar exclusões e
inclusões, as exclusões se aplicarão apenas às páginas incluídas.
Por exemplo, se você excluir vendase
incluir http://minhaempresa.com.br,
o rastreador importará todas as páginas de http://minhaempresa.com.br,
exceto as que tiverem "vendas"
em algum ponto do URL.
Para remover uma exclusão, selecione a exclusão
e clique em .
Para marcar ou desmarcar todas as caixas de seleção de exclusão, marque ou desmarque a caixa à esquerda de Exclusões.
Por padrão, o rastreador não rastreia nem importa nenhuma página especificada nas exclusões. Se o rastreador navegar de um link numa página excluída para uma página que não esteja excluída e que deveria ser importada, selecione Rastrear páginas excluídas, mas não importá-las.
Para limitar o rastreamento a uma área de um site da Web ou a páginas específicas:
Para especificar onde o rastreador pode rastrear,
clique em Adicionar inclusão. Em seguida, na caixa de texto,
digite o URL da área do site da Web à qual você deseja restringir o rastreamento.
Como os sites da Web podem conter links para outros sites, é recomendável
usar inclusões para manter o rastreador em um site específico. Para evitar
o rastreamento de outros sites, adicione o URL básico do site a ser rastreado
à lista de inclusão; por exemplo, http://minhaempresa.com.br.
Você pode usar a notação de caractere curinga (*) para generalizar
a inclusão. Por exemplo, para rastrear apenas informações sobre assinatura
única (SSO), você pode digitar http://minhaempresa.com.br*sso.
Como resultado, o rastreador só importará páginas de minhaempresa.com.br
com "sso" em algum ponto do URL.
Observação: Ele pressupõe a existência de curingas nos dois
lados do texto. Por exemplo, se você digitar vendas, o rastreador importará páginas de
qualquer site acessível dos URL
de destino que tenham "vendas" em qualquer ponto do URL.
Importante: se você listar inclusões e
exclusões, as exclusões se aplicarão apenas às páginas incluídas.
Por exemplo, se você incluir http://minhaempresa.com.br
e excluir sso, o rastreador importará
todas as páginas de http://minhaempresa.com.br, exceto
as que tiverem "sso" em algum ponto do URL.
Para remover uma inclusão, selecione a inclusão
e clique em .
Para marcar ou desmarcar todas as caixas de seleção de inclusão, marque ou desmarque a caixa à esquerda de Inclusões.
Para exibir a página associada a este tópico da Ajuda: