Exclusões de página da Web

Para configurar este rastreador de forma a evitar a importação de páginas da Web indesejadas para o portal:

  1. Por padrão, este rastreador segue as recomendações do servidor da Web sobre quais páginas podem ser úteis para rastreadores automatizados. Para ignorar essas recomendações, desmarque a caixa de seleção Obedecer aos protocolos de exclusão do robô do site de destino.

    Em geral, essas recomendações ajudam a limitar o rastreamento de conteúdos indesejados para o portal. Entretanto, alguns sites apresentam recomendações muito severas. Se o rastreador não estiver importando nenhum conteúdo de um site, tente desativar essa opção.

  2. Por padrão, o rastreador salva os URLs de páginas da Web importadas no formato usado no site da Web de origem. Para alterar os URLs para minúsculas, selecione Converter todos os URLs em minúsculas.

  3. Para evitar a importação de conteúdos de uma área de um site da Web ou evitar a importação de páginas específicas:

  4. Por padrão, o rastreador não rastreia nem importa nenhuma página especificada nas exclusões. Se o rastreador navegar de um link numa página excluída para uma página que não esteja excluída e que deveria ser importada, selecione Rastrear páginas excluídas, mas não importá-las.

  5. Para limitar o rastreamento a uma área de um site da Web ou a páginas específicas:


  1. Clique em Administração.
  2. Abra o editor de rastreador da Web:
  3. À esquerda, em Editar configurações de objeto, clique em Exclusões de página da Web.