Sobre Heritrix

Heritrix é o Internet Archive's open-source, extensible, web-scale, arquiival-qualidade web rastreador projeto. Heritrix (às vezes escrito heretrix, ou mispelled ou mis-said como heratrix/heritix heretix/heratix) é uma palavra arcaica para herdeira (mulher que herda). Uma vez que nosso rastreador procura coletar e preservar os artefatos digitais de nossa cultura para o benefício de futuros pesquisadores e gerações, este nome parecia adequado.

Categorias

  • Free
  • Open Source
  • Paid

Alternativas para Heritrix

Appbase.io

Appbase.io

pago código aberto
#1
O Appbase.io fornece uma experiência sobrecarregada em Elasticsearch com um plano de controle de relevância #nocode (ou ... ver detalhes
Algolia

Algolia

grátis personal proprietário
#2
Algolia ajuda as equipes de produtos a conectar seus usuários com informações fornecendo os blocos de construção que pre... ver detalhes
Mixnode

Mixnode

pago proprietário
#3
Mixnode é uma plataforma rápida, flexível, massivamente escalável para extrair e analisar dados da web... ver detalhes
Wordpress I-Search Pro

Wordpress I-Search Pro

pago proprietário
i-Search Pro muda o caminho do WordPress Search. É totalmente compatível com WooCommerce. Fornecer resultados de pesquis... ver detalhes
Expertrec Search Engine

Expertrec Search Engine

pago proprietário
Pesquisa personalizada Expertrec começou como um substituto para a pesquisa do site do google. Ele adiciona super-rápido... ver detalhes
Apisearch

Apisearch

compras integradas código aberto
Procure milhões de documentos e dê aos seus usuários experiências únicas, incríveis e inesquecíveis... ver detalhes
Apache Nutch

Apache Nutch

grátis código aberto
Apache Nutch é um projeto de software de rastreador web de código aberto altamente extensível e escalável... ver detalhes
Stormcrawler

Stormcrawler

grátis código aberto
StormCrawler é uma fonte aberta SDK para a construção de rastreadores web distribuídos com Apache Storm. O projeto está ... ver detalhes
Google Custom Search Engine

Google Custom Search Engine

compras integradas proprietário
Com o Google Custom Search, adicione uma caixa de pesquisa à sua página inicial para ajudar as pessoas a encontrarem o q... ver detalhes
Ache Crawler

Ache Crawler

grátis código aberto
ACHE é um rastreador web para pesquisa específica de domínio... ver detalhes
Não disponível

Tinysearch

grátis código aberto
TinySearch é um motor de busca leve, rápido e de texto completo. Ele é projetado para sites estáticos. TinySearch é esc...