Sobre Gigablast

Gigablast é um poderoso, opensource, novo motor de busca que faz indexação em tempo real! Características Escalável para milhares de servidores. Tem escalado para mais de 12 bilhões de páginas web em mais de 200 servidores. Um dual quad core, com 32GB ram e dois 160GB Intel SSDs, executando 8 instâncias Gigablast, pode fazer cerca de 8 qps (queries por segundo) em um índice de 10 milhões de páginas. As unidades serão próximas à capacidade máxima de armazenamento. Dobrar o tamanho do índice será mais ou menos metade da taxa de qps. (As métricas de desempenho podem ser feitas aproximadamente dez vezes mais rápido, mas eu ainda não tenho chegado a ele. O uso do espaço de movimentação provavelmente permanecerá aproximadamente o mesmo porque já é bastante eficiente.) 1 milhão de páginas web requer 28.6GB de espaço de unidade. Isso inclui o índice, meta informações e o HTML comprimido de todas as páginas da web. taxa de aranha é em torno de 1 página por segundo por núcleo. Assim, um núcleo duplo quad pode aranha e índice 8 páginas por segundo, que é 691,200 páginas por dia. 4GB de RAM necessária por instância do Gigablast. (instância = processo) Demonstração ao vivo em http://www.gigablast.com/ Escrito em C/C+ para melhor desempenho. Mais de 500.000 linhas de C/C++. 100% personalizado. Um único binário. O servidor web, banco de dados e tudo o resto está contido neste código fonte de forma altamente eficiente. Torna a administração e solução de problemas mais fáceis. Confiável. Tem sido testado em produção ao vivo desde 2002 em bilhões de consultas em um índice de mais de 12 bilhões de páginas web únicas, 24 bilhões espelhados. Super rápido e eficiente. Um de um pequeno punhado de motores de busca que atingiram números tão grandes. O único motor de busca de código aberto que tem. Suporta todos os idiomas. Pode dar resultados em línguas especificadas um impulso sobre os outros no momento da consulta. Usa a representação UTF-8 internamente. Registo de rastreamento. Tem sido usado por muitos clientes. Tem sido usado com sucesso em software empresarial distribuído. Cached páginas da web com o termo de consulta destacando.

Categorias

  • Free
  • Open Source
  • Paid
  • Online Services

Alternativas para Gigablast

Fireball (Search Engine)

Fireball (Search Engine)

grátis proprietário
Fundada em 1996 como o primeiro motor de busca alemão, Fireball é um motor de busca de Munique, Alemanha, que é operado ... ver detalhes
Wiby

Wiby

grátis proprietário
Nos primeiros dias da web, as páginas foram feitas principalmente por aquaristas, acadêmicos e pessoas experientes em co... ver detalhes
Search For A Cause

Search For A Cause

grátis código aberto
Search for a Cause é um motor de busca que permite levantar dinheiro para a caridade cada vez que você procura. Nós leva... ver detalhes
De🔸digger

De🔸digger

grátis proprietário
Encontre pequenas jóias escondidas à vista! de🔸digger é um motor de pesquisa / descoberta que permite que você e... ver detalhes
Wonoly

Wonoly

grátis código aberto
Wonoly é uma nova e única maneira de pesquisar a web, com um design fresco e polido. Sem anúncios e sem rastreadores, vo... ver detalhes
Não disponível

Keyword Searc?h?

grátis código aberto
Este é um recurso simples, mas poderoso que lhe dá acesso a vários motores de busca usando palavras-chave simples. Por e...
Hide My Searches

Hide My Searches

grátis proprietário
Mantenha suas pesquisas privadas redirecionando pesquisas que podem ser rastreadas para Hide My Searches, um motor de bu... ver detalhes
Intelligence X

Intelligence X

grátis proprietário
Inteligência X é um mecanismo de busca e arquivo de dados. Pesquisar Tor, I2P, vazamentos de dados e a web pública por e... ver detalhes
Right Dao

Right Dao

grátis proprietário
Você usa um motor de busca que rastreia suas pesquisas, coleta seus dados, perfila sua atividade on-line e aproveita sua... ver detalhes
Trednix Search

Trednix Search

grátis proprietário
O motor de busca Trednix ajuda você a encontrar o mundo & #39; s informações & #39;s facilmente, variando de respostas, ... ver detalhes
Alltheinternet

Alltheinternet

grátis proprietário
Este motor de busca ajuda você a encontrar exatamente o que você & #39;re procurando. Encontre as informações, notícias,... ver detalhes
Goodsearch

Goodsearch

grátis proprietário
E se você pudesse levantar dinheiro para sua causa favorita cada vez que você procurou ou comprou on-line? Agora podes! ... ver detalhes
Findx

Findx

grátis proprietário
Findx é um motor de busca para usuários que valorizam a privacidade. O site não coleta informações sobre você quando voc... ver detalhes
Não disponível

Usenetserver

pago proprietário
Provedor de alta qualidade oferecendo ilimitado Usenet access que também oferece um motor de pesquisa Usenet chamado Glo...
Runnaroo

Runnaroo

grátis proprietário
Runnaroo foi construído a partir do zero para fornecer uma experiência de pesquisa melhor e mais privada. Fazemos uma pe... ver detalhes