Sobre Gigablast

Gigablast é um poderoso, opensource, novo motor de busca que faz indexação em tempo real! Características Escalável para milhares de servidores. Tem escalado para mais de 12 bilhões de páginas web em mais de 200 servidores. Um dual quad core, com 32GB ram e dois 160GB Intel SSDs, executando 8 instâncias Gigablast, pode fazer cerca de 8 qps (queries por segundo) em um índice de 10 milhões de páginas. As unidades serão próximas à capacidade máxima de armazenamento. Dobrar o tamanho do índice será mais ou menos metade da taxa de qps. (As métricas de desempenho podem ser feitas aproximadamente dez vezes mais rápido, mas eu ainda não tenho chegado a ele. O uso do espaço de movimentação provavelmente permanecerá aproximadamente o mesmo porque já é bastante eficiente.) 1 milhão de páginas web requer 28.6GB de espaço de unidade. Isso inclui o índice, meta informações e o HTML comprimido de todas as páginas da web. taxa de aranha é em torno de 1 página por segundo por núcleo. Assim, um núcleo duplo quad pode aranha e índice 8 páginas por segundo, que é 691,200 páginas por dia. 4GB de RAM necessária por instância do Gigablast. (instância = processo) Demonstração ao vivo em http://www.gigablast.com/ Escrito em C/C+ para melhor desempenho. Mais de 500.000 linhas de C/C++. 100% personalizado. Um único binário. O servidor web, banco de dados e tudo o resto está contido neste código fonte de forma altamente eficiente. Torna a administração e solução de problemas mais fáceis. Confiável. Tem sido testado em produção ao vivo desde 2002 em bilhões de consultas em um índice de mais de 12 bilhões de páginas web únicas, 24 bilhões espelhados. Super rápido e eficiente. Um de um pequeno punhado de motores de busca que atingiram números tão grandes. O único motor de busca de código aberto que tem. Suporta todos os idiomas. Pode dar resultados em línguas especificadas um impulso sobre os outros no momento da consulta. Usa a representação UTF-8 internamente. Registo de rastreamento. Tem sido usado por muitos clientes. Tem sido usado com sucesso em software empresarial distribuído. Cached páginas da web com o termo de consulta destacando.

Categorias

  • Free
  • Open Source
  • Paid
  • Online Services

Alternativas para Gigablast

Inout Search Engine

Inout Search Engine

pago proprietário
Você pode simplesmente iniciar um motor de busca privado como um Google ou Yahoo faz. Integração API do Google, Bing e Y... ver detalhes
Common Crawl

Common Crawl

grátis proprietário
Crawl comum constrói e mantém um repositório aberto de dados de rastreamento web que podem ser acessados e analisados po... ver detalhes
Brave Search

Brave Search

grátis proprietário
Brave Search será um motor de pesquisa independente, usuário-primeiro e privado. Ao integrar a Brave Search em seu naveg... ver detalhes
Ellpedia

Ellpedia

grátis proprietário
•Ellpedia é um motor de metasearch privado baseado no Google e Bing. •Ellpedia não recolhe o que procura ou fornece res... ver detalhes
Tesse

Tesse

grátis proprietário
Tesse é um mecanismo de busca especializado que permite pesquisar e se conectar com especialistas globais por uma palavr... ver detalhes
Gibiru

Gibiru

grátis proprietário
Uncensored Anonymous Search... ver detalhes
Neeva

Neeva

pago proprietário
Neeva é um motor de busca gratuito que requer uma assinatura para usar. Ele pode estar ligado a contas pessoais como Mic... ver detalhes
Lilo

Lilo

grátis proprietário
Lilo é um motor de busca que financia projetos sociais e ambientais... ver detalhes
Givero

Givero

grátis proprietário
Givero é o motor de busca que se importa. Ele compartilha sua receita com as instituições de caridade que você escolher,... ver detalhes
Black Homepage

Black Homepage

grátis proprietário
Black Homepage é uma página de partida alternativa para todos os navegadores da Web, inclui todos os links do site super... ver detalhes
Não disponível

Boondabar Visual Search Engine

grátis proprietário
Boondabar é um motor de busca como Google ou Bing. Exceto apresentarmos resultados de uma forma mais visual e outros mec...
Dropicon | Search Engine

Dropicon | Search Engine

grátis proprietário
Dropicon abandona o teclado convencional para uma experiência inovadora, simples e divertida, arrastar e soltar pesquisa... ver detalhes
Disconnect Search

Disconnect Search

grátis código aberto
Disconnect Search é uma extensão do navegador meta-search-engine que permite pesquisar em privado usando seu motor de bu... ver detalhes
Mojeek

Mojeek

grátis proprietário
Mojeek, o motor de busca alternativo que coloca as pessoas que o usam primeiro. Gostamos de fazer as coisas de forma di... ver detalhes
Metager

Metager

grátis código aberto
Meta Ger é um SaaS pelo alemão sem fins lucrativos SUMA e.V que fornece-lhe resultados de pesquisa meta anônimos... ver detalhes