Sobre Archivebox

Como os sites modernos são complicados e muitas vezes dependem de conteúdo dinâmico, o ArchiveBox arquiva os sites em vários formatos diferentes além do que os serviços públicos de arquivamento como Archive.org e Archive. é capaz de salvar. ArchiveBox importa uma lista de URLs de stdin, url remoto ou arquivo, em seguida, adiciona as páginas a uma pasta de arquivo local usando wget para criar um clone html browsable, youtube-dl para extrair mídia, e uma instância completa de Chrome sem cabeça para PDF, Screenshot, e DOM dumps, e mais... Usando vários métodos e o navegador dominante do mercado para executar JS garante que podemos salvar até mesmo os sites mais complexos, finicky em pelo menos alguns formatos de dados de alta qualidade e longo prazo. # Pode importar links de: - Bolso, Pinboard, Instapaper - RSS, XML, JSON ou listas de texto simples - Histórico do navegador ou marcadores (Chrome, Firefox, Safari, IE, Opera e muito mais) - Shaarli, Delicious, Reddit Saved Posts, Wallabag, Unmark.it, e qualquer outro texto com links nele! # Pode salvar essas coisas para cada site: - favicon.ico favicon do site - example.com/page-name.html wget clone do site, com .html anexado se não estiver presente - saída.pdf PDF impresso do site usando cromo sem cabeça - screenshot.png 1440x900 do site usando cromo sem cabeça - saída.html DOM Dump do HTML depois de renderizar usando cromo sem cabeça - arquivo.org.txt Um link para o site salvo no archive.org - warc/ para o html + gzipped warc file lt;timestamp >.gz - mídia/ qualquer mp4, mp3, legendas e metadados encontrados usando youtube-dl - git/ clone de qualquer repositório para github, bitbucket, ou links gitlab - index.html & index.json HTML e arquivos de índice JSON contendo metadados e detalhes O arquivamento é aditivo, para que você possa agendar ./archive para executar regularmente e puxar novos links para o índice. Todo o conteúdo salvo é estático e indexado com arquivos JSON, então ele vive para sempre & é facilmente parseable, não requer backend sempre-running.

Categorias

  • Free
  • Open Source
  • Paid
  • Network & Admin

Alternativas para Archivebox

Não disponível

Oldweb Today

grátis proprietário
Navegue na web antiga usando navegadores emulados da mesma era...
Snapchive

Snapchive

pago proprietário
Snapchive permite que você tome automaticamente screenshots de sites que você escolher, quantas vezes quiser. Permitir q... ver detalhes
Linksoutside

Linksoutside

grátis proprietário
Este é um site . Ele funciona como um diretório para descobrir links de download... ver detalhes
Webcrate

Webcrate

grátis código aberto
Grupo, organizar e compartilhar links de toda a web com WebCrate. It's more than just a bookmarking tool. Adicionar... ver detalhes
Amazon

Logitech K400 Plus

anúncio
Teclado wireless com touchpad integrado para controlar o servidor web remotamente.... ver na amazon
Archivarix Website Downloader

Archivarix Website Downloader

compras integradas proprietário
Site downloader on-line e sistema de gerenciamento de conteúdo (CMS) conversor local existente. Baixar ou converter qual... ver detalhes
Pocket

Pocket

compras integradas proprietário
Salvar páginas web para ler mais tarde, e eliminar a desordem de marcadores com sites que são meramente de um interesse ... ver detalhes
Wget

Wget

grátis código aberto
GNU Wget é um pacote de software livre para recuperar arquivos usando HTTP(S) e FTP, os protocolos de Internet mais ampl... ver detalhes
Wayback Machine

Wayback Machine

grátis proprietário
Navegue por mais de 150 bilhões de páginas web arquivados de 1996 a alguns meses atrás... ver detalhes
Amazon

Raspberry Pi 4 Model B

anúncio
Placa de desenvolvimento para criar um servidor web self-hosted.... ver na amazon
Httrack

Httrack

grátis código aberto
HTTrack é um livre (GPL, software livre / livre) e utilitário de navegador off-line fácil de usar... ver detalhes
Wallabag

Wallabag

grátis código aberto
wallabag é um aplicativo self hostable opensource para salvar páginas da web. # Leitura confortável wallabag extrai o ... ver detalhes
Internet Archive

Internet Archive

grátis proprietário
O Internet Archive está construindo uma biblioteca digital de sites da Internet e outros artefatos culturais em forma di... ver detalhes
Pinboard

Pinboard

pago proprietário
Pinboard é um site de bookmarking destinado a pessoas que querem manter de forma confiável o controle de um grande númer... ver detalhes
Amazon

TP-Link Archer C60 AC1350

anúncio
Roteador de alto desempenho para aumentar a velocidade de acesso ao servidor web.... ver na amazon
Evernote Web Clipper

Evernote Web Clipper

grátis proprietário
Salvar qualquer coisa que você vê online - incluindo texto, links e imagens - em seu Conta Evernote com um único clique... ver detalhes
Archive.is

Archive.is

grátis proprietário
Archive.is (anteriormente chamado archive.today) permite que você " pegue uma foto " de uma página da web que ... ver detalhes
Stash.ai

Stash.ai

pago proprietário
Stash é um aplicativo de bookmark inteligente, cross-device apoiado pela inteligência artificial. Salvar artigos, vídeos... ver detalhes