Sobre Archivebox

Como os sites modernos são complicados e muitas vezes dependem de conteúdo dinâmico, o ArchiveBox arquiva os sites em vários formatos diferentes além do que os serviços públicos de arquivamento como Archive.org e Archive. é capaz de salvar. ArchiveBox importa uma lista de URLs de stdin, url remoto ou arquivo, em seguida, adiciona as páginas a uma pasta de arquivo local usando wget para criar um clone html browsable, youtube-dl para extrair mídia, e uma instância completa de Chrome sem cabeça para PDF, Screenshot, e DOM dumps, e mais... Usando vários métodos e o navegador dominante do mercado para executar JS garante que podemos salvar até mesmo os sites mais complexos, finicky em pelo menos alguns formatos de dados de alta qualidade e longo prazo. # Pode importar links de: - Bolso, Pinboard, Instapaper - RSS, XML, JSON ou listas de texto simples - Histórico do navegador ou marcadores (Chrome, Firefox, Safari, IE, Opera e muito mais) - Shaarli, Delicious, Reddit Saved Posts, Wallabag, Unmark.it, e qualquer outro texto com links nele! # Pode salvar essas coisas para cada site: - favicon.ico favicon do site - example.com/page-name.html wget clone do site, com .html anexado se não estiver presente - saída.pdf PDF impresso do site usando cromo sem cabeça - screenshot.png 1440x900 do site usando cromo sem cabeça - saída.html DOM Dump do HTML depois de renderizar usando cromo sem cabeça - arquivo.org.txt Um link para o site salvo no archive.org - warc/ para o html + gzipped warc file lt;timestamp >.gz - mídia/ qualquer mp4, mp3, legendas e metadados encontrados usando youtube-dl - git/ clone de qualquer repositório para github, bitbucket, ou links gitlab - index.html & index.json HTML e arquivos de índice JSON contendo metadados e detalhes O arquivamento é aditivo, para que você possa agendar ./archive para executar regularmente e puxar novos links para o índice. Todo o conteúdo salvo é estático e indexado com arquivos JSON, então ele vive para sempre & é facilmente parseable, não requer backend sempre-running.

Categorias

  • Free
  • Open Source
  • Paid
  • Network & Admin

Alternativas para Archivebox

Sitecrawler

Sitecrawler

grátis proprietário
#1
SiteCrawler é um aplicativo de download de site que permite capturar sites inteiros ou partes selecionadas, como galeria... ver detalhes
Domarks

Domarks

compras integradas proprietário
#2
DoMarks é o aplicativo para fazer bookmarks. Adicione marcadores. Categorize-os. Olha para eles. Feito! Criar uma nova ... ver detalhes
Shaark

Shaark

grátis código aberto
#3
Shaark é uma plataforma self-hosted para manter e compartilhar seu conteúdo: links web, posts, senhas e imagens. Todos o... ver detalhes
Nookmark

Nookmark

grátis personal proprietário
Nookmark não é apenas uma ferramenta de bookmarking, é uma maneira de organizar sua vida! Fazemos isso fornecendo uma ma... ver detalhes
Amazon

Logitech K400 Plus

anúncio
Teclado wireless com touchpad integrado para controlar o servidor web remotamente.... ver na amazon
Web Dumper

Web Dumper

pago proprietário
Faça o download completo Web sites fora da Internet, e salvá-los em seu disco rígido... ver detalhes
Itsucks

Itsucks

grátis código aberto
Este projeto é um java web spider (web crawler) com a capacidade de baixar (e retomar) arquivos. Também é altamente pers... ver detalhes
My Site Archive

My Site Archive

pago código aberto
Captura imagens, downloads de código fonte e monitora registros DNS ajudando você a manter o controle de mudanças em seu... ver detalhes
Social Feed Manager

Social Feed Manager

grátis código aberto
Social Feed Manager é software de código aberto para bibliotecas, arquivos, instituições de patrimônio cultural e organi... ver detalhes
Amazon

TP-Link Archer C60 AC1350

anúncio
Roteador de alto desempenho para aumentar a velocidade de acesso ao servidor web.... ver na amazon
Forlater

Forlater

grátis personal proprietário
forlater é um serviço de bookmarking baseado em e-mail. Você nos envia um e-mail com um link (ou links), e recebe uma ve... ver detalhes
Sitepuller

Sitepuller

pago proprietário
Web-based website downloader que downloads todos os arquivos do site online. Ele rasteja e gera um arquivo zip de todo o... ver detalhes
Webarchives

Webarchives

grátis código aberto
Um visualizador de arquivos web que oferece a capacidade de navegar offline milhões de artigos de grandes projetos comun... ver detalhes
Techrewind

Techrewind

grátis proprietário
TechRewind é um site onde você pode viajar através do tempo e obter um vislumbre de como os produtos pareciam quando ele... ver detalhes
Amazon

Raspberry Pi 4 Model B

anúncio
Placa de desenvolvimento para criar um servidor web self-hosted.... ver na amazon
Archive-It

Archive-It

grátis proprietário
Um serviço de arquivamento web para colher e preservar coleções digitai... ver detalhes
Fossilo

Fossilo

pago proprietário
Fossilo.com arquiva continuamente sites completos como pdf e vários outros formatos para ser facilmente aberto e visto s... ver detalhes
Growlist

Growlist

compras integradas proprietário
Mantenha o controle do conteúdo digital Características: - Criar um feed personalizado de subreddits, YouTube-channels e... ver detalhes