Uma das ferramentas que comecei a hospedar no VPS foi esse arquivo da internet pessoal, o ArchiveBox. Vc tem a possibilidade de salvar páginas para futuras referências, seja em html, texto puro, pdf e outros formatos. Vc instala o plugin no navegador e funciona razoavelmente bem. Eu escolhi salvar em formatos que consomem menos espaço. As vezes eu só preciso do texto mesmo, sem firulas gráficas na interface. A interface é meio old school, em formato lista, mas para o meu tipo de consumo, é o ideal. Outras ferramentas costumam mostrar pré-visualizações que ocupam mais espaço na tela. Considerando que não uso o ArchiveBox para arquivar obras de arte e imagens, não preciso de imagens de stock para saber do que se trata um artigo (que já li).
Na maior parte dos casos eu salvo notícias e artigos que imagino que vão sumir. Já me aconteceu de muitas vezes lembrar de algo que li no passado e não conseguir mais encontrar o texto - antes eu salvava no Pocket, hoje fica autohospedado no ArchiveBox. Faço minha pequena biblioteca de assuntos ligados aos meus temas de estudo ou predileção.
Porém cada vez mais o #ArchiveBox trava na página do Captcha para evitar robôs de IA... na imagem abaixo, circulei em vermelho dois exemplos. Quando clico para ver a página salva, é a página de bloqueio de scrapers. O problema é que como eu uso o plugin para salvar a página, nem sempre tenho o ArchiveBox aberto para ver se a página foi salva corretamente. Quando abri o ArchiveBox recentemente para buscar uma referência, me deparei com muitos arquivos salvos mas quebrados...
Nesse caso se eu quiser realmente salvar o artigo preciso imprimir em PDF (mas o arquivamento dos meus PDFs no computador é bem ruinzinho).
Em todo caso o ArchiveBox foi minha liberação depois do fim do Pocket e outros semelhantes. O FreshRSS não é a mesma coisa mas naturalmente arquiva publicações, então tento não duplicar. Eu tinha tentado hospedar o Linkwarden, mas ele não rodava direito e sempre dava algum erro da família dos 500. O Wallabag tinha bugs na época.
Enfim, fica a sugestão para quem quer ou precisa ter seu próprio InternetArchive. :o)








