Programas por crawler.archive.org
-
Heritrix: Internet Archive Web Crawler Livre
O projeto archive-crawler está construindo o Heritrix: um rastreador web flexível, extensível, robusto e escalável capaz de buscar, arquivar e analisar toda a diversidade e amplitude do conteúdo acoável à internet.