pydocrawl baixa automaticamente arquivos pdf-, ps-e doc de sites da Web. Uma URL inicial e uma lista de palavras devem ser dadas. Ferramenta multithreaded de mineração de informações (colheita) escrita inteiramente em Python. A versão 0.1 é executada com sucesso no Linux e no Cygwin.
história da versão
- Versão r20040925_v1 postado em 2004-09-24
Várias correções e atualizações - Versão r20040925_v1 postado em 2004-09-24
Detalhes do programa
- Categoria: Rede & Internet > Outros
- Editor: pydocrawl.sf.net
- Licença: Livre
- Preço: N/A
- Versão: 20040925
- Plataforma: windows