WWWGrab 1.33
Você poderá baixar em 5 segundos.
Sobre WWWGrab
WWWGrab é uma ferramenta de extração de dados de página web e geração de banco de dados, ou "web scraper". Ele verifica as listas de URL em um banco de dados, busca as páginas da Web listadas e as analisa com o mecanismo de transformação de dados DTBuild. O WWWGrab pode executar sequências de url scans e operações de banco de dados SQL, permitindo várias passagens sobre dados gerados "no fly" (no tempo de execução). Os parsers wwwgrab são criados com o workshop de transformação de dados DTBuild. Na hora de execução, o WWWGrab recebe uma página da Web e envia-a para o mecanismo DTBuild, que transforma a página da Web com o analisador especificado. O WWWGrab é controlado por uma lista de tarefas especificadas em um banco de dados. Existem dois tipos de tarefa: 1. digitalizar uma lista de URL, 2. executar uma lista SQL. O usuário pode combinar qualquer número de url scans e execuções SQL em uma lista de tarefas. Por exemplo, uma lista de tarefas poderia: * digitalize uma lista inicial de URLs, * gerar uma nova lista de URLs, * modificar a lista de URL gerada com SQL, * digitalize a lista de URL gerada+modificada, * gerar outra lista de URL, * etc. A flexibilidade combinada do WWWGrab e do DTBuild permite uma grande variedade de tarefas de transformação de dados da Web. Consulte dTBuild ajuda para obter mais informações. Recursos wwwgrab / DTBuild: * Recursos recursivos (permitindo a análise de tags HTML/XML aninhadas, comentários, etc.) * Capacidade de entrada/saída de cadeias largas (Unicode) * Interface ODBC que exibe informações de layout do banco de dados (nomes de tabela e campo) para o usuário * Interface ODBC permitindo a construção de declarações SQL com uma combinação de dados definidos pelo usuário e dados reconhecidos * Modo de rastreamento para mostrar correspondência entre entrada e nós (para depuração) * Interface de função definida pelo usuário permitindo a execução de código DLL personalizado ... A assistência de configuração está disponível.