O Web Data Extractor Pro é uma ferramenta de raspagem da Web especificamente projetada para coleta em massa de vários tipos de dados. Ele pode coletar URLs, números de telefone e fax, endereços de e-mail, bem como informações de meta-tag e texto corporal. Recurso especial do WDE Pro é a extração personalizada de dados estruturados. Este programa de alta velocidade e multithreaded funciona usando uma palavra-chave em mecanismos de busca, aranhando um site ou uma lista de URLs de um arquivo. Você também pode permitir que ele siga links externos das páginas originais, com a capacidade de ir tão fundo nos caminhos de URL quanto você precisar e realmente pesquisar toda a Internet. O Web Data Extractor é superior para a coleta de informações estruturadas e tipos de dados específicos relacionados às palavras-chave que você fornece pesquisando através de várias camadas de sites.
história da versão
- Versão 3.10 postado em 2020-01-06
Analisador de endereços de e-mail significativamente melhorado; A lista de agentes de usuário foi atualizada; Adicionado "Retry try non-extraído URLs" e "Enhanced Human factor" opções em Conexão para um trabalho ainda mais eficaz com sites-alvo; Opções adicionadas "Verifique cada X minutos" e "Renove depois de ler Y número de links" em Servidores Proxy para um trabalho mais eficaz com proxies; Muitas melhorias foram feitas de acordo com as avaliações de nossos clientes! - Versão 3.9 postado em 2018-12-30
A lista de mecanismos de pesquisa é limpa de links desatualizados/quebrados. Isso nos permitiu aumentar a velocidade do software no modo Mecanismos de Busca; Parser de endereços de e-mail significativamente melhorado, especialmente para e-mails ocultos JS (JavaScript); Opção melhorada para importar servidores proxy próprios de arquivos CSV;Trabalho melhorado com sites HTTPS;Desempenho melhorado ao trabalhar com grandes listas de URL;Melhorado "Cookie Capture" opção; opção; Várias pequenas correções/melhorias de acordo com os feedbacks dos clientes - Versão 3.8 postado em 2017-12-29
Capacidade adicional de carregar e extrair informações de arquivos PDF; Capacidade adicional de carregar o arquivo de licença diretamente do formulário UI, quando o período de teste de uso do programa expirar. Alternativamente, o arquivo de licença pode ser carregado a partir do formulário Opções -> Sobre o período de teste se o período de teste ainda não expirou; Trabalho significativamente melhorado através dos servidores proxy; Parser de JS-mails codificados foi melhorado; O item do menu de contexto "Re-start URL" foi adicionado à lista "Bad URLs";Trabalho aprimorado com o repositório de dados internos do software; Adicionado a capacidade de excluir sessões juntamente com todos os seus dados e arquivos de serviço, também compactua automaticamente o repositório interno do programa para reduzir o espaço de disco necessário; Adicionado "Referitivo inicial" campo de texto na interface do usuário. Alguns sites podem exibir informações diferentes dependendo de qual site externo eles vêm. O campo "Initial Referrer" permite especificar o endereço web de tal site; Também fizemos várias pequenas mudanças e melhorias com base nos feedbacks de nossos clientes - Versão 3.7 postado em 2017-02-28
Trabalho aprimorado de "Search Engines" modo;Melhorado "Remover HTML Tags" e "Page deve conter o texto a seguir para extrair dados" filtros; Adicionado "Use filtro IP do país" filtro que permite excluir resultados de servidores que não relacionados (por geolocalização) ao país selecionado na opção "Search Engines; Analisador de e-mail significativamente melhorado e analisador custom builder; Melhorias gerais na detecção e extração de dados; Também fizemos várias pequenas mudanças e melhorias com base nos feedbacks de nossos clientes - Versão 3.6 postado em 2016-08-22
Caixa de seleção adicionada "Obter URL redirecionado" no "Custom Data Editor" formulário para extrair urls (por exemplo, endereços de sites) que são apresentados através de um redirecionamento; Caixa de seleção adicionada "Mark Proxies não-respondendo como inativos automaticamente". Se durante a sessão o servidor proxy for determinado como ruim (não funcionar), ele será automaticamente marcado como inativo e não é usado na sessão; Adicionada nova opção "Use fusão de linha única" para mesclar dados em uma única sequência. Por exemplo, você pode exportar cores de camisetas como: "T-Shirt", "Preto, Amarelo, Vermelho, Verde; Carregamento significativamente melhorado de servidores proxy públicos da Internet; "Fator Humano" opção foi melhorada; Melhorou um analisador de endereços de e-mail fechados por JS; Opção aprimorada de passar pelo Google-captcha ao pesquisar dados via Google; Também fizemos várias pequenas mudanças e melhorias com base nos feedbacks de nossos clientes - Versão 2.0 postado em 2012-08-29
Reformulado o algoritmo para determinar a profundidade da digitalização, a sustentabilidade do programa para os danos físicos do banco de dados é adicionada, controle de fluxos melhorado, que tem um impacto positivo no desempenho geral, trabalho melhorado com uma grande lista de palavras-chave em "Search Engines" modo
Detalhes do programa
- Categoria: Rede & Internet > Ferramentas de pesquisa/pesquisa
- Editor: WebExtractor System
- Licença: Avaliação gratuita
- Preço: $199.00
- Versão: 3.10
- Plataforma: windows