![](/statics/img/blank.png)
wikipedia2XML 0.1
Licença: Livre Tamanho do arquivo: N/A
Classificação dos usuários: 3.0/5 - 1 Votos
Aguarde... Seu link de download está sendo verificado para conteúdo malicioso.
Você poderá baixar em 5 segundos.
Você poderá baixar em 5 segundos.
Sobre wikipedia2XML
Uma coleção de scripts python para criar e lidar com um corpus XML (uma grande coleção de texto para fins linguísticos) de um dump de backup original do banco de dados da Wikipédia. Ele inclui um analisador baseado em expressão regular para a linguagem de marcação MediaWiki.