wikipedia2XML 0.1

Licença: Livre ‎Tamanho do arquivo: N/A
‎Classificação dos usuários: 3.0/5 - ‎1 ‎Votos

Sobre wikipedia2XML

Uma coleção de scripts python para criar e lidar com um corpus XML (uma grande coleção de texto para fins linguísticos) de um dump de backup original do banco de dados da Wikipédia. Ele inclui um analisador baseado em expressão regular para a linguagem de marcação MediaWiki.