wikipedia2XML 0.1

Licença: Livre ‎Tamanho do arquivo: N/A
‎Classificação dos usuários: 3.0/5 - ‎1 ‎Votos

Uma coleção de scripts python para criar e lidar com um corpus XML (uma grande coleção de texto para fins linguísticos) de um dump de backup original do banco de dados da Wikipédia. Ele inclui um analisador baseado em expressão regular para a linguagem de marcação MediaWiki.

história da versão

  • Versão 0.1 postado em 2008-04-01
    Várias correções e atualizações
  • Versão 0.1 postado em 2008-04-01

Detalhes do programa