Programas por wikipedia2xml.sf.net

  • wikipedia2XML Livre

    Uma coleção de scripts python para criar e lidar com um corpus XML (uma grande coleção de texto para fins linguísticos) de um dump de backup original do banco de dados da Wikipédia. Ele inclui um analisador baseado em express