WordTabulator yra skirtas teksto analizei. Naudodami wordTabulator galite sukurti indeksą žodinių elementų, paimtų iš apibrėžto teksto rinkinys. Žodiniai elementai, gali būti žodžiai, N-gramų (apibrėžto dydžio) ar frazės (syntagmes). Programa gali apdoroti tekstus, kaip įprastuose 2-baitų kodavimas (ANSI), kaip būt UTF-8 koduotę. Šaltinis tekstai yra apibrėžiami kaip plokščių tekstinius failus arba HTML / XML / SGML dokumentų rinkinys. Pastaruoju atveju programa gali filtruoti turinį iš antkainį. Be to, galite tvarkyti tik apibrėžtą kiekį per pasirinktus suporuotas žymes. Arba jūs galite praleisti šį turinį iš perdirbimui. Ji apima morfologija modulis Rusijos, trijų skirtingų formatų išėjimo indeksas, trijų skirtingų tipų žodinių elementų (žodžių, N-gramų ir frazės), naršyklėje kontekste, ir tiesa Abėcėlinis.
Programinė detalės:
Versija: 3.5
Įkėlimo datą: 15 Apr 15
Licencija: Nemokamai
Populiarumas: 370
Dydis: 2708 Kb
Komentarai nerastas