DSTK - "Data Science Toolkit 3" - tai duomenų ir tekstų gavybos programinės įrangos rinkinys, atitinkantis CRISP DM modelį. DSTK teikia duomenų supratimą naudodamas statistinę ir teksto analizę, duomenų rengimą, taikant įprastinį ir teksto apdorojimą, modeliuojant ir vertinant mašininio mokymosi ir statistinio mokymosi algoritmus.
DSTK 3 pasiūlys patrauklias funkcijas, tokias kaip Deep Neural Network (gilus mokymasis), teksto ryšio analizė su vizualizavimu, "KMeans" klasteriavimas. Kai kurios iš šių funkcijų gali būti pateikiamos senesnėje versijoje, tačiau dėl to, kad algoritmai yra perrašomi siekiant sumažinti išorinių bibliotekų, tokių kaip Weka, naudojimą failų dydžiui sumažinti, mums reikia daugiau laiko juos kurti. DSTK variklis vis dar yra beta stadijoje, todėl gali būti klaidų ir netikslumų.
DSTK 3 sudaro DSTK variklis, DSTK scenarijus, DSTK studija ir DSTK Text Explorer. DSTK Engine yra supaprastinta, daugiausia dėmesio skiriant duomenų gavybai. "DSTK ScriptWriter" siūlo GUI rašyti DSTK variklio scenarijų. "DSTK Studio" siūlo SPSS statistiką kaip duomenų gavybos GUI, o "DSTK Text Explorer" siūlo GUI teksto kūrimui.
Reikalavimai :
Java Runtime Environment, Microsoft. "Net Framework"
Apribojimai :
10 bandymų
Komentarai nerastas