DataCleaner

Programinė įranga Screenshot:
DataCleaner
Programinė detalės:
Versija: 4.0.9
Įkėlimo datą: 11 Apr 16
Kūrėjas: -
Licencija: Nemokamai
Populiarumas: 17

Rating: nan/5 (Total Votes: 0)

DataCleaner yra atviro kodo ir visiškai nemokamas sprendimas organizacijoms ir įmonėms, norinčioms padidinti ir įvertinti jų duomenų kokybę.

DataCleaner, vartotojai galės profilis, lyginti, patvirtinti duomenis nuo verslo taisykles, ir stebėti šių matavimų progresavimą laikui bėgant.

"Tarp funkcijų, mes galime paminėti duomenų stebėjimą, duomenų profiliavimo ir DQ analizė, duomenų valymas ir sodrinimo operacijos, aptikti ir sujungti dublikatų, klientų duomenų kokybę, taip pat super greitai ETLightweight (ištrauka-Transform-apkrova).

Jei norite daugiau sužinoti apie DataCleaner funkcijų ir sugebėjimų, taip pat, kaip su juo dirbti, prašome kreiptis į http://eobjects.dk/docs

What naujo , šioje laidoje:

  • patobulinimų ir naujų funkcijų:
  • Mes padarėme įmanoma sukurti ir upuść lenteles per darbastalio UI DataCleaner. Atkreipkite dėmesį, kad Terminas "lentelėje & quot; čia iš tikrųjų apima daugiau nei tik reliacinės duomenų bazės lentelėse. Ji taip pat apima lapus MS Excel duomenų saugyklomis, kolekcijų MongoDB, dokumentų tipus CouchDB ir ElasticSearch ir pan ... Iš esmės visi Datastore tipų, kurie palaiko rašymo operacijų, išskyrus vieno stalo duomenų saugyklomis, tokių kaip CSV duomenų saugyklomis, paremti šį funkcionalumą! Funkcionalumas yra veikiami per:
  • & quot; Sukurti lentelę & quot; leido per dešiniuoju pelės klavišu meniu schemų medyje kairėje pusėje taikymo.
  • & quot; Sukurti lentelę & quot; taip pat leido per stalo atrankos žaliavų komponentų, tokių kaip įterpti į staliukas, stalas paieškos ir atnaujinti stalo.
  • & quot; lašas stalo & quot; leido per dešinįjį pelės mygtuku spustelėkite meniu lentelių medžio kairėje pusėje taikymo.
  • Mes pridėjome (neprivaloma) pajėgumus nurodant savo Salesforce.com interneto paslauga Endpoint URL. Tai leidžia jums naudoti DataCleaner prisijungti prie smėlio dėžės aplinkoje su Salesforce.com taip pat į savo užsakymą parametrus.
  • ElasticSearch parama buvo patobulinta, todėl užsakymą rodymo, taip pat pakartotinai tokius ElasticSearch DataStore apibrėžimus dabar taip pat paieškos ir indeksavimo.
  • įrašus ir atrankos potencialių dviem egzemplioriais dublikato aptikimo funkciją, atranka buvo patobulinta, todėl greičiau konfigūracijos, nes priimti sprendimai dėl mokymo sesijos metu, yra daugiau atstovas.
  • Dubliuoti aptikimo modelis failo formatas buvo atnaujintas, kurie buvo pašalinti už atskirą referencinį "failą reikia siekiant išsaugoti praeities mokymo sprendimus. Suderinamumas su senu formatu buvo palikta, bet naudojant naują formatą prideda daug naudos vartotojo patirtį.
  • Klaidų ištaisymas:
  • sriegis bado problema buvo nustatyta DataCleaner monitoriaus. Šio klausimo poveikis buvo puikus, tačiau tai atsitiko tik retais ir labai individualų atvejais. Jei užsakymą klausytojas objektai ant DataCleaner monitoriaus mesdavo klaidą, tai lemtų ištekliaus niekada išlaisvinimą ir pradėjimo siūlai iš kvarco tvarkaraščių baseinas serveryje. Jei tai nutiktų, daug kartų serveris ilgainiui galėtų paleisti iš siūlų tos baseinas.
  • vertikalus meniu Rezultatų ekrane dabar daro tinkamą darbą rodant komponentų, kurie rezultatus etiketes. Tai leidžia lengviau atpažinti, kuris meniu punktas taškų Kokio rezultato elemento.

Kas naujo versijos 3.5.5:

  • "Sinonimas peržvalgos" transformacija dabar turi galimybę ieškoti kiekvieną įėjimo raktą. Tai yra naudinga, jei jūs darote pakeitimą sinonimų per ilgo teksto lauke vertybes.
  • Blokavimo vykdymą DataCleaner darbo vietų per monitoriaus interneto paslauga tai gali kartais nepavyksta su klaida, kurią padarė blokavimo pokalbio. Ši problema buvo išspręsta.
  • pagerėjimas buvo padaryta pusę darbo vietų ir komponentų seka yra uždaryti / išvalyti po įvykdymo.
  • jnlp / "Java WebStart versija DataCleaner buvo veikiami pagal į Java runtime sukelia tam tikrus JAR failus negali būti pripažįstama, WebStart paleidimo, esant tam tikroms aplinkybėms klaidą. Ši problema buvo išspręsta darant nedidelius pakeitimus tiems JAR failus.
  • Keletas neveikiančias nuorodas dokumentuose buvo nustatyta.

Kas naujo versijos 3.5.4:

  • Tai dabar įmanoma paslėpti išvesties stulpelius transformacijų , Slėptuvė nepaveiks apdorojimo srautą ne visi, bet tiesiog juos paslėpti nuo vartotojo sąsają, taigi potencialiai priėmimo patirtis daugiau švarus, kai bendrauja su kitais komponentais.
  • nauja interneto paslauga buvo įtraukta į stebėsenos interneto paraišką, kuri suteikia galimybę Apklausa apie konkretaus darbo vykdymo būklę.
  • klaidą buvo nustatyta, todėl HTML ataskaitą žlugti tam tikrų analizės tipų, kai nėra įrašų buvo tvarkomi.
  • Ir 6 kitų nedidelių klaidą buvo adresuojami.

Kas naujo versijos 3.5.1:

  • Fiksuoti pasikeitė įrašų:
  • nauja filtra buvo įtraukta, kad pavienių tvarkymą įrašų, kurie nebuvo perdirbti prieš, pvz už profiliavimo ar kopijavimo tik keistas įrašus. Naujus filtrus ir pavadinimas yra "Capture pasikeitė įrašus, nuoroda į Pakeiskite duomenų surinkimo koncepciją.
  • Laukia eilės vykdymas darbo:
  • DataCleaner monitorius dabar eilėje į tą patį darbą vykdymą, jei jis suveikia kelis kartus. Tai užtikrina, kad jūs neturite netyčia paleisti tą patį darbą kartu, kuris gali sukelti įvairiais klausimais, priklausomai nuo to, darbas nėra.
  • Nedideli pataisymai: "
  • buvo įgyvendintos kelios taisymo.

Kas naujo versijoje 3.5:

  • Keletas burtininkai dabar yra registruoti duomenų saugyklomis; įskaitant failo įkelti į CSV failus, duomenų ryšio įrašą serveryje, vadovaujasi registravimo Salesforce.com įgaliojimai ir dar daugiau.
  • darbas statybos burtininkai taip pat buvo pratęstas keletą patobulintų funkcijų; Atrankos vertės paskirstymo ir raštas ieškant laukus Greita analizės vedlys, visiškai naujas vedlys kurti EasyDQ remiantis klientų valymo darbo vietų ir naujų darbo vietų vedlį šaudymo Pentaho duomenų integravimo darbų (skaityti plačiau žemiau).
  • Dabar galite ad hoc užklausas jokios DataStore tiesiai į interneto vartotojo sąsają. Tai labai lengva gauti greitus arba pavienius įžvalgas duomenų be steigti darbo vietas ar kitus valdo požiūrius duomenų tvarkymą.
  • Kai darbo ar duomenų saugyklomis yra sukurta, vartotojas vadovaujasi imtis veiksmų su naujai pastatytas objektas. Pavyzdžiui, jūs labai greitai gali paleisti darbo teisę, kai jis pastatytas, ar užklausti DataStore po jis įregistruotas.
  • Administratoriai dabar gali tiesiogiai įkelti darbo į kapinyną, kuris yra ypač patogu, jei norite rankomis redaguoti XML turinį darbo failus.
  • Techninės cruft daug dabar paslėptas naudai rodo paprastus dialogus. Pavyzdžiui, kai darbas yra užfiksuojamas didelis pakrovimo indikatorius rodomas, o kai baigė rezultatas bus parodyta. Išplėstinė medienos ruoša ekranas, kuris anksčiau buvo ten vis dar gali būti rodomas ant paspaudę papildomų detalių nuorodą.

Kas naujo versijos 3.1.2:

  • Mes pridėjome interneto paslauga, stebint paraiška gauti (sąrašas) metrinių vertybes. Tai daro stebėsena net labiau tinkami naudoti kaip raktų infrastruktūros komponentas, kaip būdas kontroliuoti duomenis (kokybės) ir atskleisti rezultatus trečiųjų šalių programų.
  • "lentelė peržvalgos" komponentas buvo patobulintas pridedant prie semantiką kaip konfigūruojama turtą. Naudojant prisijungti semantiką galite įgnybti, jei norite, kad peržvalgos dirbti semantiškai kaip LEFT JOIN arba vidinis prisijungti.
  • EasyDQ komponentai buvo modernizuotos, pridedant papildomų konfigūravimo parinkčių ir turtingesnį pasikartojimo rezultatas sąsaja.
  • Performance patobulinimų buvo konkretus dėmesys šioje laidoje. Patobulinimai buvo padaryta DataCleaner variklis toliau panaudoti transliacijos apdorojimo metodą tam tikrų kampe atvejais, kurie nebuvo padengta anksčiau.

Kas naujo versijos 3.1.1:

  • Data ir laikas susijęs analizės galimybės buvo išplėstos pridūrė, platinimo analizatoriai savaitę skaičių, mėnesius ir metus. Visi analizatoriai susijusių su data ir laikas dabar sugrupuotas per submeniu vadinamas & quot; data ir laikas & quot; pagal & quot; Analizuoti & quot;.
  • Neprivalomas & quot; aprašomosios statistikos & quot; variantas buvo įtraukta į numerį analizatorių, ir Data / Laikas analizatorius. Ši parinktis prideda papildomų metrikas šių analizatorių, pavyzdžiui, mediana, Asimetrija, procentilių ir ekscesą rezultatus. Šie rodikliai yra neprivaloma, nes jų atminties pėdsaką yra šiek tiek didesnis nei esamas metrikos.
  • laiko juostoje diagramas stebėsenos interneto taikymo linijos dabar turi mažus taškelius į juos. Tai ypač naudinga diagramas su keletą (ar net tik vieną) pastabas jų -. Priminti, kur tiksliai stebėjimo taškai;
  • Užklausa analizatorius, kada kviesdavosi ad hoc užklausas taip pat buvo iš esmės pagerintas. Dabar užklausos gali būti skirtingas sąlygas * -wildcards, subqueries ir yra gedimų tolerantiškesni teksto bylos klausimų.
  • Du nauji transformatoriai buvo pridėta generuoti UUID ir generuoti laiko žymes.

Kas naujo versijoje 3.1:

  • Metrinė formules - parengta duomenų kokybė KPI:
  • Tai dabar galima pastatyti daug išsamesnis duomenų kokybė KPI į DataCleaner stebėsenos interneto paraišką. Vartotojo sąsaja leidžia jums sukurti sudėtingas formules skaičiuoklėje-kaip formule stiliaus; naudojant pagal DataCleaner darbo vietų surinktus kintamuosius.
  • Metrinė formules galite derinti bet kokius metrikos, konstantų ir operacijų skaičių, tol, kol ji gali būti išreikštas matematine lygtimi.
  • Pavyzdžiui - išmatuoti pasikartojančius įrašus norma procentais visų įrašų skaičius. Arba matuoti produkto kodai sumą, kurios atitinka iki kelių styginių raštų rinkinys.
  • Tikslinis querying - apie duomenų saugyklos:
  • Su DataCleaner 3.1 dabar galite atlikti ad hoc užklausas bet duomenų saugyklos! Užklausos gali būti aiškia SQL ir bus taikomos duomenų bazių, taip pat failus, NoSQL duomenų bazių ir daugiau, teikiant tikrai naudinga užklausos mechanizmą išplėsti į savo atradimą ir duomenų profiliavimo patirtį.
  • Užklausa galimybė taip pat prieinama per interneto paslauga stebėjimo vartotojams administratoriaus vaidmenį. Užklausa yra numatyta kaip HTTP parametras "pranešimuose arba paskelbkite kūno, ir rezultatas yra numatyta kaip XHTML stalo.
  • Vertė Matcher - nauja analizė variantas:
  • Dažnai jūs turite tvirtą idėją, kurią turėtų būti leidžiama ir yra numatoma tam tikros srities vertybes. Be DataCleaner ten visada buvo Vertė pasiskirstymas analizė variantas, kuris padės jums apginti savo prielaidas. Be DataCleaner 3.1, nors, jūs turite tikslesnį auką - vertė, suderintoją. Ši analizė parinktis leidžia nurodyti numatomų verčių rinkinį ir tada atlikti vertės pasiskirstymą kaip analizės, konkrečiai patikrinti ir nustatyti netikėtų vertybes.
  • Kopijavimas, trinti ir valdymas darbo:
  • Valdymo darbo vietų ir rezultatų DataCleaner monitoriaus taikymo buvo patobulinta labai. Dabar galite spustelėti darbą Planavimas puslapyje monitoriaus, ir rasti valdymo variantų operacijas, tokias kaip pervadinti, kopijavimo, trinti ir dar daugiau. Kiekviena operacija gerbia ryšius su kitų dalykų ekrane, pavyzdžiui, analizės rezultatus, tvarkaraščius ir daugiau. Tai reiškia, kad valdymo stebėsenos saugykloje tapo daug lengviau ir brandus.
  • Tvarkyti duomenų kokybės istoriją: "
  • Kartais jūs susiduria situacijų, kai jūs iš tikrųjų norite daryti monitoringą istorinių duomenų! Tai gali būti, kad turite istorinių sąvartynus arba atsargines kopijas duomenų bazių, kurį nori parodyti ir papasakoti istoriją. Dabar galite padaryti, kad šią istorinę duomenų analizė, įkelkite jį į DataCleaner monitoriaus, ir naudojant naują interneto paslaugą, nustatyti istorinis duomenis, kad ypač analizės rezultato. Tai reiškia, kad jūsų terminai bus tinkamai sklypas rezultatus naudojant juos pagal paskirtį datos, bet su rezultatais, kad jūs surinktų gal vėliau momentu.
  • Clustered planavimo parama (tik EE):
  • DataCleaner monitoriaus planavimo buvo externalized, taip, kad ji gali būti pakeistos paprasta konfigūracija priemonėmis. Į Enterprise Edition (EE) ir DataCleaner, mes teikiame klasterio planavimo, suteikiant galimybę įkelti pusiausvyrą ir platinti savo egzekucijas visoje mašinų klasterius.
  • Vieno signon (LAP), naudojant CAS (EE tik):
  • Enterprise Edition (EE) ir DataCleaner dabar mes teikiame vieno signon variantą monitoriaus taikymo. Dabar DataCleaner gali būti integruota dalis jūsų IT infrastruktūrą, taip pat saugumo išmintingas.
  • ... Ir daug daugiau:
  • Aukščiau yra tik santrauka. Daugiau nei trisdešimt klausimai buvo sprendžiami šioje laidoje. Mes išsprendė kelis prašymus iš tos forumuose ir bendruomenės, ir mes kviečiame visus naudoti šią laikmeną kaip pokyčių transporto priemonės. Mes labai laimingi, kad iš DataCleaner kūrimas būti stipriai įtakoja Bendrijoje srautus.

Kas naujo versijos 3.0.3:

  • Prideda paslauga pervadinti darbo vietų stebėsenos duomenų saugykloje .
  • galite pasiekti tai, kaip ramus interneto paslaugą arba interaktyviai UI.
  • Web paslaugos buvo įtraukta keisti istorinę datą analizės rezultatas stebėsenos duomenų saugykloje.
  • Web taikymo buvo suderintas su palikimas JSF konteineriuose.
  • iškart pagyvėjo pasidėjimas konfigūracija Svetainės taikymo, todėl greičiau puslapis apkrovos ir darbo iniciacijos metu.

Kas naujo versijos 3.0.2:

  • Kai suaktyvina darbą stebėsenos interneto paraišką, panelė auto atgaivina kas antras gauti naujausią būklę vykdymą.
  • Failų pagrindu duomenų saugyklomis (pvz CSV arba Excel) su absoliučiais takais dabar teisingai išspręstas stebėsena interneto paraišką.
  • & quot; Pasirinkite iš rakto / reikšmės žemėlapyje & quot; transformatorius dabar palaiko įdėtos pasirinkite išraiškas kaip & quot; Address.Street & quot; arba & quot; eilutėmis [0] .product.name & quot;.
  • stalo peržvalgos mechanizmas buvo optimizuoti našumą, naudojant paruoštus pareiškimus, kai veikia prieš JDBC duomenų bazėse.
  • Administratoriai dabar galite atsisiųsti failų pagrindu duomenų saugyklomis tiesiai iš & quot; duomenų saugyklomis & quot; puslapis.
  • Išimties tvarkymas monitoringo interneto paraišką buvo patobulinta šiek tiek, todėl klaidų pranešimai tikslesnis ir intuityvi.

Kas naujo versijos 3.0.1:

  • Pagrindinis Ištaisyta šioje laidoje buvo apie realiomis prielaidomis kartografavimo stulpelių ir konkrečių išvardijamosios categorizations. Pavyzdžiui naujoje išsamumo analizatorius, mes nustatėme, kad po perkrovimo išsaugotą darbą, kartografavimas buvo ne visada teisinga.
  • Be to buvo padaryta keletas vidinių patobulinimų, kad būtų lengviau panaudoti DataCleaner kontroliuoti interneto paraišką aplinkoje naudojant Spring Framework.
  • Paskutinis, bet ne mažiau svarbu, vizualizacijos parametrus kompiuterio programa buvo patobulinta automatiškai atsižvelgiant į darbo išvaizdą yra ryškinamos ir perjungimas rodomas artefaktus remiantis ekrano dydžio ir kiekio informacijos, kurios reikia norint ją gražiai.

Kas naujo versija 3.0:

  • Ekranas laiko juostoje ir tendencijos duomenų kokybės metrikos
  • Centralizuota saugykla valdyti ir kurių sudėtyje yra darbo vietų, rezultatai, terminai ir kt.
  • Planavimas ir auditas DataCleaner darbo vietų;
  • Teikti interneto paslaugas pasitelkiant DataCleaner transformacijas;
  • Saugumas ir multi-nuomos,
  • Įspėjimai ir pranešimus, kai duomenų kokybės metrikos yra iš jų numatomus komforto zonos.
  • Yra naujų išsamumas analizatorius, kuris yra labai naudinga tiesiog nustatyti įrašų, kurie neišsamius laukus.
  • Dabar galite eksportuoti DataCleaner rezultatus gražus HTML ataskaitas, kad jūs galite duoti savo vadovu arba siųsti savo XML analizatorius!
  • Naujas monitoringas aplinkai, taip pat glaudžiai integruota su kompiuterio programa. Taigi, kompiuterio programa dabar turi galimybę skelbti darbo vietas ir rezultatus monitoriaus saugykloje, ir turi būti naudojama kaip interaktyvus redaktorius turinį jau saugykloje.
  • Nauji data orientuotas transformacijos yra dabar prieinamas: Data asortimentas filtras, kuris leidžia jums subset duomenų rinkinius, remiantis dat, ir formatas datą, kuri leidžia formatuoti datą naudojant data kaukę;
  • .
  • Reguliarieji reiškiniai parser (kuris anksčiau buvo prieinama tik per ExtensionSwap) jau įtraukti į DataCleaner. Tai labai patogu apdoroti ir standartizuoti turtingas teksto laukus naudojant reguliarios išraiškos.
  • Yra naujas tekstas atveju transformatorių galima. Su šia transformacija galite lengvai konvertuoti tarp viršutinės / apatinės atveju ir tinkamai kapitalizacija sakinių ir žodžių.

  • buvo pridėta
  • Dvi naujos paieška / pakeisti transformacijos:. Paprastas Paieška / pakeisti ir Reguliarieji reiškiniai Paieška / pakeisti;
  • buvo patobulinta vartotojo patirtis kompiuterio programa. Mes pridėjome keletą in-paraiškos pagalba pranešimus, pagamintas spalvos atrodo ryškesnis ir aiškesnis ir pagerino šrifto tvarkymo.

Kas naujo versijos 2.5.2:

  • Apache CouchDB palaikymas:
  • Mes pridėjome paramą NoSQL bazėje "Apache CouchDB. DataCleaner palaiko tiek skaitant, analizuojant ir rašyti į Jūsų CouchDB atvejais.
  • Atnaujinti stalo rašytojas: "
  • Po mūsų ankstesnius pastangas, kad ETLightweight stiliaus funkcijas į DataCleaner, mes pridėjome rašytojas, kuris atnaujina įrašus lentelėje. Jūs galite naudoti šį, pavyzdžiui, įterpti arba atnaujinti įrašus pagal konkrečias sąlygas.
  • Kaip įterpti į lentelę rašytojas, nauja DataCleaner Atnaujinti stalo rašytojas neapsiriboja SQL pagrindu duomenų bazių, tačiau bet Datastore tipas, kuris palaiko raštu (šiuo metu reliacinės duomenų bazės, CSV failus, Excel, MongoDB duomenų bazės ir MongoDB duomenų bazės), bet semantika yra tas pats kaip ir su tradiciniu Atnaujinti lentelę pareiškimą SQL.
  • Gręžimo iki išsamiai išgelbėti informacija rezultatų failai:
  • Naudodami Išsaugoti rezultatas funkcija DataCleaner 2,5, kai kurie vartotojai patyrė, kad jų gręžtuvas-su-detaliai informacija buvo prarasta. Be DataCleaner 2.5.2 mes dabar taip pat išlieka šią informaciją, todėl savo DQ archyvus daug vertingesnis tiriant istorinių duomenų apie incidentus.
  • Geresnis EasyDQ klaida paslaugos:
  • EasyDQ dalys buvo patobulintos atsižvelgiant į apdorojimo klaidų. Jei trumpalaikis tinklas problema atsiranda ar kitą Panaši problema sukelia keletą įrašus nepavykus, EasyDQ komponentai dabar grakščiai atsigauti ir svarbiausia -. Savo partijos darbas vyrauja net nepaisant klaidų,
  • Stalo kartografavimo NoSQL duomenų saugyklomis:
  • Nuo CouchDB ir MongoDB nėra lentelė pagrįsta, bet turi daugiau dinamišką struktūrą mes teikiame du požiūrius į darbo su jais: numatytasis, kuris yra leisti DataCleaner aptiktų lentelės struktūrą, o pažangi, kuri leidžia jums rankiniu būdu nurodyti Jūsų norimą lentelės struktūra. Anksčiau Išplėstinė galimybė buvo prieinama tik per XML konfigūracijos, bet dabar vartotojo sąsaja yra tinkamas dialogai tai daryti tiesiogiai paraiškoje.

Kas naujo versijos 2.4.1:

  • patobulinimų
  • Serija pakrovimo funkcijos mes pagyvėjo, kai įrašant duomenis į duomenų bazės lenteles. Tikėtis pamatyti daug eilėmis patobulinimų čia.
  • Rašymas į duomenų buvo patogiau prieinami pridedant galimybes prie lango meniu.
  • Dabar galite lengvai pervadinti komponentus darbo dukart paspausdami jų skirtukus.
  • javascript transformatorius dabar turi sintaksės spalvinimas, kad jūsų javascripts yra lengviau tikrinti ir keisti.
  • Klaidų ištaisymas:
  • Skaitant iš ir rašymo į tą patį duomenų saugyklos (pvz., Į DataCleaner sustojimo vieta) mes pasistengėme, kad lentelė talpyklos tos duomenų saugyklos yra atnaujinamas. Anksčiau kai kurie scenarijai leido jums pamatyti vaizdą lentelėse out-of-date.
  • potencialas aklavietės paleidžiant programą buvo išspręsta. Ši aklavietė buvo, kad į JVM klausimu pasekmė, bet mes dirbome aplink jį sinchronizuoti visus skambučius į ypatingą API Java.

Kas naujo versijoje 2.4: (. Taip pat žinomas kaip išdvejinimo arba Apytikslė atitikimo įrašų)

  • Duplicate aptikimo , kuris yra laisvai naudoti juos iki 500,000 verčių.
  • Adresas duomenų tikrinimas ir valymas. Tai leidžia jums patikrinti, ar adresas egzistuoja, jei jie teisingai suformatuotas ir net pasiūlyti pataisas Jei turite klaidų.
  • Vardas duomenų tikrinimas ir valymas. Su Name Service, EasyDQ ne tik formatuoti savo vardus nuosekliai, bet taip pat tikrina rašybos klaidas ir interpretuoja pavadinimą dalių.
  • El ir telefono patvirtinimas ir valymo. Šios paslaugos suteikia tikrinti elektroninio pašto ir telefono duomenimis, įsitikinkite, kad elektroninio pašto domenai egzistuoja, kad šalies kodai yra teisingi ir daug daugiau.

Kas naujo versijoje 2.3:

  • Tarptautinis duomenys palaikymas:
  • Jei dirbate su tarptautinėmis duomenų, tada jums gali turėti skirtingas rašmenų rinkinių savo duomenis, pavyzdžiui, Kinijos ar hebrajų. Mes pridėjome simbolių rinkinys platinimo analizatorių, kuris yra profiliavimas galimybė, kuri leidžia jums išsiaiškinti, kuris simbolių rinkiniai yra naudojami jūsų duomenis.
  • Darbas su duomenų, turinčių įvairių simbolių rinkinių gali būti problemiškas. Naudojant naują Transliteruoti transformatorius dabar galite transliteracija eilutes iš skirtingų rašymo sistemų lotyniškais rašmenimis.
  • Taip pat yra naujas transliacija demonstravimas, sutelkiant dėmesį į tarptautinių duomenų pajėgumus DataCleaner 2.3 dokumentuose skyriuje.
  • grupavimas analizės rezultatų pagal vidurinio skiltyje: "
  • Raštas analizatorius dabar galės grupės modelių, pagrįstų antrinio skiltyje. Tai naudinga analizių, pavyzdžiui:
  • Gauti modelius telefonų numerius, sugrupuoti pagal šalis.
  • Gauti modeliai pašto vardą remiantis elektroninio pašto srityje.
  • Kažkas panašaus buvo daroma dėl pridėtinės vertės paskirstymą analizatoriumi; tai leidžia analizės metodai, tokie kaip: "
  • Ar visi miestų pavadinimai skiriasi, kai sugrupuoti pagal pašto kodą?
  • Kas yra lyties pasiskirstymas ypač klientų tipų? "
  • Patobulinta diagramas:
  • Raštas ieškiklis rezultatai, dabar gali būti parodyta diagramoje. Tai daro pasiskirstymas matomas ir rodo, kiek iš & quot; ilgą uodegą & quot; modelių yra.
  • vert paskirstymo analizatoriaus produkcija buvo patobulinta srityse pora:
  • buvo pagerintas diagramos skaitomumas.
  • Tai rodo skaičių eilučių ir ryškų skaičius per šių eilučių: skirtingų vertybių, kurios egzistuoja eilučių skaičių. Tai padeda suprasti, kaip dažnai pasikartojančių vertės egzistuoti.
  • Jei yra tuščias eilutes, mes naudojame už jį raktažodį, kad ji yra lengviau jas atpažinti.
  • Išėjimas:
  • Šalia jau esamų formatai (CSV failus ir H2 duomenų saugyklomis) mes pridėtinės raštu išėjimo į Excel.
  • Po raštu į duomenų saugyklos, dabar įmanoma peržiūrėdami išvestį, todėl, kad jūs galite patikrinti, ar produkcija yra pagal jūsų lūkesčius.
  • Tai dabar taip pat galima pridėti išvestį kaip naują duomenų saugyklos, taip, kad jis gali būti naudojamas kaip įvesties naujo darbo.
  • Kiti patobulinimai:
  • Dokumentacija buvo apskritai pagerėjo. Visų pirma, buvo pridėtas ruoša ir komandinės eilutės sąsaja aprašymai.
  • pratęsimo mechanizmas buvo pagerintas modularizing keletą vienetų taikant ir diegiant Google Guice kaip visuotinai prieinama priklausomybės injekcijos sistemos prailginimo kūrėjams.
  • Ir, žinoma, mes padarėme daugiau nei dvidešimt mažų patobulinimų ir klaidų ištaisymų.

Kas naujo 2.2 versija:

  • Pagrindinis veiksnys šioje laidoje buvo pasakojimas apie įtempis , Nors atleidus taikymą mes simultaniously atleidžiantis naujas DataCleaner tinklalapis, svarbų naują vietovė: ExtensionSwap. Iš ExtensionSwap idėja yra leisti dalytis plėtinius į DataCleaner ir montavimo tiesiog spustelėję mygtuką naršyklėje!
  • DataCleaner plėtinio API buvo patobulinta daug šioje laidoje, kad būtų galima sukurti savo transformatoriai, analizatoriai ir filtrai. Jei manote, kad jūsų plėtiniai gali būti įdomūs kitiems vartotojams, prašome pasidalinti ja ant ExtensionSwap ir mes teikiame kanalą jums lengvai platinti ją tūkstančių vartotojų. Pratęsimas API ir ExtensionSwap toliau paaiškinta mūsų naują transliacijos demonstravimo kūrėjams ir kitų technikų, kurių interesus.
  • Mes taip pat išleido pradinių plėtinių ExtensionSwap pasirinkimas: HIquality kontaktai DataCleaner išplėtimo, kuris suteikia papildomą Vardas, telefonu ir elektroniniu paštu valymo, remiantis Žmogaus išvadas natūralios kalbos apdorojimas DQ interneto paslaugas. Mes taip pat laivybos imties pratęsimą, kuris tarnaus kaip pavyzdys kūrėjams, norintiems save išbandyti pratęsimas plėtros. Per ateinančius mėnesius mes pasirūpinsime, kad galėtumėte dar daugiau plėtinių kilmės iš mūsų vidaus portfelio įrankių, kad mes naudojame ne Human išvada žinios rinkti komandos.
  • Be įtempis mes taip pat sutelkiant dėmesį embeddability. Mes norime, kad būtų galima įdėti DataCleaner lengvai į kitas programas padaryti profiliavimas ir duomenų analizė įmanoma bet kur! Sukūrėme naują saviranka API, kuri leidžia paraiškas pluoštas DataCleaner ir įkrovos su dinaminės konfigūracijos arba paleisti jį į & quot; viena DataStore režimu & quot ;, kai paraiška yra pritaikyta prie tiesiog apžiūrėję vieną DataStore (paprastai apibrėžta paraiškos kurios paskatintų DataCleaner). Mes jau turime tikrai įdomių atvejų įdėjimas DataCleaner į darbus -. Tiek kitų atviro kodo programomis, taip pat komercinės paskirties;
  • Mes pridėjome paramą analizuojant SAS duomenų rinkinius. Tai yra kažkas, mes gana didžiuotis, nes mes esame, mūsų žiniomis, pirmasis pagrindinis atviro kodo programa pateikti tokį funkcionalumą, galiausiai išvaduoja iš SAS daug vartotojų. SAS sąveikos dalis buvo sukurtas kaip atskiras projektas, SassyReader, todėl mes tikimės pamatyti priėmimą DataCleaner anketa nemokami atviro kodo bendruomenių netrukus per daug! "
  • Mes taip pat papildoma parama kitą DataStore tipas: Fiksuotas plotis failus. Fiksuotas plotis failai yra tekstiniai failai, kur kiekvienas stulpelis turi nuolatinę plotį. Nėra separatorius ar citata charakteris, kaip ir CSV failus, o kiekviena eilutė yra vienodo ilgio ir kiekviena eilutė bus tokenized pasak vertės ilgio rinkinyje.
  • Galimybė & quot; nepavyks neatitikimų & quot; buvo įtraukta į CSV failą ir fiksuoto pločio failų duomenų saugyklomis. Šios vėliavos pridėti formatas vientisumo patikrinimas naudojant šias Tekstinis failas, pagrįstas duomenų saugyklomis.
  • klaidą buvo nustatyta, kuris sukėlė CSV separatorius nustatymus negali būti likusios vartotojo sąsaja, kai redaguojate CSV DataStore.
  • japonų ir kitų simbolių yra nepalaikoma vartotojo sąsaja. Tai & quot; klaida & quot; buvo tirti laisvų šriftų sistemoje ir pasirinkdami šriftą, kuris gali tapti konkrečius personažus reikalas. Daugumoje šiuolaikinių sistemų ten bus galima šriftai prieinama, tačiau dėl kai kurių UNIX / Linux šakų vis dar gali būti apribojimai.
  • dokumentacija skyriuje buvo atnaujintas! Nuo pradinio 2.0 išleidimo dokumentus buvo gerokai atsilieka, bet mes pagaliau pavyko gauti iki šiol. Yra dar gabalai trūksta docs, tačiau ji turėtų tikrai būti naudinga pagrindinio naudojimo, taip pat nuoroda daugeliui temomis.
  • Programų paleidimo laikas buvo pagerintas lygiagretinimo konfigūracijos krovimo ir atidedant šių konfigūracijos, kurios nėra reikalingos pradinės vitrinos dalių iniciacijos.
  • fonetinis panašumas ieškiklis analizatorius buvo pašalinti iš pagrindinio paskirstymo, nes tai buvo gana eksperimentinis ir tarnauja daugiausia dėl koncepcijos įrodymo ir užkandis bendruomenei sukurti daugiau pažangių atitikimo analizatoriai. Dabar galite rasti ir įdiegti fonetinis panašumas ieškiklis ant ExtensionSwap.
  • Atšauktas arba errornous darbas tvarkymas buvo patobulinta ir vartotojo sąsaja reaguoja labiau teisingai išjungti mygtukus ir pažangos rodiklius, jei darbas buvo sustabdytas.
  • Fiksuotas keletą nedidelių UI klausimus, susijusius su stalo dydžio ir naudojimo persukimo.

Kas naujo versijos 2.1.1:

  • Priedai:
  • Pridėta paieškos / filtravimo teksto lauką į duomenų saugyklomis sąrašą. Tai leidžia jums greitai rasti savo DataStore Jeigu jūs jau užsiregistravote daugiau duomenų saugyklomis nei galima ekrane.
  • Informaciniai duomenys apie šalių kodus buvo įtraukta į standartinį platinimo, padėka Graham Rhind už tai.
  • Pridėta horizontalią slinkties juostą duomenimis Peržiūra langai yra daugiau nei 10 stulpeliai.
  • Galimybė pridėti plėtinį paketą su naujų funkcijų į Options dialogo vykdymo metu. Daugiau dėmesio pratęsimų paseks artėjančius spaudai.
  • Mes veikiami anksti peržiūrėti mūsų komandų eilutės sąsaja (CLI), leidžia remtis prašymą su & quot; -usage & quot; parametras, kuris rodo, CLI galimybes.
  • Pridėta skaičius formatavimo parinktis į & quot; Konvertuoti į Numeris & quot; transformatorius.
  • Klaidų ištaisymas:
  • Fiksuotas out-of-atminties problema, kai užklausų lenteles su stulpelių (150 +) Pirkimo dalis.
  • Ištaisyta problema, kad sukelti & quot; Ribinė analizė & quot; žymės langelį nebus tikrinamas teisingai, kai buvo iš naujo atidarytas darbas po taupymas.
  • Ne tikrai Ištaisyta, nes ji niekada nebuvo oficialus funkcija, bet dabar mes parama atkuriant vartotojų pageidavimus (iš userpreferences.dat failų) iš ankstesnių versijų DataCleaner.

Kas naujo , versija 2.1:

  • Ten buvo padaryta dėl vartotojo sąsaja daug darbo ( matyti medijos puslapį):
  • Mes nusprendėme pašalinti kairėje pusėje langą, kuriame yra aplinkos konfigūravimo galimybes.
  • Vietoj visi šie variantai jau buvo perkeltas į darbą pastato lango, todėl vartotojas turi tik sutelkti dėmesį į vieno langelio visų sąveikų reikia statyti darbą.
  • Sveiki / login langas taip pat buvo pašalintas už daugiau diskrečiųjų skydelyje, kurią galima nutempti arba paslėpta nuo pagrindinio lango.
  • "Datastore parinkimas ir valdymas yra laikoma pirmąja veikla prašyme, kuris yra, kodėl ji taip pat yra pirmasis žingsnis tvarkyti pagrindiniame lange.











Ekrano

datacleaner-315902_1_315902.png
datacleaner-315902_2_315902.png
datacleaner-315902_3_315902.png

Panaši programinė įranga

Kita programinė įranga kūrėjas -

Particle Text
Particle Text

30 Oct 15

Mako Framework
Mako Framework

10 Dec 15

apophysis-j
apophysis-j

11 Apr 16

Komentarai DataCleaner

Komentarai nerastas
Pridėti komentarą
Pasukite ant paveikslėlio!