LanguageTool

Programinė įranga Screenshot:
LanguageTool
Programinė detalės:
Versija: 2.9 Atnaujintas
Įkėlimo datą: 14 Apr 15
Kūrėjas: Daniel Naber
Licencija: Nemokamai
Populiarumas: 18

Rating: nan/5 (Total Votes: 0)

LanguageTool yra atviro kodo programa, skirta Korektūros rasti klaidų, kad reguliariai rašybos tikrintuvas įrankiai negali aptikti. Tai taisyklė pagrįsta stiliaus ir gramatikos tikrintuvas, kad ras klaidų, dėl kurių taisyklė apibrėžiama jos XML sąrankos failus, pavyzdžiui, maišyti & ldquo; & rdquo jų; su & ldquo;. & rdquo ten;


Aptinka įvairias gramatikos problemas

"programa taip pat gali aptikti įvairias gramatikos problemas ir ateina su parama daugiau nei 20 kalbų, įskaitant anglų, vokiečių, lenkų, prancūzų, ispanų, švedų, graikų, ispanų, kinų, danų, japonų, Islandijos, Portugalijos ir Brazilijos portugalų.
Be to, jis pasižymi lengvai naudoti, paprastą ir nesudėtingą grafinę vartotojo sąsają, kuri leidžia bet kam įklijuokite tekstą, kuris turi būti rašybos patikrinti. Tai galite patikrinti tekstą į iškarpinę, Tag teksto, supjaustyti / kopijuoti / įklijuoti tekstą ir gyvena sistemos dėklo srityje.


Aptinka platų problemų

Nuo lange Parinktys, galite įjungti kokio tipo problemos programa gali aptikti, įskaitant netinkamą stiliaus, gramatikos klaidų, Slengas, skyrybos klaidų, galimas rašybos, nereikalingų frazių, paprastai painioti žodžių, junginių vertimo, kapitalizacija, semantikos, taip pat kaip nestandartinių frazių.


LanguageTool už LibreOffice ir OpenOffice

Be to, kad yra atskira programa, LanguageTool taip pat galima kaip už dviejų populiariausių ir galingiausių atvirojo kodo biuro apartamentai, LibreOffice ir OpenOffice.org Apache pratęsimo, leidžia vartotojams redaguoja tekstus dešiniuoju pelės mygtuku spustelėdami ant pasirinktos frazės arba dalimis.


LanguageTool Mozilla Firefox

Be to, programa yra taip pat galima atsisiųsti kaip add-on pasaulio & rsquo; populiariausia atviro kodo interneto naršyklė pasaulyje, Mozilla Firefox. Ji nereikalauja jokių naujo ir įdeda mažą mygtuką pagrindinėje įrankių juostoje, kad būtų galima redaguoja pažymėtą tekstą iš svetainių ar formas.


Pagal gaubtu ir prieinamumą

Jei prašymas yra parašyta visiškai Java programavimo kalba, o tai reiškia, kad jis & rsquo; SA cross-platform programinės įrangos, skirtos dirbti su bet GNU / Linux distribucijos, taip pat BSD, Solaris, Windows ir Mac OS X operacinę sistemos, kuriose Java Runtime Environment yra įdiegtas.

Kas naujo , šioje laidoje:

  • katalonų: "
  • atnaujinama POS žyma žodynas
  • pridėjo naujas taisykles,
  • fiksuoti klaidingi pavojaus signalai,
  • anglų
  • pridėjo keletą taisyklių ir Ištaisyta keletas klaidingų pavojaus;
  • Pridėta daug naujų stiliaus taisyklės prisidėjo Heikki Lehvaslaiho. Kaip tai gali įjungti netikro pavojaus signalo, jie nėra aktyvuotas pagal nutylėjimą. Jūs galite įjungti juos įjungiant visas taisykles į naują "Plain anglų 'kategorijos.
  • esperanto: "
  • pridėjo keletą naujų taisyklių,
  • prancūzų,
  • atnaujinama POS žyma žodyną ir Hunspell žodyną į Dicollecte-5.3
  • vokiečių
  • pridėjo keletą naujų taisyklių ir stacionarius neteisingus pavojaus signalus;
  • Pridėta naują taisyklę, kad patikrinimai dėl taikomos veiksmažodžio sutartį. Nes dabar tik atvejai su "IVT", "sind", "karo" ir "Waren" yra palaikomi. Pavyzdys klaidų, aptiktų: "." Der Hund sind SCHA & para; n "," Die Autos ist Schnell. Kad ši taisyklė darbą, frazės dabar suvienyti disambiguation.xml: pavyzdžiui, "Manno" frazėje "ein Mann" bus tik išlaikyti savo vardininko svarstymą (SUBRANGOVAMS: NOM: SIN: MAS), kadangi naudojamas taip pat galininko ir naudininko rodmenys (SUBRANGOVAMS: AKK: SIN: MAS, SUBRANGOVAMS: DAT: SIN: MAS). (Https://github.com/languagetool-org/languagetool/issues/233)
  • italų: "
  • pagerino keletą taisyklių,
  • lenkų: "
  • pridėta keletas naujų taisyklių,
  • portugalų kalba: "
  • pridėti / patobulintų kelios taisyklės,
  • 3695 sudėtiniai žodžiai (iš anksto reforma) - didžiausias nemokamas duomenų,
  • rusų: "
  • pridėjo ir patobulinti taisykles;
  • ukrainiečių: "
  • didelis žodynas atnaujinimas;
  • naujos gramatikos taisykles;
  • Naujas paprasta pakeisti taisyklę minkštų pasiūlymus;
  • disambiguator patobulinimų
  • junginys žymėjimo ir rašybos patobulinimų
  • inicialai žymėjimo patobulinimai;
  • sakinys ir žodis tokenizing patobulinimų
  • pagerino tvarkymas Stres simbolis ir minkštųjų brūkšneliu;
  • Bitext taisyklės: "
  • pridėjo paprastą taisyklę patikrinti, ar vertimai baigti su tuo pačiu skyrybos ženklo, kaip originalus (tai apima tik.?! Simbolių).
  • dabar galima pridėti išorės bitext taisyklė failus komandinėje eilutėje, naudojant
  • -bitextrule pasirinkimas. Failo maršrutas turi būti absoliuti. Pastaba:. Tai leidžia naudojant bitext taisykles taip pat kalbų, kurie neturi bitext taisykles įtraukti pagal nutylėjimą;
  • Rašyba: "
  • nauji failai at /hunspell/spelling.txt gali būti naudojamas pridėti sutartus žodžius į rašybos tikrintuvą, kad taip pat yra laikomi kurdami pasiūlymus klaidomis žodžių. Tai panašu į /hunspell/ignore.txt failus, kurių sąrašas pripažintus žodžius, kurie * ne * naudojami kuriant pasiūlymus klaidomis žodžių.
  • API
  • JLanguageTool.activateDefaultPatternRules () ir JLanguageTool.activateDefaultFalseFriendRules () buvo pašalintas - visi modelis taisyklės ir netikrų draugas taisyklės (jei antroji kalba yra nurodyta) dabar įsijungia automatiškai tada, kai JLanguageTool konstruktorius vadinamas. Jei reikia tikrintuvą be XML pagrįstą metodą taisykles, pratęsti savo kalbą klasė (pavyzdžiui, "anglų") su viena, kad perrašo getPatternRules () metodą ir grąžina tuščią sąrašą ten.
  • ManualTagger.lookup () buvo pakeistas ManualTagger.tag () po to, kai nebenaudojamas, nes naujausia versija,
  • Visi statiniai metodai ir laukai iš klasės "Language" buvo perkelta į naują klasę "Kalbos". Nes dabar, metodai / laukeliai klasės Kalba vis dar egzistuoja, tačiau buvo pasmerkta.
  • LanguageIdentifierTools buvo ištrintas. Naudokite LanguageIdentifier vietoj.
  • Pašalinta (Numatytoji) ResourceDataBroker.setResourceDir () ir setRulesDir (), nes jie gali būti nustatyti su konstruktoriaus "
  • Išvalytas up klasė Pagalbininkas, pvz pašalinti getRemark ();
  • Category.setDefaultOff () buvo ištrintas, tai gali būti nustatyti per konstruktorius dabar,
  • Pervadintos klasės: o.lt.rules.patterns.Element = & gt; o.lt.rules.patterns.PatternToken o.lt.rules.patterns.ElementMatcher = & gt; o.lt.rules.patterns.PatternTokenMatcher
  • Kiti smulkūs API patvarkymai, kad neturėtų paveikti bendro naudojimo atvejais, pvz IncorrectExample.getCorrections () grąžina ir unmodifiable sąrašas dabar pašalinimas atgyvenę metodai.
  • Įterptosios serveris:
  • XML Escaping buvo nustatytas, tai gali sukelti nepagrįstus XML dokumentus turi būti grąžintas;
  • Naujas konfigūracijos failo parinktis "maxWorkQueueSize", kuri leidžia jums nustatyti maksimalų dydį Užklausus eilėje - jeigu jis gauna didesni nei tai, prašymai bus atmesti (503 Paslauga neprieinama),
  • serveris dabar reaguoja su konkretesniais HTTP būsenos kodus į šių klaidų sąlygomis: 413 Prašymas subjektas per didelis - jei tekstas viršija maksimalų Teksto dydis 503 Paslauga neteikiama - jei patikrinimas viršija maksimalų patikrinimo metu;
  • GUI: "
  • savarankiškas GUI dabar gali priimti paprastą tekstinį failą kaip argumentą, šis failas bus įkeltas paleidžiant (GitHub klausimas # 232).
  • Komandų eilutės: "
  • Tai dabar galima pridėti išorinį taisyklė failą, kai skambinama LanguageTool iš komandinės eilutės. Naudokite --rulefile pridėti failą. Jei failo pavadinimas turi formatą, kuriame yra kalbos pavadinimą, jis bus naudojamas kartu su kitomis taisyklėmis; kitaip, ji bus pakeisti taisykles. Jūs taip pat galite įkelti išorinį failą su netikrų draugų naudojant parinktį --falsefriends. Failo pavadinimas turi būti absoliutus failo maršrutas ir netikrų draugas failai visada įtraukta į tuos, kurie yra pakraunami kalbai. (GitHub klausimas # 192),
  • taisyklė sintaksė:
  • taisyklė dabar gali turėti vieną pavyzdį sakinį tol, kol ji yra "korekcijos" atributą - tai gali sutaupyti šiek tiek atleidimo iš darbo, jei tik teisingai sakinys yra toks pat, kaip neteisingą sakinį su korekcijos koeficientą. Prieš taisyklė reikalinga bent du pavyzdinius sakinius.
  • "pavyzdys" elementas: tipas = "Neteisingas" dabar neprivaloma, jei ten "korekcija" atributas. "Korekcija" atributas reiškia, kad sakinys yra neteisingas. "
  • "pavyzdys" elementas: tipas = "teisinga" šiuo metu yra neprivalomas. Ne "tipas" atributas ir ne "korekcija" atributas reiškia, kad sakinys yra teisingas.
  • Vidaus
  • Mes perėjo iš Apache Tika kalbų detektoriumi (https://github.com/optimaize/language-detector) automatiškai nustatyti teksto kalbą. Ji turėtų būti greičiau ir rezultatai turėtų būti labiau patikimas. Aptikta Astūrijos ir galisų turėjo būti išjungta, nes aptikimo kokybė buvo per mažas, o taip pat turi įtakos aptikti ispanų kalbomis.
  • Ištaisyta regresiją, kad tapo neįmanoma įkelti išorinius taisyklė failus GUI.

Kas naujo versija 2.8:

  • Astūrijos: "
  • ištrintas priklausomybė nuo Hunspell, dabar naudoja Morfologik rašybai tikrinti,
  • Bretonų: "
  • pridėta ir pagerino keletą taisyklių,
  • katalonų: "
  • atnaujinama žodynas
  • pridėjo ir patobulinti taisykles;
  • fiksuoti klaidingi pavojaus signalai,
  • olandų: "
  • papildomas ir patobulinti daug taisyklių;
  • anglų
  • kai naujos taisyklės (dėka Nick Hough),
  • atnaujino Tagger ir sintezatoriaus žodynus, tvirtinimo klausimas # 202;
  • Naujas filtras turi būti naudojami atitikimo dalių žodžių partofspeech, pvz. Į * Tai padės išlaikyti tik rungtynes ​​žodžių, kurie prasideda "in" ir kur dalis po "in" yra būdvardis (POS žymė 'JJ'). "No: 1" yra simbolinis pozicija, ty čia pirmą kartą (ir tik) atitikties vadinamas "
  • .
  • prancūzų: "
  • pridėta ir pagerino keletą taisyklių,
  • vokiečių
  • pridėta ir pagerino keletą taisyklių,
  • lenkų: "
  • pridėjo ir patobulinti kelios taisyklės,
  • pridėta ir pagerino neteisingus draugus anglų
  • portugalų kalba: "
  • pridėti / patobulintų kelios taisyklės,
  • ispanų kalba: "
  • ištrintas priklausomybė nuo Hunspell, dabar naudoja Morfologik rašybai tikrinti,
  • performatuoti taisyklės failą
  • Pridėta daugiau taisyklių,
  • tagalų: "
  • ištrintas priklausomybė nuo Hunspell, dabar naudoja Morfologik rašybai tikrinti,
  • brūkšnys charakteris ("") yra skyriklis dabar, kai tokenizing tekstą
  • rusų: "
  • pridėjo ir patobulinti taisykles;
  • pridėta keletas klaidingų draugas taisykles (rusų / anglų kalbomis);
  • ukrainiečių: "
  • daug naujos taisyklės (įskaitant susitarimą su daiktavardžiais, laiko išraiškos ir tt);
  • taisyklė aprėptis tobulinimas;
  • žodynas atnaujinimas (dideli patobulinimai daiktavardžiai ir šauksmininkas)
  • naują žymą ir valdyti perspėti apie alternatyvius rašybos
  • pridūrė žodis dažnis informaciją norėdami pagerinti rašybos pasiūlymus;
  • keletas naujų disambiguator taisyklės
  • taisyklė Sintaksė: "
  • ... dabar gali būti įtraukta į rulegroup paveikti visas šios grupės taisykles;
  • Jei jums sukurti savo taisykles, kurios nepriklauso LT, dabar galite pridėti išorės = "Taip" savo kategorijose užkirsti kelią taisyklių nuorodą community.languagetool.org, kad jo nesimatytų mūsų standalone GUI (nuoroda neveikia taisykles, kurios nepriklauso nuo pagrindinės paskirstymo LT). (GitHub klausimas # 223),
  • Jei taisyklė grupė nurodo numatytąjį = "OFF", kad į taisyklę grupės viduje taisykles negali taip pat nurodyti numatytąjį = "on" / "išjungti".
  • API
  • Pašalinta klasės ir metodai, kurie buvo pasenusios, nes 2,7 ar ilgiau,
  • Įterptosios serveris:
  • config failo parinktis "requestLimit" ir "requestLimitPeriodInSeconds" dabar gali būti naudojamas HTTP serverį (ne tik HTTPS serverio),
  • Nauja konfigūracijos failo parinktis "trustXForwardForHeader": nustatykite, kad tai "tiesa", jei paleisti už atvirkštinio proxy serverį ir norite prašymas riba dirbti originalių IP adresus teikiamų "Xforwardedfor" HTTP antraštėje, paprastai nustato Proxy. Jei paleisti per proxy serverį, bet ne nustatyti šį turtą tiesa, vienas vartotojas gali naudoti visus prašymus, kad kiti vartotojai taip pat gausite klaidos pranešimą, nes nuo prašymo ribos.
  • Nustatyti atsakas po nustatyto termino režimu: <...> kartais buvo tuščias, klaidinantis teksto čekį WordPress "
  • Bitext taisyklės nebuvo tinkamai išjungtas, net jei jie buvo nurodyta su tinkamu parametru serverio; dabar jis fiksuotas,
  • Fiksuotas problema su netinkamai pozicijas kai kuriose bitext taisykles (klausimas # 218),
  • GUI: "
  • Naujasis "errorColors" nustatymas buvo įtraukta į languagetool.cfg konfigūracijos failą. Jis gali būti naudojamas, norint nustatyti fono spalvą klaidų. Pavyzdžiui, errorColors = tipografijos: # b8b8ff, stilius: # ffb8b8 parodys "spausdinimo" klaidų mėlyname fone ir "stilius" klaidų raudoname fone į viršutinę dalį LT langą. "Korektūros" ir "stilius" yra rūšys, kurios yra nustatytos grammar.xml kaip "type = ...". Nėra vartotojo sąsajos dar konfigūruoti šias spalvas. Atkreipkite dėmesį, kad jums reikia redaguoti tik languagetool.cfg failą, kai LT neveikia.
  • Vidaus
  • Ištaisyta: nebuvo aktyvuotas taisyklės viduje taisyklėmis grupei, jei ankstesnė taisyklė, iš to paties rulegroup naudojamas pagal nutylėjimą = "išjungti"
  • Žodžiai ne ignoruoti pasikeitusios rašybos tikrintuvą tik todėl, kad jie ištinka taisyklė siūlymu. Jei norite rašybos tikrintuvas ignoruoti žodžius pasaulyje, įtraukti juos į hunspell / ignore.txt. Juos ignoruoti, priklausomai nuo konteksto, pridėti "ignore_spelling" taisyklę disambiguation.xml.
  • failas "hunspell / prohibit.txt" dabar gali būti naudojami pažymėti žodžių rašybos klaidų, net jei rašybos tikrintuvas paprastai juos priimti. Tai yra naudinga, siekiant pagerinti LanguageTool rašybos tikrintuvą, nelaukiant tiekėjų checker būti atnaujintas. "Prohibit.txt" failas yra "ignore.txt", kuris sukelia rašybos tikrintuvą ignoruoti žodžius priešais.
  • partofspeech Tagger daugumai kalbų, dabar gali būti pratęstas pridedant įrašų failų org / languagetool / išteklių / XX / added.txt (XX yra kalbos kodas). Formatas yra "fullform baseform postag", trys stulpeliai atskirti skirtukais. Tai palengvina vartotojams (ir kūrėjams) pratęsti POS Tagger, nes jiems nereikia eksportuoti, modifikuoti ir atkurti dvejetainis žodynas už kiekvieną pakeitimą.

Kas naujo versijos 2.7:

  • Bretonų: "
  • pridėjo ir patobulinti taisykles;
  • Nauja taisyklė, kad patikrina, ar šiokiadienis rungtynes ​​datą, pvz aptinka "Gwener 28 Viz Eost 2014", nes ši data yra ne penktadienį.
  • katalonų: "
  • pridėjo ir patobulinti taisykles;
  • fiksuoti klaidingi pavojaus signalai,
  • olandų: "
  • papildomas ir patobulinti daug taisyklių;
  • perėjo į Morfologik įsikūrusio rašybos tikrintuvą,
  • -Anglų kalba:
  • Ar norite būti dalis komandos, kad plėtoja galingiausia pasaulio Open Source korektūra įrankis? Mes ieškote už anglų taisyklių LanguageTool prižiūrėtojui. Žiūrėti http://wiki.languagetool.org/tasks-for-language-maintainers detales.
  • Visos anglų žodynai buvo pratęstas iki sudėtyje žodžių dažnio klasės tobulinti rašybos tikrintuvas pasiūlymus (dažnis duomenys yra paimti iš https://github.com/mozilla-b2g/gaia/tree/master/apps/keyboard/js / IME / latin / Žodynai, kaip ir kitomis kalbomis, kurie jau naudoja šią funkciją).
  • Geresni pasiūlymai anglų besimokančiųjų: netaisyklingos veiksmažodžių, daiktavardžių, būdvardžių ir dabar paprastai turi geresnę pasiūlymą. Pavyzdžiui, "thinked" rodo "maniau", "Moterys", rodo 'moterys'.
  • Daugiau rašybos teikti pasiūlymus jau dabar, pavyzdžiui, "Garentee" (garantijos), "dėkinga" (dėkingas). Tai gali sukelti našumo sumažėjimą ~ 10% (daugiau tekstų su nežinomų žodžių daug).
  • Nauja taisyklė, kad patikrina, ar šiokiadienis rungtynes ​​datą, pvz aptinka "pirmadienis, spalis 7, 2014", nes ši data yra ne pirmadienį. Ši taisyklė bus dirbti tik tada, kai ji aptinka datos formatą naudojimo. Iki šiol šie formatai yra palaikomi: * "pirmadienis, spalis 7, 2014" * "pirmadienis, spalis 7, 2014" * "pirmadienis, spalis 7, 2014" * "pirmadienis, spalis 7, 2014" * (tai taip pat dirba su sutrumpintai savaitę dienos kaip Mo ar Pir pirmadienį),
  • esperanto: "
  • Nauja taisyklė, kad patikrina, ar šiokiadienis rungtynes ​​datą, pvz aptinka "Vendredon la 28-an de AAgusto 2014", nes ši data yra ne penktadienį.
  • prancūzų: "
  • atnaujinama POS žyma žodyną ir Hunspell žodyną į Dicollecte-5.2
  • pridėjo sintezatorių - susitarimas taisyklė dabar gali teikti pasiūlymus dėl kai kurių klaidų,
  • pridėti / patobulintų kelios taisyklės,
  • Nauja taisyklė, kad patikrina, ar šiokiadienis rungtynes ​​datą, pvz aptinka "Vendredi 28/08/2014", nes ši data yra ne penktadienį.
  • vokiečių
  • Fiksuotas retas NullPointerException ir ArrayIndexOutOfBoundsException
  • Fiksuoti keletas klaidingų pavojaus;
  • pridėta ir patobulintos taisyklės,
  • Nauja taisyklė, kad tikrina sakinių be veiksmažodis (išjungtas pagal nutylėjimą dėl klaidingų aliarmų rizika);
  • Nauja taisyklė, kad patikrina, ar šiokiadienis rungtynes ​​datą, pvz aptinka "Antradienis, 2014/09/29", nes ši data nėra antradienį.
  • Performance patobulinimų rašybos tikrinimas pasiūlymus;
  • persų: "
  • pridūrė pradinį paramą Persian (farsi)
  • lenkų: "
  • pridėta ir pagerino tam tikrų taisyklių,
  • nauja taisyklė, kad patikrina, ar šiokiadienis rungtynes ​​datą;
  • portugalų kalba: "
  • pridėti / patobulintų kelios taisyklės,
  • pridėta daug dešimtys kombinuotųjų tariant,
  • rusų: "
  • pridėjo naujas taisykles,
  • nustatyti SourceForge Idėjos # 38 (patikrinti įvairių kabučių),
  • pridėta keletas klaidingų draugas taisykles (rusų / anglų kalbomis);
  • nauja taisyklė, kad patikrina, ar šiokiadienis rungtynes ​​datą, pvz Aptinka "ÐонеÐ'еÐ"NŒÐ½Ð¸Ðº, 30 N. ?? & ETH; & Micro; & ETH; & frac12 N & sbquo N ?? & ETH; & plusmn N & euras N ?? 2014 & ETH; & sup3 ;. ", nes ši data yra ne pirmadienis,
  • .
  • išplėtė rusų junginys taisyklė su naujais žodžiais iš postag žodyną;
  • ispanų kalba: "
  • pridėjo naują POS kategorijos Z (už speltos skaičių, pvz 'Uno' 'DOS ", ...),
  • spelta numeriai dabar galima aptikti ir sugebėjo tiek nuorodiniame ir taisykles.
  • Fiksuotas neteisingi Lema POS žodyną.
  • Pridėta Hibridinis chunker-disambiguator.
  • tamilų: "
  • Pridėta pradinį paramą tamilų. Jei už tamilų šrifto nėra tinkamai rodomi jūsų kompiuterio ir jūs naudojate Windows, jums gali tekti taikyti darbas aplink aprašyta čia: https://bugs.openjdk.java.net/browse/JDK-8008572
  • ukrainiečių: "
  • didelis atnaujinimas POS žodyną (pataisymai ir naujų žodžių);
  • Kai kurios gamintojų organizacijos žyma pervadintas nuoseklumo; Naujų žymės santrumpų ir retų žodžių
  • daug naujų taisyklės ir nustatomos esamų taisyklių,
  • nauja taisyklė, kad patikrina, ar šiokiadienis rungtynes ​​datą, pvz aptinka "& ETH; & ETH; & frac34; & ETH; & frac12; & ETH; & mikro; & ETH;" N- & ETH; "& ETH; & frac34; & ETH; & ordm ;, 7 & ETH; & punktas; & ETH; & frac34; & ETH; & sup2; 2014 ", nes ši data yra ne pirmadienis,
  • raktas normalizavimas veiklos tobulinimo;
  • LibreOffice integracija
  • Negalima susipainioti išnašose į LibreOffice 4.3 ir vėliau (dabar suteikia mums išnaša pozicijas, kaip meta duomenų, kad galėtume juos ignoruoti).
  • API
  • Pagrindinės veiklos patobulinimai, dėl kelių siūlų naudojimo atveju, jei JLanguageTool gauna sukurtą vienam pokalbio, bet kalba objektą (pavyzdžiui, "vokiečių") bus sukurta tik vieną kartą. Pridėtinės kurti JLanguageTool dabar turėtų būti daug mažesnis.
  • Išimtoje keleto klasių ir metodų, kurie buvo pasenusios, nes versija 2.6
  • Pašalinta DutchSpellerRule - naudoti MorfologikDutchSpellerRule vietoj "
  • Language.getRelevantRules () parašas pasikeitė,
  • JLanguageTool ir MultiThreadedJLanguageTool konstruktoriai nedeklaruoja, kad mesti IOException nebėra,
  • WhitespaceRule buvo pervadinta į MultipleWhitespaceRule (WhitespaceRule vis dar egzistuoja, bet nepatvirtinta);
  • Nepatvirtintas keletas būdų, kurių matomumas bus sumažintas (pvz visuomenei apsaugoti);
  • MorfologikSpellerRule.getRuleMatch (Styginių, INT) buvo pervadintas į MorfologikSpellerRule.getRuleMatches (string, int);
  • RuleMatch konstruktorius dabar meta išimtį, jei toPosition yra ne didesnis nei fromPosition
  • pristatė naują abstrakti klasė TextLevelRule, kuri tęsiasi taisyklė ir kad gali būti naudojamas taisykles, kurios apima daugiau nei vieną sakiniai.
  • Komandinė eilutė: "
  • Įjungus ir išjungus specifines taisykles tuo pačiu metu, dabar yra leidžiamas. Norint patikrinti tik tam tikrų taisyklių (išjungdami visus poilsio), kuris anksčiau buvo padaryta su "enable LIST_OF_RULES", dabar naudoja "--enabledonly enable LIST_OF_RULES" (arba "-eo -e LIST_OF_RULES").
  • Įterptosios serveris:
  • Du nauji variantai gali būti nustatytas savybes byla padaryti LanguageTool grįžti tą patį XML formatą, kaip po nustatyto termino (ATD). Tokiu būdu jis gali būti naudojamas kaip lašas pakaitalas ATD: * režimas - "LanguageTool" arba "AfterTheDeadline '* afterTheDeadlineLanguage - kodas numatytąją kalbą, jei režimas yra nustatytas į" AfterTheDeadline' Pastaba: '' AfterTheDeadline režimas turėtų būti laikomas eksperimentinis dabar.
  • nauja galimybė "maxCheckThreads" leidžia nustatyti maksimalų skaičių siūlų darbo dėl prašymų lygiagrečiai. Numatytoji reikšmė yra 10, kaip ji naudojama būti.
  • vidinės: "
  • Nauja abstrakti taisyklė AbstractDateCheckFilter, kuri leidžia patikrinti, ar savaitės dieną ir datą rungtynes. Pavyzdžiui, "antradienis, rugsėjis 29, 2014" galima aptikti, kaip 29 Rgs 2014 yra ne iš tikrųjų antradienį. Tai naudoja naują eksperimentinį RuleFilter sąsają, kuri gali būti vadinamas iš XML su naujuoju "filtro" elementas. "Filtras" užima šias savybes: "klasė": visiškai kvalifikacijos pavadinimą Java klasės įgyvendinančio RuleFilter, pvz "org.languagetool.rules.de.DateCheckFilter" "args": kaip string "metus: 1 mėnuo: 2 diena: 3 šiokiadieniais: 4", ty erdvės atskirtos Sąrašas raktų / verčių porų, kur x gauna pasiryžusios modelis yra raktas vertė (kaip "pranešimas" elementas);
  • junginys taisyklė dabar ignoruoja žetonų, kurie buvo imunizuoti į disambiguation.xml
  • "filtras" veiksmai disambiguator dabar taikoma tik POS žymeles, kurios atitinka POS žymą pateikta. Jei jie nesutampa, taisyklė nėra taikoma.
  • Jei išplėsti XML taisykles, kaip aprašyta http://wiki.languagetool.org/tips-and-tricks#toc2, išorės valstybę ir Daugiaprasmių failai dabar gali būti talpinami apsaugotas slaptažodžiu serverio nurodydami http: kaip tai URL // vartotojas: password@example.org/path/user-rules.xml
  • brūkšnys ("& euro;") dabar tokenizing simbolių visomis kalbomis;
  • Nauja funkcija:
  • Naudoti kalbos modelių,
  • LanguageTool dabar gali pasinaudoti ngram duomenis. ngram duomenys yra informacija apie tai, kaip dažnai pasitaiko frazės kalba. Šiuo metu šis naudoja frazių ilgis 3.
  • Duomenų naudoja anglų taisyklė rasti Homophone klaidų, pavyzdžiui, maišyti šiurkščiavilnių / kurso ar nuojauta / blyksnius. LanguageTool turėjo keletą šios rūšies prieš taisykles, bet nauja taisyklė dabar palaiko apie 900 tokių žodžių porų / rinkinių.
  • Duomenys reikalingi tai didžiulis (7GB anglų) ir todėl nėra jo dalis ar LanguageTool.
  • Duomenys (tik anglų kalba dabar) ir yra prieinama daugiau dokumentacija http://wiki.languagetool.org/finding-errors-using-big-data
  • Naudodami ngrams daro LanguageTool šiek tiek lėčiau, kai duomenys yra saugomi SSD.
  • Jei nėra saugomi kaip VSD, spektaklis gali drastiškai sumažėti.
  • Naudokite naują --languagemodel variantą su komandinės eilutės klientui aktyvuoti taisyklę, kuri naudoja duomenis. Ši galimybė dar nėra už atskiras GUI.

Kas naujo versijos 2.4.1:

  • Atnaujinta Morfologik bibliotekų 1.8.3 Fix Žemas pasiūlymus rašybos tikrintuvą, kuris nukentėjo mažiausiai lt;

Kas naujo versijos 2.4:

  • Bretonų: "
  • SRX sakinys tokenization
  • pridūrė / pagerėjo keletą taisyklių,
  • fiksuoti kai klaidingi pavojaus signalai,
  • fiksuotas neteisingi siūlymai dėka pridėtinės bandymus pataisymų;
  • katalonų: "
  • pridėti / patobulintų kelios taisyklės,
  • fiksuoti klaidingi pavojaus signalai,
  • pagaminti papildymai ir pataisymai į Tagger žodyną;
  • pašalinti keletą žodžių sintetinant žodyną (žr filterarchaic.txt)
  • pridūrė dažnio duomenis Tagger žodyną; dažnis Žodyno ateina iš Gaia projekto, su Apache licencijos versijos 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
  • anglų
  • pridūrė / pagerėjo keletą taisyklių,
  • fiksuoti kai klaidingi pavojaus signalai,
  • prancūzų: "
  • pridėti / patobulintų kelios taisyklės,
  • fiksuoti kai klaidingi pavojaus signalai,
  • vokiečių
  • pridėti / patobulintų kelios taisyklės,
  • pridėjo sintezatorių susitarimas taisyklė dabar gali teikti pasiūlymus dėl kai kurių klaidų (ne visi pasiūlymai yra teisingi, nors),
  • lenkų: "
  • pridūrė / patobulintus keletas taisyklių, ypač brūkšneliu ir brūkšnys naudojimas
  • pridūrė dažnio informaciją rašybos tikrinimo žodyną; dažnis Žodyno ateina iš Gaia projekto, su Apache licencijos versijos 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries).
  • fiksuoti kai klaidingi pavojaus signalai,
  • portugalų kalba: "
  • pridūrė / patobulintus keletas taisyklių (dabar apima lyčių taisykles "A" / "O")
  • dabar jis turi 3400+ sudėtinius žodžius "
  • JAR failas buvo pakeistas į languagetool.jar, iš anksčiau languagetoolstandalone.jar kad būtų išvengta painiavos apie tai, kas atskira "šiame kontekste reiškia (GitHub klausimas # 29);
  • už kalbas su daugeliu taisyklių (pavyzdžiui, prancūzų arba vokiečių) našumą ilgų tekstų buvo padidinta maždaug 2030%,
  • fix threadsafety (gali sukelti pakabinti MultiWordChunker)
  • Ištaisyta klaida, kai riekė anotacijos nebuvo išbandytas grupių;
  • Nustatyti: 1 ir nebuvo įvertintas ...
  • fiksuotas į susivienijimo mechanizmą, kad išmestų kai atitikimo interpretacijų anksčiau klaidą "
  • papildoma parama riekė anotacijos į disambiguator ir fiksuoto vieną klaidą po filtravimo žetonų su riekė anotacijos;
  • Atnaujinta Morfologik bibliotekos 1.8.2 (pataisymai, griežtesni įvesties normalumas patikrinti, pridėti dažnio duomenis žodynų),
  • pridūrė, įskaitant dažnio duomenis taggging ar rašybos žodynų parinktį. Tikimasi formatas dažnių wordlists yra į Gaia projekto vienas, su Apache licencijos versijos 2.0 (https://github.com/mozillab2g/gaia/tree/master/keyboard/dictionaries)
  • naujos komandinės eilutės įrankiai eksportuoti ir kurti dvejetainius žodynai:
  • org.languagetool.dev.DictionaryExporter
  • org.languagetool.dev.POSDictionaryBuilder
  • LibreOffice / OpenOffice "integracija:"
  • pridėjo apeiti dėl netinkamo sakinio aptikimo atveju, išnaša atsirado po sakinio taškas (Sourceforge klaidą # 191)
  • atskira GUI: "
  • dialogo atidarė "Plačiau ..." elemento kontekstinį meniu klaidos dabar taip pat parašo teisingų ir neteisingų pavyzdys sakiniai,
  • API
  • SentenceTokenizer dabar sąsaja, įgyvendinimas buvo perkeltas į RegexSentenceTokenizer, bet tai yra pasmerkta ir SRXSentenceTokenizer turėtų būti naudojama vietoj "
  • Kai iš org.languagetool.tools.StringTools metodai buvo perkelta į org.languagetool.gui.Tools klasės į languagetoolguicommons projekto
  • LanguageToolListener.languageToolEventOccured () buvo pervadintas į LanguageToolListener.languageToolEventOccurred ();
  • org.languagetool.tools.SymbolLocator nėra viešas nebėra (neturėtų paveikti niekam),
  • ištrintas DanishSentenceTokenizer kuri buvo pasmerkta už trejus metus;
  • Rule.getCorrectExamples () ir Rule.getIncorrectExamples () negrįžta niekinis nebėra, bet tuščia sąrašas, jeigu nėra pavyzdžių. Todėl setCorrectExamples () ir () setIncorrectExamples nesutinkame niekinis nebėra.
  • Rule.getId () gali grįžti bet kurią eilutę dabar ne tik ASCIIonly sekas (iš tikrųjų tai buvo daroma anksčiau, nes ASCIIonly apribojimas nebuvo vykdomas ir tik minėta Javadoc)
  • languagetoolwikipedia: komandinės eilutės parinktis tikrinimo Vikipedijos sąvartynas buvo supaprastinta. Komanda dabar gali būti vadinamas kaip šis: Java stiklainis languagetoolwikipedia.jar checkdata L lt f enwiki20130621pagesarticles.xml Skambinkite tik "Java jar languagetoolwikipedia.jar checkdata" gauti naudojimas pranešimą. Daugiau nei vienas failas gali būti nurodyta su F variantą. Be to, kad "Wikipedia" XML sąvartynus, CSV failus iš Tatoeba (http://tatoeba.org) dabar taip pat pritarė, jie pirmiausia reikia būti filtruojamas, kad yra tik atitinkamą kalbą.

Kas naujo versijos 2.3:

  • Bretonų: "
  • pridūrė / pagerėjo keletą taisyklių,
  • fiksuoti klaidingi pavojaus signalai,
  • atnaujinama POS žodynas nuo apertium (SVN r47282)
  • katalonų: "
  • papildoma parama kalbos kodas CA-ES-Valensija (Katalonų Valensijos), turi būti naudojamas LibreOffice 4.2.0
  • pridėjo paprastą pakeisti taisyklę su šimtais pakeitimo pasiūlymus,
  • pridėti / patobulintų kelios taisyklės,
  • fiksuoti klaidingi pavojaus signalai,
  • kinų: "
  • pridėjo apeiti už StringIndexOutOfBoundsException (http://sourceforge.net/p/languagetool/bugs/186/)
  • anglų
  • pridūrė atsargines modelius rašybos tikrintuvą pateikti pasiūlymus geriau (dabar siūlo "mokė" už "mokė");
  • pridūrė / pagerėjo keletą taisyklių,
  • prancūzų: "
  • pridūrė / pagerėjo keletą taisyklių,
  • fiksuoti klaidingi pavojaus signalai,
  • atnaujinama POS žyma žodyną ir Hunspell žodyną į Dicollecte-4.12
  • vokiečių
  • pridėti / patobulintų kelios taisyklės,
  • portugalų kalba: "
  • pridūrė / pagerėjo keletą taisyklių,
  • dabar jis turi 3300+ sudėtinius žodžius "
  • ukrainiečių: "
  • pridėti / patobulintų kelios taisyklės,
  • kodo buvo perkeltas į GitHub: https://github.com/languagetool-org/languagetool
  • LanguageTool reikalauja "Java 7 dabar,
  • LanguageTool pasinaudoja keliais siūlais dabar teksto tikrinimo modernios įrangos, pagerinti efektyvumą (tai paveikia atskirą versiją, komandinės eilutės versiją ir LibreOffice / OpenOffice pratęsimo);
  • taisyklė sintaksė:
  • preliminarus paramą naujiems min / max požymius, kurie leidžia suderinti elementas, kuris atsiranda duotą skaičių kartų. Pavyzdžiui: foo sutaps nieko arba "foo", ty "Foo" yra neprivalomas rūšys sutaps "foo" arba "Foo foo foo" bus suderinti nieko ", foo" arba "foo foo" Naudoti max = "- 1" leisti neribotą įvykių. Dėl min, tik 0 arba 1 palaikomas (1 numatytasis).
  • parama AR teiginiais. Pavyzdžiui: viduje ir run-time, taisyklė, kuriuose yra ar teiginiais virsta į keletą taisyklių ar be teiginiais,
  • .
  • anglų dabar turi chunker aptikti, be kita ko, vienaskaitos ir daugiskaitos daiktavardžio gabaliukus. Tai registruojamas http://wiki.languagetool.org/using-chunks
  • atskira versija: "
  • atskira versija dabar pabrėžia klaidų su raudona (rašybos klaidų) arba mėlyna (kitų klaidų) linija (Panagiotis Minos)
  • Prisiminti Kalbos pasirinkimas kitą Pirmas
  • Geresnis langą ir dialogo vieta iš kelių monitorių setup
  • integruotas serveris: naudoja numatytąjį uostas (8081) vėl, jei prasidėjo be argumentų,
  • atnaujinama morfologik-kylančių biblioteką versija 1.7.1, kad geresnių pasiūlymų, įskaitant tinkamai naudotis diakritiniais ženklais ir atsarginių modelių (ekvivalentai žemėlapį RESPUBLIKA funkcijų hunspell žodynų),
  • "OpenOffice / LibreOffice integracija
  • Nustatyti: "Apie" dialogo nedirbo Apache OpenOffice 4.0 "
  • Nustatyti: šalies specialios taisyklės (pavyzdžiui, britų anglų) nedirbo;
  • API
  • Klasėje kalba, getCountryVariants () buvo pervadintas į getCountries () ir naujas metodas getVariant buvo pridėta.
  • Kai kurie metodai buvo pasmerkta,
  • Kai kurie metodai buvo perkelti iš priemonės klasė (languagetool-core) į naują CommandLineTools klasės (languagetool-komandų);










Kas naujo 2.2 versija:



Kas naujo 2.1 versija:





Kas naujo 2.0 versija:







Reikalavimai :

  • Java 2 Standard Edition Runtime Environment "

Kita programinė įranga kūrėjas Daniel Naber

LanguageTool
LanguageTool

21 Jan 15

Jwordsplitter
Jwordsplitter

21 Jan 15

Komentarai LanguageTool

Komentarai nerastas
Pridėti komentarą
Pasukite ant paveikslėlio!