Apache Tika

Programinė įranga Screenshot:
Apache Tika
Programinė detalės:
Versija: 1.9 Atnaujintas
Įkėlimo datą: 20 Jul 15
Licencija: Nemokamai
Populiarumas: 89

Rating: 5.0/5 (Total Votes: 1)

Apache Tika , buvo sukurtas kaip žemo lygio priemonių rinkinį ieškoti turinį viduje kitų failų.
Tika nedaro daug ant savo būdama paprasta biblioteka, tačiau ji gali būti integruota į daugiau galingų įrankių, pavyzdžiui, paieškos sistemų, skaitmeninių turto valdymo sistemų ar nusiteikusios pateikti visiškai funkcinis-failų paieškos sistema.
Biblioteka gali naudotis tiesiog failo antraštę greitai bendrą informacijos failą, arba jis gali eiti tikrai giliai ir ieškoti dar Failo kūno įvairių tipų duomenimis, teksto ar dvejetainiu formatu.
Platus failų tipų yra palaikomi ir Tika taip pat gali būti naudojamas kartu su kitais programavimo kalbomis dėka trečiosios šalies apkaustų ir įpakavimo serijos.

Kas naujo , šioje laidoje :

  • Ši laida apima pataisymai ir naujų funkcijų, įskaitant naują Tesseract OCR parser; naujas gdal parser; daugiau Palaikomi formatai, ir apskritai pagerėjo Tika stabilumą.

Kas naujo 1.8 variantas:

  • Ši laida apima pataisymai ir naujų funkcijų, įskaitant naują Tesseract OCR parser; naujas gdal parser; daugiau Palaikomi formatai, ir apskritai pagerėjo Tika stabilumą.

Kas naujo versijos 1.7:

  • Ši laida apima pataisymai ir naujų funkcijų, įskaitant naują Tesseract OCR parser; naujas gdal parser; daugiau Palaikomi formatai, ir apskritai pagerėjo Tika stabilumą.

Kas naujo versijos 1.6:

  • Ši laida apima pataisymai ir naujų funkcijų, įskaitant naują vertimo API daugiau palaikomų formatų ir bendri patobulinimai Tika stabilumą.

Kas naujo 1.5 versijos.

  • Ištaisyta klaida krova įterptųjų failų tvarkymui PDF
  • patalpintas SourceCodeParser remti java, Groovy, C ++ failus.
  • Atnaujinta Tika Server remti daugiadalis / form-duomenų užtaisus.
  • Atnaujinta Tika Server CXF 2.7.8.
  • Atnaujinta Tika Server priimti prašymus per pakaitos adresus.
  • Pridėta galimybė naudoti alternatyvų NonSequentialPDFParser.
  • Turinys iš PDF AcroForms dabar išgauti.
  • Fiksuoti negaliojančių žvaigždutes iš pagrindinio skaidrės ppt.
  • Pridėta testiniai atvejai patvirtinti tvarkymą automatiniu dienos PPT ir PPTX formatu.

Kas naujo versija 1.4:

  • Pašalinta testas HTML byla su prastai pasirinktos GPL tekstą tai.
  • patobulinimai tika serverį, kad jis galėtų gaminti text / html text / xml turinys.
  • patobulinimai buvo padaryti kompresorius analizatorius tvarkyti g'zipped failus, kuriems reikia decompressConcatenated variantą true.
  • kreipėsi Spaudos klaidą, kuri buvo apsaugantis nuo aptikimo Awk failus.

Kas naujo 1.2 versijoje:

  • Apache Tika 1.2 yra daug patobulinimų ir klaidų skaičių.

Kas naujo versija 1.0:

  • Apache Tika 1.0 yra daug patobulinimų ir klaidų skaičių.

Kas naujo versijos 0.9.

  • Ši laida apima keletą svarbių klaidų ištaisymų ir naujų funkcijų

Kas naujo versijos 0.8:

  • Kalbos nustatymas dabar dinamiškai konfigūruojama, valdomos naudojant konfigūracijos failo pakraunami iš classpath.
  • Tika dabar palaiko sintaksės kanalai vyniojimo į esminius Romos biblioteką.
  • greitai paleidimo vadovas Tika apdorojant buvo prisidėjo.
  • Prašymas vandentiekio per XHTML atributų metodas buvo pridėta.
  • Žiniasklaida tipo hierarchija informacija dabar atsižvelgti renkantis geriausią analizatorius už tam tikrą įvesties dokumentą.
  • Parama analizuojant bendrus mokslinius duomenų formatus, įskaitant netcdf ir HDF4 / 5 buvo pridėta.
  • Unit testai Windows buvo nustatytos, todėl TestParsers užbaigti.

Kas naujo versijos 0.7:

  • MP3 failą apdorojant buvo patobulintas, įskaitant Lamanšo ir samplerate gavybos ir ID3v2 parama. Be to, garso apdorojant MIME aptikimo taip pat buvo patobulintas MIDI formatu.
  • Tika nebėra remiasi X11 savo RTF apdorojant funkcionalumą.
  • Sriegimo saugus klaidą į AutoDetectParser buvo atrasta ir spręsti.
  • Atnaujinti PDFBox 1.0.0. Naujas PDFBox versija pagerina PDF analizuojant rezultatus ir nustato teksto gavybos klausimų.

Reikalavimai :

  • Java 6 arba didesnis;

Panaši programinė įranga

L20n
L20n

1 Oct 15

PHPCPD
PHPCPD

12 Apr 15

StringFormatter
StringFormatter

6 Mar 16

Plates
Plates

10 Dec 15

Kita programinė įranga kūrėjas Apache Software Foundation

Apache Tajo
Apache Tajo

10 Feb 16

Apache Neethi
Apache Neethi

13 Apr 15

Apache Any23
Apache Any23

13 Apr 15

Komentarai Apache Tika

Komentarai nerastas
Pridėti komentarą
Pasukite ant paveikslėlio!
Paieška pagal kategoriją