PDFTextStream

Programinė įranga Screenshot:
PDFTextStream
Programinė detalės:
Versija: 2.6.0
Įkėlimo datą: 20 Feb 15
Licencija: Shareware
Kaina: 1900.00 $
Populiarumas: 2

Rating: nan/5 (Total Votes: 0)

PDFTextStream projektas PDF teksto ir metaduomenų išgavimo biblioteka prieinama Java, Python, ir .NET.
Jis palaiko visus PDF dokumento specifikacijos versijas (įskaitant v1.6, naudojami Acrobat 7), ekstrahavimas teksto kodavimas, naudojant dukart baitų simbolių rinkiniai (įskaitant kinų, japonų ir korėjiečių), iššifravimui 40-bit ir 128- bit šifruojami dokumentai ir gavybos visų dokumentų metaduomenų teikiamų PDF dokumentus (įskaitant formų duomenims, žymes ir komentarus).
Lengva integracija su Džakarta Lucene yra įtrauktas

Kas naujo , šioje laidoje:.

  • Ši versija apima pataisymai įvairovė pagamintas užtikrinti PDFTextStream yra pajėgi išgauti tekstą iš PDF dokumentų, kurie yra netinkami į PDF specifikacija.
  • Tai taip pat apima keletą veiklos patobulinimų įvairovė.

Kas naujo versijos 2.3.0:

  • Pridėta žinutę .isStruckThrough () metodą. Com snowtide.pdf.TextUnit, nurodant, ar personažas turi perbraukiant sudarytas per jį.
  • Geresnis PDFTextStream paramą įterptųjų simbolių rodymo.

  • tarpų tarp žodžių skaičiavimas buvo nustatytas tinkamai apskaityti tarpų, kad būtų aiškiai užkoduota šaltinis PDF dokumentus.
  • Geresnis PDFTextStream tvarkymas kompozicinių turinio koduotes, kurie anksčiau galėjo nesugeba todėl kai kuriose PDF turinį svyruoja metu "ignoravo" gavybos metu.
  • Fiksuotas į VisualOutputTarget klaidą kuriame tekstą iš vienos linijos būtų padalinta į keletą eilučių
  • Geresnis lygiuoti tekstą ekstrahuojamas naudojant VisualOutputTarget
  • Geresnė VisualOutputTarget gaminami ekstraktai pašalinti parazitinės papildomą tarpus tarp glaudžiai gretimų žodžių

Kas naujo versijos 2.2.5:

  • Ši laida papildyta paramą gavybos XFA formos duomenis XML.
  • Tai gerokai pagerina teksto ekstrahuojant VisualOutputTarget efektyvumą. Parama PDF dokumentus didesnių nei 2GB.
  • už klaidą, kai iš įterptųjų Type1 šriftų koduotes anksčiau nebuvo tinkamai taikomos tam tikroms aplinkybėms nustatyti.
  • už problema, kai naujesnis kiekis atnaujintas PDF dokumentus kartais buvo ignoruojami nustatyti.
  • fix problema, kai PDFDocEncoding koduotas žymes ir metaduomenys nebuvo tinkamai iššifruoti.
  • .getDestinationName () metodas com.snowtide.pdf.Bookmark.

Reikalavimai :

  • Apache Lucene

Komentarai PDFTextStream

Komentarai nerastas
Pridėti komentarą
Pasukite ant paveikslėlio!