lxml

Programinė įranga Screenshot:
lxml
Programinė detalės:
Versija: 3.4.1
Įkėlimo datą: 17 Feb 15
Kūrėjas: Martijn Faassen
Licencija: Nemokamai
Populiarumas: 72

Rating: 5.0/5 (Total Votes: 1)

lxml yra sudėtingas, galinga, nemokama ir unikalus Python modulis, kuris jungiasi su libxml2 ir libxslt bibliotekas, todėl Python kūrėjams dirbti tiek XML ir HTML failus viešai jų Python code.An XML apdorojimo librarylxml yra XML (Extensible Markup Language ) tvarkymo biblioteka parašyta Python programavimo kalba, specialiai sukurta siekiant laikytis ElementTree API specifikacijos, kiek tai įmanoma.
Jis gali pratęsti ElementTree API atskleisti konkrečią funkcionalumą libxslt ir libxml2 bibliotekas, pavyzdžiui, Relax NG (naujos kartos), XPath, XML schema, c14n, XSLT (Extensible stilių kalba), etc.Use lxml skambinti Python kodą iš XSLT stylesheetsDevelopers galės naudotis lxml programą skambinti Python kodą iš XSLT stilių ir XPath išraiškos per pratęsimo funkcijas. Platus vadovėliai yra prieinami projekto ir tiksliai apskaičiuoti puslapyje (žr tuo Straipsnio pabaigoje nuorodą).
Programinė įranga yra atviro kodo dizainas ir sujungia funkcijų išsamumą ir greitį minėtų bibliotekų su Python aptarsime paprastumo; ai API (Application Programming Interface) .Getting prasidėjo lxmlIt yra gana lengva įdiegti lxml ant GNU / Linux distributyvo naudojant pirminių bylų archyvą platinamas Softoware ir projekto aptarsime s oficiali svetainė. Tiesiog atsisiųskite šaltinio paketą, išsaugokite jį savo namų katalogą, išpakuokite jį atidarykite terminalo programą ir pereiti į išgautų archyvas failų vietą (pavyzdžiui, CD /home/softoware/lxml-3.4.1).
Paleiskite & lsquo; padaryti & rsquo; komandą sudaryti programą, kuri turėtų imtis apie 1-2 minutes ant šiuolaikinio kompiuterio. Po sėkmingo rengimo, paleisti & lsquo; make install & rsquo; komanda kaip root arba & lsquo; sudo make install & rsquo; komanda kaip privilegijuotas naudotojas įdiegti lxml sistemos wide.Supports GNU / Linux "ir" Microsoft Windows "operacinę sistemosŠios programinę įrangą oficialiai remiamus GNU / Linux ir Microsoft Windows operacinių sistemų. Jis buvo sėkmingai išbandyta 32-bit ir 64-bit kompiuterius

Kas naujo , šioje laidoje:.

  • Savybės pridūrė: "
  • Nauja htmlfile HTML generatorius lydėti laipsniškas xmlfile Publikacija API. Patch Burak Arslan.
  • Klaidos nustatomos:
  • lxml.sax.ElementTreeContentHandler nebuvo inicijuoti savo superklasę.

Kas naujo versijos 3.3.1:

  • Klaidos nustatomos:
  • LP # 1014290: HTML dokumentai apdoroti su parser.feed () nepavyko rasti elementus metu tegus iteracijos
  • .
  • LP # 1273709: pastatas PyPy nepavyko dėl trūkstamų paramą PyUnicode_Compare () ir PyByteArray _ * () ir PyPy anketa C-API
  • .
  • LP # 1274413: Duomenų surinkimo MSVC nepavyko dėl trūkstamų & quot; stdint.h & quot; standartinis failo antraštės.
  • LP # 1274118: iterparse () nepavyko apdoroti BOM priešdėliu failus
  • .

Kas naujo 3.0 versijos Alfa 2:

  • Įranga pridūrė: "
  • .iter () metodas elementų dabar priima argumentus tegus kaip & quot; {*} vardas & quot; ieškoti elementų su tam tikra vietos pavadinimą bet vardų. Šiuo Be to, visi pakaitos simbolius deriniai dabar dirba kaip tikėtasi: & quot; {ns} vardas & quot ;, & quot; {} vardas & quot ;, & quot; {*} vardas & quot ;, & quot; {ns} * & quot ;, & quot; {} * & quot; ir & quot; {*} * & quot ;. Atkreipkite dėmesį, kad & quot; vardas & quot; yra lygiavertis & quot; {} vardą & quot ;, bet & quot; * & quot; yra & quot; {*} * & quot ;. Toks pat pakeitimas taikoma .getiterator (), .itersiblings () .iterancestors () .iterdescendants () .iterchildren () ir .itertext () metodus; į strip_attributes () strip_elements () ir strip_tags () funkcijos taip pat iterparse () klasėje.
  • C14N leidžia nurodant įskaičiuota priešdėlius būti paaukštintas į aukščiausio lygio per išskirtinį Publikacija.
  • Klaidos nustatomos:
  • Perdavimai ilgas Unicode eilutes į pašarus () analizatoriaus sąsajos nepavyko perskaityti visą eilutę.

Kas naujo versijos 2.3.5:

  • avarijos, kai sujungus teksto mazgus element.remove ( ).
  • Crash sax / tikslinės analizatorius, pranešdami tuščias DOCTYPE.

Kas naujo versijos 2.3.4:

  • avarijos, kai pastato nsmap (Elementas nuosavybės) su tuščias vardų URI.
  • avarijos dėl lenktynių būklės, kai sriegine XSLT apdorojimo metu klaidų (ar vartotojo pranešimai) atsirasti.
  • XSLT stiliaus rinkinys gali ignoruoti kompiliavimo klaidų.

Kas naujo versijos 2.3.2:

  • Įranga pridūrė: "
  • lxml.objectify.deannotate () turi naują Būlio pasirinkimo cleanup_namespaces siekiant pašalinti Uprzedmiotowić vardų deklaracijas (ir paprastai išvalyti vardų deklaracijas) nuėmus tipo komentarus.
  • lxml.objectify įgijo savo SubElement () funkciją kaip etree.SubElement kopiją išvengti kitaip nereikalingas importą lxml.etree ant vartotojo pusės.
  • Klaidos nustatomos:
  • Fiksuotas & quot; palikuonis & quot; Re į cssselect antrą kartą (po pirmojo Fix lxml 2.3.1). Ankstesnis pokyčiai lėmė rimtos veiklos regresijos už XPath pagrįstą vertinimo išversta išraiška. Atkreipkite dėmesį, kad tai pažeidžia kai kurių gautos XPath išraiškos kaip XSLT vietos kelius, kurie anksčiau dirbo 2.3.1 naudojimą.
  • Fiksuotas apdorojant kai į cssselect selektoriai. Tarpai po combinators & quot; & Gt; & quot ;, & quot; + & quot; ir & quot; ~ & quot; dabar teisingai ignoruojami. Anksčiau yra buvo apdoroti kaip palikuonis Combinator. Pavyzdžiui, & quot; div & gt; .foo & quot; buvo apdoroti pats kaip & quot; div & gt; * .foo & quot; vietoj & quot; div & gt; .foo & quot;.

Kas naujo versijos 2.3.1:

  • Įranga pridūrė: "
  • Nauja galimybė kill_tags į lxml.html.clean pašalinti specifinius žodžius ir jų turinį (ty jų visuma pomedžio).
  • pi.get () ir pi.attrib nuo perdirbimo instrukcijas apdoroti pseudo-atributus iš teksto turinio tvarkymo instrukcijas.
  • lxml.get_include () grąžina įtraukti kelius, kurie gali būti naudojami sudarant išorės C kodą prieš lxml.etree sąrašą. Tai konkrečiai reikalaujama statiškai susietą lxml stato, kai kodas turi sudaryti prieš tą patį antraštės failų versijas lxml pats.
  • Resolver.resolve_file () užima papildomą galimybę close_file kad konfigūruoja, jei failas (-kaip) objektas bus uždarytas po svarstymo, ar ne. Pagal nutylėjimą, failas bus uždaryta, nes vartotojas nėra Numatoma išlaikyti nuorodą į jį.
  • Klaidos nustatomos:
  • HTML valymas nebuvo pašalinti "duomenis:". Sąsajas
  • html5lib analizatorius integracija šiuo metu naudoja "oficialų" įgyvendinimą pati html5lib, kuri leidžia dirbti su naujesnėmis išleidžiamus bibliotekoje.
  • Be lxml.sax, endElementNS () gali klaidingai atmesti paprastą žymės pavadinimą, kai atitinkamas pradžia įvykis padarė išvadą, tą patį paprastą žymės pavadinimą būti numatytasis vardų.
  • Kai atidaryti failo, kaip objektas yra perduodamas į parse () arba iterparse (), analizatorius nebebus arti ji po naudojimo. Tai grįžta A lxml 2.3 kaitą, kur visi failai bus uždarytas. Tai vartotojai atsakomybė tinkamai uždaryti failas (-kaip) objektą, taip pat klaidų atvejais.
  • Asercja klaida lxml.html.cleaner dėžę aukščiausio lygio elementus.
  • Be lxml.cssselect, naudoti XPath "// B" (trumpas "A / palikuonis-arba-savęs :: mazgas () / B"), o ne "A / palikuonis :: B" už css palikuonis selektorius ("B"). Tai daro keletą briaunų atvejus turi būti suderinti su selektoriaus elgesį WebKit ir Firefox, ir daro daugiau css išraiškos galiojančius vietos kelius (naudoti XSL: template rungtynių).
  • Be lxml.html, nepasirinktų žymės nebėra rodomi surinktų formos vertybes.
  • Įrašyta / pašalinti vertybes į / iš kelių pasirinkite formos lauko tinkamai parenka juos ir unselects juos.
  • Kiti pakeitimai:
  • Statinis stato galite nurodyti Parsisiųsti katalogą su --download-dir variantą.

Kas naujo versijoje 2.3:

  • Įranga pridūrė: "
  • Ieškodami vaikams, lxml.objectify užima "{} žymą" taip, tuščią vardų, o ne patronuojančiai vardų.
  • Klaidos nustatomos:
  • Kai baigsite skaityti iš failo pavidalo objekto, analizatorius karto ragina savo .close () metodas.
  • Kai baigsite apdorojant, iterparse () iš karto užsidaro įvesties failą.
  • Darbo ir aplink libxml2 klaidą, kad gali palikti HTML analizatorius yra ne funkcinės būklės po Apdorojant severly skaldytų dokumentą (nustatytą libxml2 2.7.8).
  • markė tag HTML valymo kodas yra tiksliai nurodytas pažymimos.
  • Kiti pakeitimai:
  • Kai kurios valdžios funkcijas Cython lygio C-API daugiau intymias grąžinimo tipus.

Kas naujo versiją 2.2.8 / 2.3 Beta 1:

  • Crash naujesnių versijų libxml2 kai bus juda elementus tarp dokumentų, kurie turėjo atributus ant pakeistų XInclude mazgų.
  • XMLID () funkcija trūksta pasirinktinių analizatorius ir base_url parametrus.
  • Ieškant pakaitos žymeles iterparse () buvo suskirstytas į Py3.
  • lxml.html.open_in_browser () neveikia Python 3 dėl os.tempnam naudojimui. Tai dabar užima papildomą "kodavimo" parametrą.

Reikalavimai :

  • Python

Panaši programinė įranga

Atomsphere
Atomsphere

14 Apr 15

postmarkup
postmarkup

14 Apr 15

Kita programinė įranga kūrėjas Martijn Faassen

hurry.resource
hurry.resource

11 May 15

z3c.relationfield
z3c.relationfield

14 Apr 15

Komentarai lxml

Komentarai nerastas
Pridėti komentarą
Pasukite ant paveikslėlio!