Gražios sriuba projektas Python HTML / XML sintaksės analizatorius, skirtas greitai apsisukimo projektus, pavyzdžiui, ekrano grandymo. Trys funkcijos, kad ji galinga:
Gražus sriuba nebus droselis, jei mano, kad tai blogas žymėjimo. Tai duoda byloje vykdymo medį, todėl maždaug tiek pat prasminga, kaip originalaus dokumento. Tai paprastai yra pakankamai gera, kad surinkti duomenis, kuriuos reikia ir bėgti.
Gražus sriuba suteikia keletą paprastų metodų ir Pythonic idiomas naršyti, ieškoti ir pakeisti byloje vykdymo medį: už Sekcijiniai dokumentą ir gavybos, ko jums reikia rinkinį. Jūs neturite sukurti pasirinktinį analizatorius už kiekvieną paraišką.
Gražus sriuba automatiškai konvertuoja gaunamus dokumentus Unicode ir siunčiamų dokumentų į UTF-8. Jūs neturite galvoti apie koduotes, jei dokumente nėra nurodyti koduotę ir gražus sriuba negali aptiktų vieną. Tada jums tiesiog turi nurodyti originalų kodavimą.
Gražus sriuba suvokia nieko jūs suteikiate jį ir daro medis Sankryþos stuff jums. Galite pasakyti, kad "Ieškoti visas nuorodas", arba "Ieškoti visų klasės externalLink nuorodos" arba "Ieškoti visas nuorodas, kurių URL rungtynės" foo.com "arba" Ieškoti lentelės antraštė, kad atšoko paryškintai, o po to man, kad tekstas ".
Vertingų duomenų, kad kažkada buvo užrakinta prastai suprojektuoti svetaines dabar po ranka. . Projektai, kurie ėmėsi valandas imtis tik kelias minutes su gražia sriuba
Reikalavimai :
- Python
Komentarai nerastas