"Remiantis Nokogiri HTML analizatorius Ruby, išvalyti yra baltasis pagrįsta sistema pašalinti HTML iš teksto bloką.
"Baltasis sąrašas" technika leis kūrėjams setup HTML žymes, kurios išvalyti bus naudoti kaip ką ji mano "priimtina" HTML nuoroda sąrašą.
Kiekvienas kitas HTML tegus nėra sąraše bus visiškai pašalintas iš analizuojama tekste.
Išvalyti gali dirbti su standartų reikalavimų arba neteisingo HTML.
Biblioteka gali aptikti ir filtruoti HTML žymes, požymiai ir protokolus.
Išvalyti tekstas visada bus išvedamas kaip galiojantis HTML arba XHTML.
Norėdami padėti kūrėjams pradėti savo projektus, išvalyti ateina su keletą gatavų konfigūracijų įtraukti. Patikrinkite README failą Daugiau informacijos
Kas naujo , šioje laidoje.
- papildė dvi naujos CSS konfigūracijos parametrus,: at_rules_with_properties ir:. at_rules_with_styles
- Pridėta pilna parama atitinka CSS @ Page taisyklių atsipalaidavęs config, įskaitant paramą visiems puslapio marža dėžutė taisykles.
- papildomas šia CSS AT-taisykles sušvelninami config. "
- Pridėta visa krūva CSS savybių atsipalaidavę config. Rodyti visą sąrašą čia.
- Mažos spartos patobulinimai.
- Patobulinta kvailo į 1.0.2 pasiimti nustatyti, kad paveikė CSS @ Page taisyklių apdorojimą.
Kas naujo versijos 3.1.2:
- Fiksuotas: #document ir #fragment nepavyko sušaldyti stygos, ir gali netyčia pakeisti neužšalę eilutes, jei jie naudojami kodavimo ne UTF-8 arba jei juose yra simbolių, neleidžiama HTML.
Kas naujo 3.0.2 versija:
- Atnaujinta Nokogumbo į 1.1.12, nes 1.1. 11 tyliai sugrįžo į pokyčius mes stengiamės pasiimti paskutinio spaudai.
Kas naujo 3.0.0 versijos:
- Pridėta Išplėstinė CSS sanitarijos palaikymas naudojant kvailo, kuris yra visiškai atitinka 3 CSS Sintaksė modulis lygis apdorojant spec. Į baltąjį sąrašą & # x3c turinį; stiliaus & # x3e; elementai ir stilius atributų HTML bus dezinfekuotas, kaip CSS, arba galite naudoti dezinfekuoti :: CSS klasę rankiniu būdu išvalyti CSS stilių ar savybes.
- Pridėta: allow_doctype nustatymą. Kai tiesa, gerai suformuotas DOCTYPE apibrėžimai bus leista dokumentuose. Kai klaidinga (pagal nutylėjimą), DOCTYPE apibrėžimai bus visiškai pašalintas iš dokumentų. DOCTYPE apibrėžimai niekada leidžiama fragmentų, nepaisant šio nustatymo.
- Pridėta šiuos elementus į atsipalaidavęs config, be to, įvairūs atributai. Straipsnyje, be, įstaiga, duomenys, skyrius, poraštės, galvos, antraštė, HTML, pagrindinis, NAV skyrių, trukmė, būdas, pavadinimas
- : whitespace_elements config dabar hash ir leidžia jums nurodyti tekstą, kuris turi būti įterpta prieš ir po šių elementų, kai jie pašalinami. Seno tipo masyvas pagrindu konfigūracijos vertė vis dar yra palaikomas atgalinio suderinamumo.
- Netinkamos Unicode simbolių, dabar pašalintas iš HTML prieš tai apdoroti.
- Fiksuotas: "
- Ne reikšminį žodį skliausteliai įvesties kaip & quot; 1 & # x3e; 2 ir 2 & # x3c; 1 "; dabar apdoroti ir pabėgo teisingai pagal HTML5 spec, tampa & quot; 1 & gt; 2 ir 2 & lt; 1 & quot;.
- Broliai pridėta po dabartinio mazgo Sankryþos metu dabar taip pat vedama. Į ankstesnes versijas jie buvo tiesiog praleisti.
- Nokogiri buvo smacked ir nurodė sustabdyti pridedant naujas eilutes po tam tikrų elementų, nes jei žmonės norėjo naujas eilutes ten būčiau juos ten, Dammit.
Kas naujo versijos 2.0.6:
- Versija 2.0.5 netyčia įtraukti tam tikrą darbą, į -progress pokyčiai, kurie neturėtų padarė savo kelią į pagrindinį filialą.
Kas naujo versijos 1.2.1:
- Pridėta: remove_contents config nustatymą. Jei true, išvalyti bus pašalinti visų ne baltąjį sąrašą elementų turinį be pačių elementų. Jei nustatyta prie elemento vardų masyvas, išvalyti bus pašalinti tik tuos aspektus, (kai filtruojamas) turinį, ir palikti kitų filtruojamas elementų turinį. [Ačiū Rafael Souza už Array galimybe]
- Pridėta žinutę: output_encoding config nustatymas leisti rašmenų kodavimą HTML produkcijos turi būti nurodyta. Numatytoji reikšmė yra "UTF-8".
- aplinka maišos perėjo į transformatorių dabar apima: node_name elementą, kuriame yra mažoji vardą dabartinės HTML mazgas (pvz & quot; div & quot;); .
- Grįžtant nieko, išskyrus maišos arba nulinis nuo transformatoriaus dabar pakels prasmingą išvalyti :: Klaidos išimtis, o ne netyčia NameError.
Reikalavimai
- Rubinas 1.9.2 arba naujesnė;
- Nokogiri 1.4.4 arba naujesnė;
Komentarai nerastas