ASPseek

Programinė įranga Screenshot:
ASPseek
Programinė detalės:
Versija: 1.2.10
Įkėlimo datą: 3 Jun 15
Kūrėjas: SWsoft
Licencija: Nemokamai
Populiarumas: 4

Rating: nan/5 (Total Votes: 0)

ASPseek yra interneto paieškos variklis programinė įranga, sukurta SWsoft ir licencijuota kaip laisvą programinę įrangą pagal GNU GPL.
ASPseek sudaro indeksavimo roboto, paieškos demonas, ir CGI paieškos frontendu. Tai gali indeksuoti kiek keli milijonai URL ir ieškoti žodžių ir frazių, naudoti pakaitos simbolius ir padaryti Būlio paiešką. Paieškos rezultatai gali apsiriboti konkrečios, svetainę ar interneto erdvę (rinkinys svetaines) ir Surūšiuota pagal tinkamumą laiką ("PageRank" yra naudojamas) arba data.
ASPseek yra optimizuotas kelių svetainėse (sriegiuotų indeksu, async DNS paieška ", grupavimas rezultatus svetainės, web vietų skaičius), tačiau gali būti naudojami paieškai vieną svetainę, taip pat. ASPseek gali dirbti su keliomis kalbomis / koduotes karto (įskaitant būt koduotes, pavyzdžiui, kinų), nes Unicode saugojimo režimą. Kitos funkcijos apima STOP žodžių ir ISpell paramą, koduotės ir kalbų Guesser, HTML šablonus paieškos rezultatų, ištraukų, ir užklausos žodžius, pabrėžiant.
ASPseek parašyta C ++ naudojant STL biblioteką ir naudoja mišinį SQL duomenų bazės ir dvejetainius failus saugoti.
Štai keletas pagrindinių ypatybių "ASPseek":
Galimybė indekso ir ieškoti kelių milijonų dokumentų
 
· Naudojant ASPseek, galite sukurti duomenų bazę ir paieškos per daug svetainių, ir rezultatai kiekvienos užklausos bus grąžintas greitai, net jei jūs turite keletą milijonus dokumentų indeksuojami. Žinoma, tai priklauso nuo įrangos, todėl nereikia tikėtis "senas geras" i486 mašina dirbti kiekvieną svetainę .com domeno. Viskas priklauso nuo procesoriaus (-ių), atminties, disko greitis ir tt Taigi padaryti savo bandymus prieš pirkdami speciali įranga.
 
· Tai, kad ASPseek yra optimizuotas dideliais kiekiais neturėtų sustabdyti jus nuo naudojant jį ieškoti savo svetainę, kad yra keli šimtai dokumentais - ji veikia ten taip pat.
 
Labai geras tinkamumą rezultatų
 
· Search Engine tikslas yra rasti tai, ko vartotojas nori. Čia gali būti tūkstančiai URL rasti kaip paieškos užklausą rezultatų, tačiau visa tai gali būti nereikšminga, todėl vartotojas bus nepatenkintas.
 
· Išvesties rezultatai ASPseek surūšiuoti pagal tinkamumą (ar rango), tačiau rangas apskaičiavimas nėra lengva užduotis. Kūrėjai bandė savo geriausia įtraukti didžiausią ir naujausias technologijas į ASPseek variklio išlaikant gerą paieškos greitį.
 
Ispell parama
 
· Kai ASPseek naudojamas su ISpell paramos searchd (1) pasirinktinai gali rasti visus formas visų nurodytų žodžių (pavyzdžiui: sukurti -> Kurti sukurta ar sukuriama). Taigi, jis leidžia jums rasti visose įvairių formų žodį.
 
"Unicode saugojimo režimas
 
· ASPseek gali saugoti informaciją apie dokumentų Unicode, todėl galima įgyvendinti daugiametį kalbos paieškos. Taigi, jūs galite indeksas ir ieškoti anglų dokumentus, rusų ir net kinų, viskas vienoje duomenų bazėje.
 
HTTP, HTTPS, HTTP proxy, FTP (per proxy) protokolai
 
· Kaip ASPseek yra interneto paieškos sistema, ji naudoja HTTP protokolą indekso svetainėse. ASPseek taip pat palaiko saugų https: // protokolas. FTP protokolas nepalaikomas tiesiogiai, tačiau galite naudoti proxy (pvz kalmarai) ir indeksą FTP svetaines per proxy.
 
· ASPseek palaiko "pagrindinė leidimas" funkcija HTTP, todėl jūs galite index apsaugotas slaptažodžiu sritys (pavyzdžiui privačios informacijos savo intranete).
 
Tekstas / html text / plain dokumentų rūšys parama
 
· ASPseek gali suprasti dokumentus, parašytus HTML ir paprasto teksto dokumentus. Tai yra populiariausi formatai internete.
 
· Kiti formatai, pavyzdžiui, PDF, RTF, ir tt, gali būti remiami su bet kokios išorinės programos / script kuris gali konvertuoti, kad formatų į HTML arba paprastojo teksto pagalba.
 
Lygiagrečių dizainas, asinchroninis DNS ir tt
 
· ASPseek naudoja POSIX temas, tai reiškia, kad vienas procesas turi daug temas veikia lygiagrečiai. Taigi puslapis parsisiųsti dokumentai iš daugelio svetainių ir paieškos demonas procesai daugelis paieškos užklausas vienu metu. Tai ne tik padeda ASPseek gerai skalė SMP (wieloprocesorowych) sistemų, o taip pat pagerina indeksavimo greitį, nes jei iš vienos gijos daugiausia laiko bus išleista laukia duomenų iš tinklo.
 
· Vienas dalykas, kad lėtas indeksavimo procesas žemyn daug yra DNS (nustatymo IP adresą, naudodami serverio pavadinimą procesas). Siekiant išvengti vėlavimų, asinchroniniai paieška "(peržvalgos daroma atskirų specialių procesų) ir IP adresas talpyklos būtų įgyvendinamos.
 
STOP žodžių
 
· STOP žodžių Yra žodžiai, kurie neturi prasmės pats. Pavyzdžiai: yra, yra, bent tai. Ieškant ne yra nenaudingas, todėl tokie žodžiai pašalintas iš paieškos užklausą. STOP žodžių, taip pat pašalinti iš duomenų bazės indeksavimas metu, taigi duomenų bazės tampa mažesni ir greičiau.
 
· Nėra specialiai sukonstruotais "STOP žodžių į ASPseek, jie pakraunami paleidimo metu iš failų. Daugelis stopword failus skirtingų kalbų ateina su ASPseek.
 
Koduotę guesse
 
· Kai susmulkintos arba blogai nustatytų serveriai nesakykite klientams į koduotę, kuriose jie teikia turinį. Jei indeksavimo tokius serverius, arba naudojant ASPseek indeksuoti ftp serveriuose (FTP protokolą nėra nieko simbolių rinkiniuose žinau), koduotė Guesser gali būti naudojamas kovoti su ja. Nustatyti teisingą koduotę koduotę Guesser naudoja žodį dažnių lentelės (vadinami langmaps).
 
Robotas atskirtis standartas (robots.txt) parama
 
· ASPseek visiškai palaiko šį standartą. Jis skirtas interneto svetainės autorių pasakoja robotą (pavyzdžiui, ASPseek anketa indeksas (1)) praleisti indeksavimo kai savo svetaines katalogus.
 
· Daugiau informacijos rasite http://www.robotstxt.org/wc/robots.html
 
Nustatymai kontroliuoti tinklo pralaidumas naudojimo ir interneto serverių apkrova
 
· Jūs galite tiksliau kontroliuoti tinklo pralaidumą, kad indeksas (1) naudoja. Būtent, galite apriboti pralaidumą (išreiškiamas bitais per sekundę) indeksu (1), naudojamas suteikta laiko ir dienos. Pavyzdžiui, galite apriboti darbo valandomis pralaidumą, kad žmonės biure nepajusite lėtai internetu.
 
· Jūs taip pat galite nustatyti minimalų laiką tarp dviejų užklausų į tą pačią žiniatinklio serveryje, todėl nebus perkrautas ir gavo ant kelio, o paleisti indeksą (1).
 
Realaus laiko asinchroninis indeksavimo
 
· Kai kurie paieškos varikliai reikalauja, kad paieška turėtų būti sustabdyta už atnaujinti duomenų bazės laiko. ASPseek nereikia jį, todėl jūs galite ieškoti non-stop.
 
· Daugiau pasakyti, yra specialus režimas indeksavimo vadinama "realaus laiko" indeksavimo. Jūs galite naudoti ją nedidelio skaičiaus dokumentų, ir kiek toks dokumentas yra atsisiuntė ir tvarkomi, pokyčiai yra iš karto pastebimas paieškos sąsają. Ši funkcija labai padeda, jei esate pastate paieškos puslapių su sparčiai besikeičiančios turinys, pavyzdžiui, naujienų ir tt
 
· Atkreipkite dėmesį, kad dokumentų skaičių "realiu laiku" duomenų bazė yra ribotas. Tai apie 1000 mūsų aparatūros (jūsų rida gali skirtis), o daugiau dokumentų, turite iš "realaus laiko" duomenų bazėje, lėčiau bus greitis indeksavimo į tą (ir tik tuo) duomenų bazėje. Tai neturi įtakos paieškos greitį nors.
 
· Dokumentai "realaus laiko" duomenų bazės perkeliami į įprastą duomenų bazėje paleidus indeksą (1) įprastu būdu.
 
Rūšiavimas rezultatus EEE arba pagal datą
 
· Paieškos sistemos paprastai grįžta svarbiausius rezultatus pirmą. Bet jei jūs ieškote naujausių puslapius, galite pasakyti ASPseek rūšiuoti rezultatus paskutinio modifikavimo datą, taip neseniai keistas (ar sukūrė) puslapiai bus rodomi pirmiausia.
 
Ištraukos, užklausos žodžiai, apibūdinantys
· Ištrauka yra rasti dokumento gabalas su žodžiais ieškoma pabrėžė, tiesiog duoti, ką dokumentas yra apie idėją. Galite tinkinti ištraukos rodymas ir jų ilgį skaičių. Jei bus išjungti ištraukos, dokumento pradžia bus rodomas.
 
· Kiekvienas rastas dokumentas lydi nuorodą "Kopija". ASPseek saugo vietos suspausto kopiją kiekvienam perdirbtų dokumento, todėl vartotojas gali pamatyti visą dokumentą (neprivaloma) pabrėžė žodžius, kurie buvo ieškoma, net jei jis buvo ištrintas iš originalaus svetainėje (tai atsitinka kartais).
 
Grupavimas rezultatai pagal svetainę
 
· Rezultatai iš vienos svetainės galima sugrupuoti. Jei grupuojant svetainių, yra tik du rezultatai rodomi iš tos pačios vietos pagal nutylėjimą, o vartotojas gali pamatyti kitus puslapius iš toje pačioje vietoje po A "daugiau rezultatų ..." nuorodą.
 
Klonai
 
· Klonai yra identiški dokumentai skirtingose ​​vietose. Jie aptinkami ir sugrupuoti, todėl vartotojas negali būti pateikiami su puslapio pilną URL į tapačių dokumentų.
 
· Klonas aptikimo paprastai riboja vienoje vietoje (kad tapačių dokumentų iš įvairių svetainių neskaičiuojami kaip klonų), tačiau galite tai pakeisti recompiling ASPseek su disable-klonai-by-svetainės variantą.
 
Erdves ir sutrumpinti
 
· Erdvė yra vietų rinkinys. Taigi, jei norite suteikti paiešką susiaurėjusią tam tikru srityje, galite sukurti erdvę ir ieškoti per tą erdvę. Tik sveiki svetainių (pvz http://www.mysite.com/) leidžiama būti įtraukti į kosmosą.
 
· Ir sutrumpinti taip pat gali būti naudojamas apriboti paiešką. Jūs galite kurti pogrupį ir įdėti URL kaukę (pvz http://www.mysite.com/mydir/%) į tai, ir tada apriboti paieškos taikymo sritį tik konkrečioje pogrupyje.
 
· Galite apriboti paieškos apimtis ne tik vienas, bet keli pogrupiuose ar erdvėse.
 
HTML šablonai lengvai Tinkinti paieškos rezultatus
 
· Galite tinkinti jūsų paieškos puslapius, todėl jie atrodys ir bus integruojama su svetainės dalimi. Tai daroma paprasta redagavimo paieška šablono failą.
Montavimas
gzip -DC aspseek-1.2.10.tar.gz | deguto XF -
CD aspseek-1.2.10. / konfigūruoti
padaryti
Su
make install

Kita programinė įranga kūrėjas SWsoft

Plesk for Windows
Plesk for Windows

22 Sep 15

OpenVZ Live CD
OpenVZ Live CD

2 Jun 15

OpenVZ kernel
OpenVZ kernel

2 Jun 15

Komentarai ASPseek

Komentarai nerastas
Pridėti komentarą
Pasukite ant paveikslėlio!