Indeksi i mosmarrëveshjeve tema php mundësuar nga smf. Mësimi i tretë. Ne mbledhim bazat e të dhënave më të mira vetë

Le të fillojmë menjëherë me kodin kryesor të shkrimit:

#! / usr / bin / perl

# script-forum.pl
# (c) 2010 Alexandr A Alexeev, http: // site /

përdorni rreptë;

# komentoi linjat - për rreptësi
# nëse detyra është të mbledhësh statistika të motorit, lëre ashtu siç është
# nëse bëni një listë të forumeve - jo koment

të dhënat e mia $;
$ data. \u003d $ _ while (<> ) ;

# kontrolloni sa ishte mundësuar nga phpBB pa lidhje në fund të faqes
shtyp "phpbb \\ n "
nëse ($ data \u003d /] + href \u003d "[^"] * http: \\ / \\ / (?: www \\.)? phpbb \\ .com \\ /? "[^\u003e] *\u003e phpBB / i ose
# $ data \u003d ~ /viewforum\\.php\\?"^"""")*f\u003d\\d+/i ose
$ data \u003d ~ / phpBB \\ -SEO / i ose
$ data \u003d /) ;
shtyp "ipb \\ n "
nëse ($ data \u003d /] + href \u003d "[^"] * http: \\ / \\ / (?: www \\.)? invision (?: bordi | fuqia) \\. com \\ /? [^ "] *" [^\u003e] *\u003e [^<]*IP\.Board/i ose
$ data \u003d /] + href \u003d "[^"] * http: \\ / \\ / (?: www \\.)? invisionboard \\ .com \\ /? "[^\u003e] *\u003e Invision Power Board / i ose
$ data \u003d /

/ i ose
$ data \u003d /index\\.php\\?†^""†*showforum\u003d\\d+/i) ;
shtyp "vbulletin \\ n "
nëse ($ data \u003d / Mundësuar nga :? [^<]+vBulletin[^<]+(?:Version)?/i ose
$ data \u003d /) ;
shtyp "smf \\ n "
nëse ($ data \u003d /] + href \u003d "[^"] * http: \\ / \\ / (?: www \\.)? simplemachines \\ .org \\ /? "[^\u003e] *\u003e Mundësuar nga SMF / i ose
$ data \u003d /index\\.php\\?†^"""*board\u003d\\d+\\.0/i) ;
shtyp "punbb \\ n "
nëse ($ data \u003d /] + href \u003d "[^"] * http: \\ / \\ / (? :(?: www \\.)? punbb \\ .org | punbb \\ .informator \\ .com) \\ /? "[^\u003e] *\u003e PunBB / i); # ose
# $ data \u003d ~ /viewforum\\.php\\?†^"""*id\u003d\\d+/i);
shtyp "fluxbb \\ n "
# nëse ($ data \u003d ~ /viewtopic\\.php\\?id\u003d\\d+/i ose
nëse ($ data \u003d /] + href \u003d "http: \\ / \\ / (?: www \\.) fluxbb \\ .org \\ /?" [^\u003e] *\u003e FluxBB / i) ;
shtyp "exbb \\ n "
nëse ($ data \u003d /] + href \u003d "[^"] * http: \\ / \\ / (?: www \\.)? exbb \\ .org \\ /? "[^\u003e] *\u003e ExBB / i); # ose
# $ data \u003d ~ /forums\\.php\\?†^""""forum\u003d\\d+/i);
shtyp "yabb \\ n "
nëse ($ data \u003d /] + href \u003d "[^"] * http: \\ / \\ / (?: www \\.)? yabbforum \\ .com \\ /? "[^\u003e] *\u003e YaBB / i ose
$ data \u003d ~ /YaBB\\.pl\\?†^"""**num\u003d\\d+/i);
shtyp "dleforum \\ n "
nëse ($ data \u003d / \\ (Mundësuar nga Forumi DLE \\)<\/title>/ i ose
$ data \u003d /] + href \u003d "[^"] + (?: http: \\ / \\ / (?: www \\.)? dle \\ -files \\ .ru | akt \u003d e drejta e autorit) [^ "] *"\u003e Forumi DLE<\/a>/ i) ;
shtyp "ikonboard \\ n "
nëse ($ data \u003d /] + href \u003d "[^"] * http: \\ / \\ / (?: www \\.)? ikonboard \\ .com \\ /? [^ "] *" [^\u003e] *\u003e Ikonboard / i ose
$ data \u003d /\\ n "
nëse ($ data \u003d /\\ n "
# nëse ($ data \u003d ~ /forums\\.php\\?fid\u003d\\d+/i ose
# $ data \u003d ~ /topic\\.php\\?fid\u003d\\d+/i ose
nëse ($ data \u003d /] + href \u003d "http: \\ / \\ / (?: www \\.)? flashbb \\ .net \\ /?" [^\u003e] *\u003e FlashBB / i) ;
shtyp "stokesit \\ n "
# nëse ($ data \u003d ~ /forum\\.php\\?f\u003d\\d+/i ose
nëse ($ data \u003d /] + href \u003d "http: \\ / \\ / (?: www \\.)? stokesit \\ .com \\ .au \\ /?" [^\u003e] *\u003e [^ \\ /] * Stokes IT / i) ;
shtyp "podium \\ n "
# nëse ($ data \u003d ~ /topic\\.php\\?t\u003d\\d+/i ose
nëse ($ data \u003d /] + href \u003d [""]? http: \\ / \\ / (?: www \\.)? sopebox \\ .com \\ /? [""]? [^\u003e] *\u003e Podium / i) ;
shtyp "usebb \\ n "
# nëse ($ data \u003d ~ /forum\\.php\\?id\u003d\\d+/i ose
nëse ($ data \u003d /] + href \u003d "http: \\ / \\ / (?: www \\.)? usebb \\ .net \\ /?" [^\u003e] *\u003e UseBB / i) ;
shtyp "wrforum \\ n "
# nëse ($ data \u003d ~ /index\\.php\\?fid\u003d\\d+/i ose
nëse ($ data \u003d /] + href \u003d "http: \\ / \\ / (?: www \\.)? wr \\ -script \\ .ru \\ /?" [^\u003e] *\u003e WR \\ -Forum / i) ;
shtyp "endeanotherforumnet \\ n "
nëse ($ data \u003d ~ / Akoma një forum tjetër. .net / i ose
$ data \u003d /default\\.aspx\\?g\u003dposts&t\u003d\\d+/i) ;

Ju do të gjeni këtë dhe shkrimet e tjera të përmendura në postimin në këtë arkiv.

Skenari e cila- forumi.pl shqyrton kodin e faqes html për praninë e nënshkrimeve të motorit të forumit në të. Ne kemi përdorur një teknikë të ngjashme kur përcaktojmë WordPress dhe Joomla, por ka disa ndryshime. Së pari, vetë skenari nuk e ngarkon kodin e faqes, por e lexon atë nga stdin ose një skedar i kaluar si argument. Kjo ju lejon të ngarkoni një faqe një herë, për shembull, duke përdorur wget, dhe më pas ta ekzekutoni nëpër disa analizues, nëse kemi më shumë se një. Së dyti, në këtë skenar, prania e një nënshkrimi është 100% një shenjë e motorit. Herën e kaluar, prania e një nënshkrimi i dha peshë vetëm motorit përkatës dhe motorit me peshën më të lartë "të fituar". Vendosa që në këtë rast, kjo qasje vetëm do ta komplikonte pa nevojë kodin.

Për të provuar se si funksionon skenari, unë bëra disa hulumtime. Unë përpilova një listë me disa mijëra forume dhe kalova secilin prej tyre përmes skenarit tim, duke përcaktuar kështu përqindjen e shkaktarëve të programit dhe popullaritetin e motorëve të ndryshëm.

Kam përdorur analizuesin tim google për të marrë një listë të forumeve. Motori i kërkimit dërgoi kërkesa si

faqja: forumi. *. ru
faqja: bisedoni. *. ru
faqja: bordi. *. ru
faqja: smf. *. ru
faqja: phpbb. *. ru
....

etj. Kodi i plotë i gjeneratorit të pyetjes mund të gjendet në skedar gen-forumsearch-urls.pl... Përveç zone.ru, u përdorën gjithashtu .su .ua .kz dhe.by. Ishte e vështirë për të bërë këtë hulumtim herën e fundit sepse faqet WordPress dhe Joomla nuk kanë nënshkrime të tilla në URL-të e tyre. Katalogët si cmsmagazine.ru/catalogue/ nuk japin madhësinë e mjaftueshme të kampionit. Cilat janë 600 faqet e Drupal?

Duhet ta pranoj, rezultatet e eksperimentit më mërzitën. Nga 12,590 vendet e studiuara, vetëm 7083 u identifikuan me sukses me motorin, domethënë vetëm në 56% të rasteve. Ndoshta më ka marrë malli për ndonjë motor? A ishte Bitrix me të vërtetë në gjysmën e forumeve? Apo duhet të kaloj më shumë kohë duke kërkuar nënshkrime? Në përgjithësi, këtu kërkohet më shumë hulumtim.

Midis 56% të motorëve të identifikuar me sukses, më të njohurit, siç pritej, ishin IPB (31%), phpBB (26.6%) dhe vBulletin (26.5%)

Ata ndiqen nga afër nga SMF (5.8%) dhe DLEForum (5.3%). PunBB-ja ime e preferuar ishte vetëm në vendin e 6-të (1.64%). Unë nuk do të rekomandoja t'u besoja fort këtyre shifrave (thonë ata, çdo forum i tretë në RuNet punon në IPB), por natyrisht mund të nxirren përfundime të caktuara.

Për shembull, nëse keni ndërmend të krijoni një faqe në internet në një motor forumi dhe planifikoni të modifikoni forumin, le të themi, paguani përdoruesve 0,01 dollarë për secilin mesazh me tërheqje automatike të fondeve një herë në javë, atëherë duhet të zgjidhni një nga tre motorët më të njohur. Sa më i popullarizuar të jetë një forum, aq më shumë ka të ngjarë të gjesh një programues i cili është i aftë për të.

Nëse nuk priten ndryshime të rëndësishme në motor, atëherë mund të ketë kuptim të zgjidhni jo motorin më të njohur, për shembull SMF ose punBB. Kjo do të zvogëlojë numrin e sulmeve të hakerëve në forumin tuaj dhe sasinë e spam-eve të dërguara automatikisht në të.

Skriptet për kërkimin / përcaktimin e forumeve gjithashtu mund të gjenden në më shumë se një aplikim praktik. Gjëja e parë që më erdhi në mendje personalisht ishte të zgjidhja forumet e identifikuara nga TCI dhe të vendosja në qindra postimet e para me lidhje me një nga faqet e tyre. Sidoqoftë, njëqind lidhje dofolow të forumit nuk ndikuan në TCI në asnjë mënyrë (kaluan 2 azhurnime), kështu që është më mirë të mos humbni kohë këtu, përveç nëse jeni të interesuar për tranzicionet.

Shtë e qartë se përdorimi me emër i skenareve është larg nga i vetmi. Unë mendoj se ju lehtë mund të kuptoni se si tjetër mund t'i përdorni ato.

Organizuar nga Botmaster Labs, nuk është planifikuar. Nuk ka kohë, videoja është e nevojshme për konkursin, si një trend i ri, edhe pse është më e lehtë të shpjegosh gjithçka me pamje të mira ekrani (IMHO im), dhe unë me të vërtetë nuk dua të xhiroj asgjë. Kështu që kanë mbetur shumë pak fitimprurëse, spam budallallëkët nuk rregullojnë më fare, këtu duhet të mendoni dhe askush nuk do ta djegë temën, nëse vetëm të vjetëruarit përpiqen të fusin dhe pluhurojnë pak në një mbështjellës të bukur. :) Por kjo nuk ka të bëjë me ne. Në përgjithësi, këto 3 "jo", mendoj se në thelb u bënë pengesa për pjesëmarrjen në konkurs për shumicën e pjesëmarrësve të mundshëm. Likeshtë si të riparosh një makinë nga tre: të lirë, me cilësi të lartë, të shpejtë - shërbimi mund të plotësojë vetëm 2 kushte në të njëjtën kohë. uluni dhe zgjidhni atë që është më afër jush. :) Konkurrenca është e njëjtë: Kam kohë, mund të bëj një video, por nuk kam temë, ose mund të bëj një video, kam një temë, por nuk kam fare kohë, ose kam kohë të lirë dhe kam pak temka, por videoja është e frikshme. Por është mirë nëse plotësohen 2 kushte njëkohësisht. Epo, mirë, le të heqim dorë nga teksti. Do vazhdoj vetveten. Unë nuk kam planifikuar, që do të thotë se kam marrë pjesë në konkurs, madje kam zgjedhur cilin artikull do të votoj. Thoni atë që ju pëlqen, por Doz e njeh shumë mirë programin kompjuterik dhe di ta përdorë atë shumë me sens. Por sot mësova se intriga u shfaq në konkurs. Rezulton se nuk do të jem në gjendje të votoj, por vetëm fillestarët që blenë softuerin në 2011 dhe konkursi është krijuar për ta mund ta bëjnë këtë. U habita pak, por pronari është mjeshtër. Konkursi është një fushatë reklamuese dhe Aleksandri di më mirë se si ta zhvillojë atë. Në përgjithësi, atëherë vendosa të postoj një artikull, është disi më e lehtë për të shkruar kur është e qartë për kë, për të gjithë fermën kolektive, në fakt, kjo është e pamundur të bëhet.
Hyrja e gjatë ka mbaruar, tani në pikë.
Çfarë i duhet një fillestari kur ka fituar një super-korrës, i cili është kompleksi Xrumer + Hrefer? Kjo është e drejtë, mësoni të punoni në të dhe hidhni poshtë iluzionin se mund të fitoni para duke filluar të bëni spam me fletë. Nëse mendoni kështu, dhuroni menjëherë paratë tuaja për bamirësi. Ju duhet të mësoni se si të përdorni mjetet e kompleksit, mundësisht duke e mprehur atë për veten tuaj. Koha "merrni më shumë - hidhni më shumë" është zhdukur. Sasia i lë vendin cilësisë. Pra, ne do të mbledhim bazën për veten tonë, mos mësoni se si ta bëni këtë - ju do të mbeteni prapa trenit. Sigurisht, Hrefer do të na ndihmojë për këtë. Nëse planifikoni të promovoni burimet tuaja në Google, atëherë ne gjithashtu duhet të kërkojmë për faqet e dhuruesve përmes Google. Unë mendoj se kjo është e qartë dhe logjike. Por Google, si pronari i malit të bakrit, nuk ia jep pasurinë e tij të gjithëve. Ju duhet një qasje ndaj saj. Unë do të doja të thoja menjëherë që mos shpresoni se do të jeni në gjendje të grumbulloni diçka nga shenjat që gjeni në publik. Për shkak se ato janë në dispozicion në publik, ato janë të pavlefshme. Nuk do ta zhvilloj më tej temën. Më mirë do t'ju tregoja se si ta mblidhni atë në mënyrë të saktë në mënyrë që të shihni rezultatin, pjesën tjetër do ta përfundoni vetë, gjëja kryesore është të kuptoni parimin. Shtë e nevojshme të grumbulloheni në bazë të saktë në bazë të motorëve specifik, të nevojshëm dhe jo në bazë të forumeve në përgjithësi. Ky është gabimi kryesor i fillestarëve - të mos përqendrohen në specifikat, por të përpiqen të mbulojnë gjithçka në tërësinë e tyre. E megjithatë, nëse doni të analizoni një bazë pak a shumë normale, refuzoni ta përdorni atë në pyetjet e operatorit. Jo "inurl:", "site:", "title", etj. Google do të ndalojë kërkuesit si ju menjëherë. Prandaj, ne studiojmë me kujdes motorët me të cilët Hrumer po punon aktualisht:

Mundësuar nga php-Fusion

Në versionin Hrumer 7.07, programi është trajnuar në disa motorë të rinj:

forumi.biz, forumb.biz, 1forum.biz, 7forum.biz, etj.

phpBB-fr.com, tema Solaris phpBB

Dhe procesi i të mësuarit të gjërave të reja vazhdon vazhdimisht.
Në përgjithësi, ne duhet të përgatisim pyetjet e sakta për analizën nga Hrefer. Le të marrim një forum djok për shembull. Forume SMF... Dhe le të fillojmë ta çmontojmë në pjesë për të analizuar. Google-i ynë i dashur do të na ndihmojë për këtë. Futja e një kërkese të Google Forume SMF - ka shumë mbeturina në rezultatet e kërkimit, ne kthehemi te faqja e 13-të dhe zgjedhim çdo lidhje. Kam hasur në këtë: http://www.volcanohost.com/forum/index.php?topic\u003d11.0. Ne e hapim dhe e shqyrtojmë. Ne duhet të gjejmë diçka karakteristike në faqe që mund të zbatohet në kërkimin e faqeve të tjera në këtë motor. Në fund të faqes, vini re mbishkrimin e mëposhtëm Mundësuar nga SMF 1.1.14, ne e citojmë atë dhe e fusim në Google, kjo na tregon se për këtë kërkesë, ajo njeh rreth 59 milion opsione. Shohim shpejt lidhjet, shtojmë edhe disa mundësi në këtë fjalë kyçe, për shembull, Plepi "mundësuar nga SMF 1.1.14" ose "Powered by SMF 1.1.14" viagra... Ne jemi të bindur që kërkesa është e mrekullueshme, në rezultatet ka vetëm forume dhe pothuajse asnjë plehra për ju.

Për më tepër, ne nuk jemi të interesuar për sasi, por për cilësi, siç thashë më lart. Vazhdo Nga i njëjti forum, marrim një frazë tjetër nga faqja kryesore: , ne gjithashtu e citojmë atë dhe e ushqejmë atë me Google. Si përgjigje, ai zbulon se di më shumë se 13 milion rezultate. Ne përsëri heqim rezultatet e kërkimit, shtojmë fjalë shtesë dhe kontrollojmë rezultatet me to. Ne sigurohemi që pyetja të jetë e shkëlqyeshme dhe gjithashtu pothuajse nuk ka hedhurina. Në përgjithësi, tashmë ka 2 kërkesa për hekur. Unë sugjeroj të lëmë vetëm forumin e parë për tani dhe të vazhdojmë të mbledhim kërkesa për forume të tjera. Për fat të mirë, Google është i hapur sipas kërkesës 2006-2008, Simple Machines LLC... Marrim nga SERP, për shembull, këto forume: http://www.snowlinks.ru/forum/index.php?topic\u003d1062.0 dhe http://litputnik.ru/forum/index.php?action\u003dprintpage;topic\u003d380.0 në faqet e tyre ne marrim pyetjet e mëposhtme: "Mundësuar nga SMF 1.1.7" dhe "Mundësuar nga SMF 1.1.10" (Unë gjithmonë këshilloj të drejtojmë me thonjëza për Hrefer, sepse ne kemi nevojë për cilësi para së gjithash). Unë mendoj se është e qartë se çfarë po bëjmë, në fund të fundit do të kemi një bazë të caktuar pyetjesh për të kërkuar forume në motorin SMF (është zgjedhur për shembull, me motorë të tjerë të njëjtë).
Do të duket diçka e tillë:

"Mundësuar nga SMF 1.1.2"

"Mundësuar nga SMF 1.1.3"

"Mundësuar nga SMF 1.1 RC2"

"Mundësuar nga SMF 1.1.4"

"Mundësuar nga SMF 1.1.8"

"Mundësuar nga SMF 1.1.7"

"2006-2008, Simple Machines LLC"

Dhe kjo nuk është e gjitha. Ndërsa mbledhim versionet e motorëve, në disa forume SMF në fund të faqes gjejmë nadvis "2001-2006, Lewis Media". Ne e kontrollojmë këtë kërkesë, ajo gjithashtu na kënaq plotësisht. Ne gjejmë një pyetje të ngjashme: "2001-2005, Lewis Media". Duke kaluar nëpër fund të faqeve, ne gjejmë pyetjen vijuese: "Dizajni SMFone nga A.M.A, i transferuar në SMF 1.1". Ne kontrollojmë - shkëlqyeshëm. Etj Gjysmë ore punë dhe ju keni një bazë të dhënash të mrekullueshme të pyetjeve për motorin, dhe Google do të ndalohet për këto pyetje shumë më rrallë sesa nëse përdorni operatorë në to. Dhe në të njëjtën kohë, baza juaj e të dhënave do të jetë shumë më e pastër sesa nëse përdorni pyetje të tilla si "index.php? Topic \u003d", sepse këtu Google do të japë jo vetëm forumet që na duhen, por edhe shumë burime të mbetura atje ku patëm sukses lini një lidhje në temën e forumit. Ju mund të argumentoni, thonë ata, çfarë nuk shkon me këtë? Të tjerët lanë një lidhje, kështu që ne mundemi. Por! Linqet mund të lënë jo vetëm Hrumer, por edhe programe të tjerë. dhe ato mund të mprehen posaçërisht për të lënë komente në një burim të caktuar, të ashtuquajturin softuer tepër të specializuar, plus lidhje të tilla mund të lihen me dorë. Përsëri, e përsëris, nuk është sasia e plehrave që është e rëndësishme për ne, por cilësia, baza me kërkesat e duhura dhe kështu që ne do të mbledhim. Përparësia e kësaj metode është që praktikisht nuk keni nevojë të konfiguroni në Hrefer sitë -filtër , thjesht mund ta fikni, sepse Google praktikisht nuk do t'ju japë mbeturina.


Unë besoj se është shumë e rëndësishme të mësosh se si të përdorësh Hrefer në fazën fillestare saktë, sepse pasi e ke mësuar këtë, gjithmonë mund të gjesh një përdorim për Hrumer, pavarësisht se si ndryshon situata. Mbrojtjet po bëhen më të komplikuara, dhe nëse në disa lloje motorësh mbrojtja është forcuar dhe Hrumer nuk mund ta përballojë atë për momentin, atëherë nuk ka kuptim të shpenzosh burime për mbledhjen e këtyre lidhjeve, dhe pastaj për të punuar me to me Hrumer, është më mirë të përqendrohesh në atë që jep rezultatin ... Dhe në të njëjtën kohë, nëse ekipi i Labs Botmaster mësoi Hrumer diçka të re, është e mundur që shpejt të disektohet një pacient i ri dhe të përgatitet një bazë për Hrumer ndërsa pacienti është ende i vakët. Koha është para, burimi mund të mos jetë më i rëndësishëm kur bleni bazën. mbledhur nga dikush. Përveç kësaj, mbledhja e saktë e bazave për veten tuaj zgjeron ndjeshëm përdorimin "e bardhë" të Hrumer. Dhe kjo është pikërisht ajo ku gjithçka po lëviz, duam apo jo, dhe procesi i zbardhjes ose thinjave po vazhdon. Çarçafët e zi janë një e kaluar.
Të gjitha pjesët e tjera, tashmë aspektet teknike të punës me Hrefer, mund të shihen në ndihmë dhe nuk ka kuptim të zgjatemi në to, të gjitha qëllimet-pikat-sekondat janë vendosur në mënyrë empirike për secilën makinë veç e veç.
Si një bonus, unë do të postoj këtu një model për të analizuar motorin kinez të kërkimit Baidu, ditën tjetër më pyetën për këtë, kështu që unë e bëra atë në mes të kohërave, më falni për lojë fjalësh. :)


Emri i hostit \u003d http: //www.baidu.com
Pyetje \u003d s? Wd \u003d
LinksMaska \u003d
Faqet totale \u003d 100
Faqja tjetër \u003d

Faqja tjetër2 \u003d

KapëseURL \u003d
CaptchaImage \u003d
CaptchaField \u003d


Unë u përpoqa t'i analizoja në një provë, nuk kishte asnjë ndalim, Hrefer mblodhi burime të gjalla, të gjitha kërkesat për analizë ishin të ngjashme me Google, por burimet kineze ishin një det, dhe me një PR të lartë, dhe përveç kësaj, kishte shumë vende ku Evropiani nuk shkeli. Shtë më mirë të analizosh kërkesat kineze. Kjo do të ndihmojë Google-të përkthejë, shkruani një listë të fjalëve kyçe në rusisht dhe ta përktheni atë në kinezisht. E vërteta në " fjalët"Fjalët Hrefer nuk mund të shtohen në kinezisht, ju duhet të rikodifikoni.
Në vend të kinezishtes:

伟哥 - viagra

吉他 - kitarë

其他 - pushoni

保险公司 - sigurimi

Vendosni këto kode për t'i zëvendësuar ato në skedarin word:

% E4% pes% 9F% E5% 93% A5

% E5% 90% 89% E4% BB% 96

% E5% 85% B6% E4% BB% 96

% E4% BF% 9D% E9% 99% A9% E5% 85% AC% E5% 8F% B8

Nëse jeni duke promovuar një faqe në internet për sigurim, atëherë duke vendosur një lidhje në profilin tuaj në një tematikë (!) Edhe një forum kinez i gjetur me kërkesë " forumi SMF " do jete shume bukur.
Si përfundim, unë do të doja të them se unë kurrë nuk kam kuptuar njerëz që ankoheshin se Khrefers janë të këqij ose nuk analizojnë, unë gjithmonë kam dashur ta them këtë, ju thjesht nuk dini si t'i gatuani. Më mirë se një hrefer, asnjë analizues nuk di se si të mbledhë rezultate, vetëm kërkesat duhet të jenë të sakta. Hrefer është një makinë: e mirë, e fortë, e bërë në gjermanisht, por një person e drejton atë dhe gjithçka varet nga sa inteligjent drejtohet, ju nuk mund ta detyroni makinën të shkojë djathtas dhe majtas në të njëjtën kohë.
Një temë e veçantë është pastrimi i bazave, një herë kam bërë 3 vjet më parë për konkursin e mëparshëm. Me më shumë, gjithçka është akoma e rëndësishme atje, por tani mund të refuzoni të kontrolloni për 200 OK, unë me të vërtetë nuk më pëlqente ky proces, gabimet ishin shumë të mëdha, shumë gjëra të panevojshme u filtruan. Tani kjo mund të bëhet pothuajse automatikisht në procesin e punës së Hrumer, edhe pse ky proces nuk është një analog i plotë i kontrollit për "200 OK". Në përgjithësi, deri në pikën: jo shumë kohë më parë në Hrumer u shfaq një mundësi e mrekullueshme - për të grabitur informacion nga burimet në kohën e ekzekutimit të projektit. Duket kështu. Ju vozisni në një model që do të përpunohet gjatë procesit, dhe informacioni i mbledhur nga shablloni do të futet në skedarin xgrabbed.txt në dosjen Logs. Ju mund ta përdorni këtë funksion për çdo gjë, fluturimi i imagjinatës është i madh. Unë e përdor këtë funksion një herë në javë për të hequr lidhjet e "skaduara" nga baza e të dhënave. Nuk është sekret që forume vdesin çdo ditë në mënyrë që të pastrojnë bazën nga burime të tilla dhe mjeti "Autograbbing" do të na ndihmojë në këtë rast.
Në fund të fundit, duhet të pranoni, shpesh shtypni, për shembull, http://www.laptopace.com/index.php, ne shohim se ky domen është tashmë, për shembull, një pajisje, por nuk ka forum atje. Pra, për ta hedhur këtë skorje nga baza, ne do të plaçkisim. :) Hapni kodin burimor të faqes dhe shikoni këtë shënim atje:

laptopace.com
Për kapje, shndërroje atë në
[...]

Tani të gjithë "të vdekurit" nga goudaddi do të njihen për ne me emër.
Këtu është një përzgjedhje e vogël për mjetin "Autograbbing", nëse doni të pastroni bazën e të dhënave nga fusha të ndryshme "të skaduara":


[...]

[...]
[...]
[...]

[...]
Ky domen mund të jetë për shitje. [...] Bleni këtë Domain

[...]<body bgcolor="#ffffff" text="#000000"> </span><br> Lista është larg nga e plotë, por mendoj se do të ndihmojë që të mos drejtohen në mënyrë të përsëritur miliona baza plehrash. Nuk është e vështirë të krijosh një shabllon, të hapësh një lidhje të skaduar dhe të krijosh një maskë shablloni. <br> Duke përdorur të njëjtën autograbbing, ju gjithashtu mund të skanoni bazat tuaja të të dhënave ekzistuese dhe t'i renditni ato sipas burimeve, duke i ndarë sipas motorëve. Renditja e bazave të të dhënave sipas motorëve do t'ju lejojë të përdorni sa më mirë të gjitha aftësitë dhe cilësimet e Hrumer, veçanërisht procesin e të mësuarit. Dhe përveç kësaj, me ndihmën e Autograbbing, ju mund të hiqni mbeturinat nga bazat e të dhënave, nëse preferoni t'i grumbulloni ato jo nga Hrefer, por duke shkarkuar nga të gjitha llojet e shërbimeve të pritjes së skedarëve. Për ta bërë këtë, ose duhet të bësh një maskë për zgjedhjen e forumeve dhe më pas të mbledhësh nga baza e të dhënave vetëm atë që do të kapet nga maska, ose, përkundrazi, të bësh një maskë për jo-forume dhe pastaj të fshish atë që do të kapesh. Opsioni i parë është më logjik dhe më i besueshëm, sepse ne e dimë saktësisht se çfarë të kërkojmë. <br> Fat i mirë në punë. <br> PySy. Videoja u bë me fokus të ngushtë (unë isha i lodhur me të, e bëra për herë të parë :)), megjithëse e fillova Hrefer nga makina ime e shtëpisë, shpejtësia nuk është shumë e mirë, këtu kam kopje vetëm për teste, kështu që mos më fajësoni për shpejtësinë e punës. :) <br><p><span class="BlWV-EuxoOk"></span></p> <h4>16 komente:</h4> <p> jeka komenton ...</p><p>Çfarë programi keni zgjedhur fjalët kyçe?</p> Serge Glazko komenton ... <p>nëse kam nevojë të mbledh burime tematike, atëherë zgjedh fjalë në Words me stilolapsa dhe përmes Adwords. por për shumë tema, fjalët tashmë janë zgjedhur për mua, këtu mund të shtoj-fshij vetëm disa fjalë, por gjithashtu jo automatikisht, por t'i shikoj të gjitha.</p> <script>document.write("<img style='display:none;' src='//counter.yadro.ru/hit;artfast_after?t44.1;r"+ escape(document.referrer)+((typeof(screen)=="undefined")?"": ";s"+screen.width+"*"+screen.height+"*"+(screen.colorDepth? screen.colorDepth:screen.pixelDepth))+";u"+escape(document.URL)+";h"+escape(document.title.substring(0,150))+ ";"+Math.random()+ "border='0' width='1' height='1' loading=lazy>");</script> </div> </div> </div> </div> </div> </div> </div> </div> <div class="tm_sidebar"> <div class="sidebar_home"> <div class="gsense"> <div id="mymaju1" style="height:500px;width:300px;" align="center"></div> </div> <div class="sidebarwidget"> <ul> <li id="text-3" class="widget widget_text"> <div class="textwidget"> <div class="sidebar-orange">Kategoritë</div> </div> </li> <li id="nav_menu-3" class="widget widget_nav_menu"> <div class="menu-pravoe-menyu-nizhnee-container"> <ul id="menu-pravoe-menyu-nizhnee" class="menu"> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://3ddroid.ru/sq/category/windows-10/">Windows 10</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://3ddroid.ru/sq/category/browsers/">Shfletuesit</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://3ddroid.ru/sq/category/smartphones/">Telefonat inteligjentë</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://3ddroid.ru/sq/category/antivirus/">Antivirus</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://3ddroid.ru/sq/category/onroad/">OnRoad</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://3ddroid.ru/sq/category/terms/">Kushtet</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://3ddroid.ru/sq/category/apple/">Mollë</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://3ddroid.ru/sq/category/android/">Android</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://3ddroid.ru/sq/category/program/">Programet</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://3ddroid.ru/sq/category/ios/">Ios</a></li> </ul> </div> </li> </ul> </div> <div class="sidebarwidget"> <ul> <li id="text-3" class="widget widget_text"> <div class="textwidget"> <div class="sidebar-orange">Popullore</div> </div> </li> <li id="nav_menu-3" class="widget widget_nav_menu"> <div class="menu-pravoe-menyu-nizhnee-container"> <ul id="menu-pravoe-menyu-nizhnee" class="menu"> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://3ddroid.ru/sq/uncategorized/css3-perehody-css3-perehody-ispolzovanie-funkcii-zamedleniya/">Tranzicionet CSS3 duke përdorur funksionet e lehtësisë</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://3ddroid.ru/sq/gadgets/teg-podcherkivaniya-v-html5-podcherknutyi-tekst-html-chego-ne-hvataet/">Nënvizoni etiketën në html5</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://3ddroid.ru/sq/windows-10/izobrazheniya-v-html-dobavlyaem-izobrazheniya-na-web-stranicu-a-eshche/">Ne shtojmë imazhe në faqen e internetit, si dhe video dhe audio!</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://3ddroid.ru/sq/smartphones/kak-posmotret-novyh-uchastnikov-gruppy-vkontakte-kak-posmotret-novyh/">Si të shihni anëtarët e rinj të grupit VKontakte Si të përcaktoni se kush u bashkua me grupin e fundit</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://3ddroid.ru/sq/network/async-i-defer-strategii-zagruzki-javascript-dinamicheski-sozdavaemye/">"Skriptet asinkrone" të gjeneruara në mënyrë dinamike janë të dëmshme Etiketimi i skriptit atribuon async dhe shtyjë</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://3ddroid.ru/sq/peripherals/chekboksy---eto-chto-takoe-stilizaciya-chekboksov-i-radioknopok-na-chistom-css-s/">Styling kutitë e zgjedhjes dhe butonat e radios në CSS të pastër me pajtueshmërinë për shfletuesit e vjetër Çfarë do të thotë të kombinosh kutitë e zgjedhjes me avatarët</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://3ddroid.ru/sq/program/ottachivaem-masterstvo-raboty-s-curl-curl-ne-rabotaet-s-apache-kak-uznat-rabotaet-li/">CURL nuk punon me Apache Si të dalloni nëse cURL funksionon për ju</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://3ddroid.ru/sq/printers/pozhertvovaniya-v-gruppe-vkontakte-kak-dobavit-prilozhenie-donaty-v-shapke/">Dhuron në krye të bashkësive Vkontakte - si funksionon Si të bëni një donacion për VK</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://3ddroid.ru/sq/iron/bezbozhnyi-information-headers-chto-takoe-http-zagolovki-http-headers-obshchaya-teoriya/">Cilat janë headers Http</a></li> <li id="menu-item-" class="menu-item menu-item-type-taxonomy menu-item-object-category menu-item-"><a href="https://3ddroid.ru/sq/operating-systems/kak-otkazatsya-ot-podpiski-na-megafone-5051-platnye-podpiski-na-megafone/">Abonimet e paguara në Megafon - kontrolloni, çaktivizoni</a></li> </ul> </div> </li> </ul> </div> </div> </div> </div> <div class="footer"> <div class="footer_brick"> <div class="footer_brick_box"> <div class="footer_brick_1"> <div class="footerwidget"> <ul> </ul> </div> </div> <div class="footer_brick_3"> <div class="footerwidget"> <ul> </ul> </div> </div> </div> </div> <div class="footerin"> <div class="footerin_1"> <span> Montimi © 2021 Gadgets Mobile dhe Kompjuterike</span> </div> </div> </div> </div> <script> jQuery(document).ready(function() { jQuery("img.lazy").lazy(); }); </script> <script type='text/javascript'> /* <![CDATA[ */ var thickboxL10n = { "next": "\u0414\u0430\u043b\u0435\u0435 \u2192", "prev": "\u2190 \u041d\u0430\u0437\u0430\u0434", "image": "\u0418\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0435", "of": "\u0438\u0437", "close": "\u0417\u0430\u043a\u0440\u044b\u0442\u044c", "noiframes": "\u042d\u0442\u0430 \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u0442\u0440\u0435\u0431\u0443\u0435\u0442 \u043f\u043e\u0434\u0434\u0435\u0440\u0436\u043a\u0438 \u043f\u043b\u0430\u0432\u0430\u044e\u0449\u0438\u0445 \u0444\u0440\u0435\u0439\u043c\u043e\u0432. \u0423 \u0432\u0430\u0441 \u043e\u0442\u043a\u043b\u044e\u0447\u0435\u043d\u044b \u0442\u0435\u0433\u0438 iframe, \u043b\u0438\u0431\u043e \u0432\u0430\u0448 \u0431\u0440\u0430\u0443\u0437\u0435\u0440 \u0438\u0445 \u043d\u0435 \u043f\u043e\u0434\u0434\u0435\u0440\u0436\u0438\u0432\u0430\u0435\u0442.", "loadingAnimation": "https:\/\/3ddroid.ru\/wp-includes\/js\/thickbox\/loadingAnimation.gif" }; /* ]]> */ </script> <script type='text/javascript' src='/wp-includes/js/thickbox/thickbox.js?ver=3.1-20121105'></script> <script type='text/javascript' src='https://3ddroid.ru/wp-content/plugins/contact-form-7/includes/js/scripts.js?ver=4.9.2'></script> <script type='text/javascript' src='/wp-includes/js/backbone.min.js?ver=1.2.3'></script> <script type='text/javascript' src='https://3ddroid.ru/wp-content/plugins/custom-contact-forms/wp-api/wp-api.js?ver=1.2'></script> <script type='text/javascript' src='https://3ddroid.ru/wp-content/themes/blueblog/js/menu.js?ver=1.0'></script> <script type='text/javascript' src='https://3ddroid.ru/wp-content/themes/blueblog/js/scrolltotop.js?ver=1.0'></script> <script type='text/javascript' src='https://3ddroid.ru/wp-content/themes/blueblog/js/responsive_nav.js?ver=1.0'></script> <script type='text/javascript' src='https://3ddroid.ru/wp-content/themes/blueblog/js/jquery-menuscrolltofixed.js?ver=1.0'></script> <script type='text/javascript' src='https://3ddroid.ru/wp-content/themes/blueblog/js/search.js?ver=0.1'></script> <script type='text/javascript' src='https://3ddroid.ru/wp-content/themes/blueblog/js/jquery.bxslider.min.js?ver=4.1'></script> <script type='text/javascript' src='https://3ddroid.ru/wp-content/themes/blueblog/js/jquery_bxslider_min_load.js?ver=4.1'></script> <script type='text/javascript' src='https://3ddroid.ru/wp-content/themes/blueblog/js/jquery.swipebox.js?ver=1.0'></script> <script type='text/javascript' src='https://3ddroid.ru/wp-content/themes/blueblog/js/swipebox-ios-orientationchange-fix.js?ver=1.0'></script> <script type='text/javascript' src='https://3ddroid.ru/wp-content/themes/blueblog/js/jquery_swipebox_min_load.js?ver=1.0'></script> <script type='text/javascript' src='https://3ddroid.ru/wp-content/themes/blueblog/js/jquery.lazy.min.js?ver=0.1.6'></script> <script type='text/javascript' src='/wp-includes/js/wp-embed.min.js?ver=4.8.4'></script> </body> </html>