შანსი ინდექსი php თემა powered by smf. მესამე გაკვეთილი. ულამაზეს ბაზებს დამოუკიდებლად ვირჩევთ
მოდით შევხედოთ კოდს მთავარ სკრიპტში:
#!/usr/bin/perl
# which-forum.pl სკრიპტი
# (გ) 2010 ალექსანდრე ალექსეევი, http://site/
მკაცრი გამოყენება;
# მონიშნული რიგები - სიჩქარისთვის
# როგორ დაზოგოთ - შეაგროვეთ ძრავის სტატისტიკა, წაშალეთ როგორ
# როგორ შევადგინოთ ფორუმების სია - კომენტარი
ჩემი $მონაცემები;
$data .= $_while (<>
)
;
# შეამოწმეთ რამდენი ფუნქციონირებს phpBB სარდაფში გამოქვეყნების გარეშე თქვენ ნახავთ ამ სხვა სკრიპტებს, რომლებიც გამოვლენილია პოსტში თქვენს არქივში. სკრიპტი which-forum.pl html-ისტორიის კოდი გამოიყენება იმის უზრუნველსაყოფად, რომ ფორუმის ძრავის ხელმოწერები აშკარაა. ჩვენ გამოვიყენეთ მსგავსი ტექნიკა WordPress-თან და Joomla-სთან, ასევე რამდენიმე ადმინისტრატორთან. პირველ რიგში, თავად სკრიპტი არ კითხულობს გვერდით კოდს, მაგრამ კითხულობს მას stdin-დან ან არგუმენტად გადაცემული ფაილიდან. ეს საშუალებას გაძლევთ შეხვიდეთ გვერდზე ერთხელ, მაგალითად, wget-ის გამოყენებით და შემდეგ გაუშვათ იგი რამდენიმე ანალიზატორის საშუალებით, რადგან მათგან ერთზე მეტია. სხვა სიტყვებით რომ ვთქვათ, სცენარის ხელმოწერა არის 100% ძრავის ხელმოწერა. ბოლო დროს, ხელმოწერის ხილვადობამ გაზარდა მთავარი ძრავის სიძლიერე და ძრავა „გააძლიერა“ მაქსიმალური სიმძლავრით. მე მჯერა, რომ ამ შემთხვევაში ასეთი მიდგომა არ არის კარგი კოდის შედგენისთვის. სცენარის რობოტის გასაპროტესტებლად, ცოტა კვლევა ჩავატარე. მე შევადგინე ათიათასობით ფორუმის სია და გავატარე ჩემი სკრიპტი, რომელიც აჩვენებდა აპლიკაციების რაოდენობას და სხვადასხვა ძრავების პოპულარობას. ფორუმების სიის მისაღებად, მე სწრაფად გამოვიყენე ჩემი Google პარსერი. Ხმის სისტემაშეეცადა ეკითხა ბიჭი საიტი:forum.*.ru Და ასე შემდეგ. თქვენ შეგიძლიათ იპოვოთ შეკითხვის გენერატორის სრული კოდი ფაილში gen-forumsearch-urls.pl. Krim zone.ru ასევე vikorized.su.ua.kz and.by. ბოლო დროს, მნიშვნელოვანი იყო ასეთი გამოძიების ჩატარება, რადგან WordPress და Joomla საიტების უმეტესობა არ შეიცავს ასეთ ხელმოწერებს URL-ში. კატალოგები, როგორიცაა cmsmagazine.ru/catalogue/ არ იძლევა საკმარის ინფორმაციას შერჩევის შესახებ. რა არის 600 საიტი Drupal-ზე? ზედმეტია იმის თქმა, რომ ექსპერიმენტის შედეგებმა დამაბნია. მონიტორინგის 12590 საიტიდან მხოლოდ 7083 საძიებო სისტემა იყო წარმატებული, რაც შედეგების 56%-ზე ნაკლებია. იქნებ არცერთ ძრავს არ მოვიტყუე? Bitrix ისევ დგას ფორუმის ნახევარზე? რატომ ხარჯავთ ერთ საათზე მეტს ხელმოწერების ძებნაში? ბოდიშს გიხდით, აქ არის დამატებითი გამოკვლევების საჭიროება. წარმატებით დანერგილი ძრავების 56%-ს შორის, ყველაზე პოპულარული, შედეგად, იყო IPB (31%), phpBB (26.6%) და vBulletin (26.5%). მათ მოჰყვება SMF (5.8%) და DLEForum (5.3%). ჩემი სიყვარული punBB ნაკლებად გამოჩნდა 6 ადგილზე (1,64%). მე დიდად არ დავიჯერებდი ამ ციფრებს (რომ ვთქვი, მესამე ფორუმი RuNet-ზე მუშაობს IPB-ზე), მაგრამ შესაძლებელია ფულის გამომუშავება. მაგალითად, თუ თქვენ აპირებთ საიტის ფუნქციონირებას ფორუმზე და გეგმავთ ფორუმის შეცვლას, ვთქვათ, გადაუხადოთ ტრეიდერებს $0,01 თითო სკინზე ფასების ავტომატურად ჩვენებისთვის კვირაში ერთხელ, მაშინ უნდა აირჩიოთ სამი საუკეთესო პოპულარული ძრავიდან ერთ-ერთი. რაც უფრო პოპულარულია ფორუმი, მით მეტია შანსი იპოვოთ პროგრამისტი, რომელიც კარგად გაიგებს. თუ რეალური ცვლილებები არ გადადის ძრავზე, მაშინ შესაძლებელია ისეთი ნაკლებად პოპულარული ძრავის არჩევა, როგორიცაა SMF ან punBB. ამ გზით თქვენ შეცვლით ჰაკერების თავდასხმების რაოდენობას თქვენს ფორუმზე და სპამის რაოდენობას, რომლებიც ავტომატურად იგზავნება თქვენს ახალ ფორუმზე. ფორუმების ძიების/გამოყენების სკრიპტებს ასევე შეიძლება ჰქონდეთ ერთზე მეტი პრაქტიკული გამოყენება. პირველი რაც გამახსენდა არის TIC-ის მიერ აღიარებული ფორუმების მიხედვით დალაგება და თქვენს ერთ-ერთ საიტზე გაგზავნილ პირველ ას პოსტზე. თუმცა, ასობით ფორუმის dofollow-პოსტერი არ მოხვდა TIC-ში (გავიდა 2 განახლება), ამიტომ ჯობია აქ ერთი საათი არ დაკარგოთ, რადგან წინსვლა არ შეგაწუხებთ. ნათელია, რომ სკრიპტების რაოდენობა შორს არის ერთგვაროვანი. მე ვფიქრობ, რომ თქვენ შეგიძლიათ მარტივად გაერკვნენ, თუ როგორ უნდა მოაწყოთ ისინი. Botmeister Labs-ის ორგანიზება დაგეგმვის გარეშე. დრო არ არის, ვიდეო კონკურსისთვის საჭიროა, როგორც ახალი ტრენდი, თუმცა ყველაფერი უფრო მარტივად აიხსნება კარგი სკრინშოტებით (ჩემი IMHO), მაგრამ განსაკუთრებით არ მინდა არაფრის დაწვა. ტიმს უკვე ცოტა მოგება აქვს მოკლებული, სულელური სპამი აღარ არის კონტროლირებადი, საჭიროა ფიქრი და მათთან ერთად არავის დაწვავ, რადგან მხოლოდ ფხიზლები ცდილობდნენ ნამსხვრევების ჭურჭელში ჩაყრას და ფხვნილს. :) ალე ჩვენზე არ არის. თუმცა, ეს სამი „არა“, ვფიქრობ, ძირითადად, ყველაზე პოტენციური მონაწილეებისთვის კონკურსში მონაწილეობის ბარიერი გახდა. აქ, ისევე როგორც მანქანის შეკეთებისას, სამი რამ არის: იაფი, გამჭვირვალე, სწრაფი - სერვისმა შეიძლება დაკარგოს ორზე მეტი გონება ერთდროულად. დაჯექი და აირჩიე რა არის შენთან ყველაზე ახლოს. :) კონკურსი იგივეა: ვიდეოზე მუშაობის დრო არ არის, მაგრამ თემა არ არის, მაგრამ დრო საერთოდ არ არის, ან დრო არ არის გამოჩენის დრო და ცოტა სიბნელეა, მაგრამ ვიდეო არა სამუშაო. ალე ცე კარგი, იაკჩო ერთი საათი 2 დაფიქრდი. კარგი, მოდით გადავიდეთ ლექსებზე. ჩემს თავზე ვისაუბრებ. დაგეგმვის გარეშე, ეს ნიშნავს, რომ მე ვმონაწილეობ კონკურსში, ავირჩიე სტატიისთვის ხმის მიცემა. რაც არ უნდა თქვათ, Doz-ის კარგმა პროგრამამ იცის და მისი ვიკორიზაციაც კი მიზანშეწონილია. სწორედ დღეს გავიგეთ, რომ კონკურსს გარკვეული ინტრიგა ჰქონდა. გამოდის, რომ ხმას ვერ ვიღებ, მაგრამ მათ შეუძლიათ იმუშაონ მხოლოდ ახალწვეულებზე, რომლებსაც 2011 წლის გამოცემაში პროგრამული უზრუნველყოფის დამატებით ექნებათ სადაზღვევო კონკურსი. ზდივუვავსია ცოტა, ალე ჰოსპოდარ - ბატონო. კონკურსი სარეკლამო კამპანიაა და ოლექსანდრმა იცის როგორ წარმართოს იგი. თუმცა, სტატიის დაწერის შემდეგ, უფრო ადვილია წერა, თუ ვინმესთვის გასაგებია, შეუძლებელია ყველამ ჭეშმარიტად იმუშაოს. უზრუნველყოფილია php-Fusion-ის მიერ Khrumer 7.07 ვერსიისთვის, პროგრამას აქვს რამდენიმე ახალი ძრავა: forumi.biz, forumb.biz, 1forum.biz, 7forum.biz და ა.შ. phpBB-fr.com, Solaris phpBB თემა და რაღაც ახლის დაწყების პროცესი უსასრულოდ რთულია. "იმუშავებს SMF 1.1.2-ით" "იმუშავებს SMF 1.1.3-ით" "იმუშავებს SMF 1.1 RC2" "იმუშავებს SMF 1.1.4-ით" "იმუშავებს SMF 1.1.8-ით" "იმუშავებს SMF 1.1.7-ით" "2006-2008, შპს "სიმპლ მაინსი" უფრო მეტიც, ეს ყველაფერი არ არის. სხვადასხვა SMF ფორუმებზე ძრავის ვერსიების არჩევისას, ქვედა კოლონტიტული აჩვენებს „2001-2006, Lewis Media“. ჩვენ ვამოწმებთ ამ კითხვას, ისიც სრულიად გვაკმაყოფილებს. ნაცნობი მსგავსი სათაური: "2001-2005, Lewis Media". ქვედა კოლონტიტულის გადახვევისას არის ნაცნობი ჩანაწერი: „SMFone design by A.M.A, პორტირებული SMF 1.1-ზე“. დამოწმებული - დამოწმებული. Და ასე შემდეგ. ის კარგად მუშაობს და თქვენ გაქვთ მოთხოვნის მშვენიერი მონაცემთა ბაზა ძრავზე, და Google აგიკრძალავთ შეკითხვის მონაცემებს ბევრად უფრო ადრე, ვიდრე მათში გამარჯვებული იქნებით ოპერატორების მიერ. და ამავდროულად, თქვენი მონაცემთა ბაზა სრულიად სუფთა იქნება, რადგან თქვენ აკრიფებთ რაღაცას „index.php?topic=", ასე რომ აქ Google მოგაწოდებთ არა მხოლოდ ჩვენთვის საჭირო ფორუმებს, არამედ ბუნებრივი რესურსების სიმდიდრეს. , სადაც დაკარგეთ თქვენი პოსტი ფორუმის თემაში. შეგიძლიათ თქვათ ჯვარედინი კითხვა, მაგრამ რა არის ამაში საზიზღარი? სხვებმა წაგვართვეს მესიჯი, ასე შეგვიძლია. ელე! დაპირება შეიძლება გააუქმოს არა მარტო ხრუმერმა, არამედ სხვა პროგრამებმაც. უფრო მეტიც, ისინი შეიძლება სპეციალურად გამკაცრდეს, რათა ჩამოერთვას კომენტარებს სიმღერის რესურსი, ასე რომ, მაღალტექნოლოგიური პროგრამული უზრუნველყოფის სათაურები და ასეთი შეტყობინებები შეიძლება ჩამოერთვას ხელიდან. კიდევ ერთხელ გავიმეორებ, ჩვენთვის მნიშვნელოვანია არა სმაკის რაოდენობა, არამედ სიკაშკაშე, საფუძველი, სწორი კითხვებით და ასე მივიღებთ მას. პლუს ამ მეთოდითასევე იმის გამო, რომ პრაქტიკულად არ დაგჭირდებათ მისი შეკეთება ხრეფერში sieve-ფილტრი
伟哥 - ვიაგრა 吉他 - გიტარა 其他 - სარემონტოდ 保险公司 - დაზღვევა Words ფაილში განთავსება და მათ შემცვლელი კოდები: %E4%BC%9F%E5%93%A5 %E5%90%89%E4%BB%96 %E5%85%B6%E4%BB%96 %E4%BF%9D%E9%99%A9%E5%85%AC%E5%8F%B8 თუ იყენებთ საიტს დაზღვევისთვის, მაშინ განათავსეთ თქვენი შეტყობინება თქვენს პროფილზე ძიებაში ნაპოვნი თემატურ (!) ჩინურ ფორუმზე. SMF ფორუმი" 保险公司მართლა ცუდი იქნება.
დაბეჭდეთ "phpbb \n"
თუ ($data =~ /]+href="[^"]*http:\/\/(?:www\.)?phpbb\.com\/?"[^>]*>phpBB/iან
# $data =~ /viewforum\.php\?[^""]*f=\d+/i ან
$data =~ /phpBB\-SEO/i ან
$მონაცემები =~ /)
;
ბეჭდვა "ipb \n"
თუ ($data =~ /]+href="[^"]*http:\/\/(?:www\.)?invision(?:board|power)\.com\/?[^"]*"[^>]*> [^<]*IP\.Board/i
ან
$მონაცემები =~ /]+href="[^"]*http:\/\/(?:www\.)?invisionboard\.com\/?"[^>]*>Invision Power Board/iან
$მონაცემები =~ /
$მონაცემები =~ /index\.php\?[^""]*showforum=\d+/i)
;
ბეჭდვა "vbulletin \n"
თუ ($data =~ /მხარდაჭერით:?[^<]+vBulletin[^<]+(?:Version)?/i
ან
$მონაცემები =~ /)
;
ბეჭდვა "smf \n"
თუ ($data =~ /]+href="[^"]*http:\/\/(?:www\.)?simplemachines\.org\/?"[^>]*>მხარდაჭერით SMF/iან
$მონაცემები =~ /index\.php\?[^""]*board=\d+\.0/i)
;
ბეჭდვა "punbb \n"
თუ ($data =~ /]+href="[^"]*http:\/\/(?:(?:www\.)?punbb\.org|punbb\.informer\.com)\/?"[^>]*> PunBB/i); #ან
# $data =~ /viewforum\.php\?[^""]*id=\d+/i);
ბეჭდვა "fluxbb \n"
# if($data =~ /viewtopic\.php\?id=\d+/i ან
თუ ($data =~ /]+href="http:\/\/(?:www\.)fluxbb\.org\/?"[^>]*>FluxBB/i)
;
ბეჭდვა "exbb \n"
თუ ($data =~ /]+href="[^"]*http:\/\/(?:www\.)?exbb\.org\/?"[^>]*>ExBB/i); # ან
# $data =~ /forums\.php\?[^""]*forum=\d+/i);
ბეჭდვა "yabb \n"
თუ ($data =~ /]+href="[^"]*http:\/\/(?:www\.)?yabbforum\.com\/?"[^>]*>YaBB/iან
$data =~ /YaBB\.pl\?[^""]*num=\d+/i ) ;
ბეჭდვა "dleforum \n"
თუ ($data =~ /\(მოწყობილია DLE ფორუმის მიერ\)<\/title>/მეან
$მონაცემები =~ /]+href="[^"]+(?:http:\/\/(?:www\.)?dle\-files\.ru|act=საავტორო უფლება)[^"]*">DLE ფორუმი<\/a>/მე)
;
ბეჭდვა "ikonboard \n"
თუ ($data =~ /]+href="[^"]*http:\/\/(?:www\.)?ikonboard\.com\/?[^"]*"[^>]*>Ikonboard/iან
$მონაცემები =~ /\n"
თუ ($data =~ /\n"
# if($data =~ /forums\.php\?fid=\d+/i ან
# $data =~ /topic\.php\?fid=\d+/i ან
თუ ($data =~ /]+href="http:\/\/(?:www\.)?flashbb\.net\/?"[^>]*>FlashBB/i)
;
ბეჭდვა "stokesit \n"
# if($data =~ /forum\.php\?f=\d+/i ან
თუ ($data =~ /]+href="http:\/\/(?:www\.)?stokesit\.com\.au\/?"[^>]*>[^\/]*Stokes IT/i)
;
ბეჭდვა "პოდიუმი \n"
# if($data =~ /topic\.php\?t=\d+/i ან
თუ ($data =~ /]+href=[""]?http:\/\/(?:www\.)?sopebox\.com\/?[""]?[^>]*>პოდიუმი/i)
;
ბეჭდვა "usebb \n"
# if($data =~ /forum\.php\?id=\d+/i ან
თუ ($data =~ /]+href="http:\/\/(?:www\.)?usebb\.net\/?"[^>]*>UseBB/i)
;
ბეჭდვა "wrforum \n"
# if($data =~ /index\.php\?fid=\d+/i ან
თუ ($data =~ /]+href="http:\/\/(?:www\.)?wr\-script\.ru\/?"[^>]*>WR\-ფორუმი/i)
;
ბეჭდვა "yetanotherforumnet \n"
თუ ($data =~ /კიდევ ერთი ფორუმი\.net/i ან
$მონაცემები =~ /default\.aspx\?g=posts&t=\d+/i)
;
საიტი:talk.*.ru
საიტი:board.*.ru
საიტი: smf.*.ru
საიტი: phpbb.*.ru
....
გრძელი შესავალი დასრულდა, ახლა საქმეზე.
რა სჭირდებათ დამწყებთათვის, თუ დაამატებენ ისეთ სუპერკომბინატს, როგორიც არის Xrumer+Hrefer კომპლექსი? ასეა, ისწავლეთ როგორ გამოიყენოთ ახალი იდეები და შექმენით ილუზიები, რომ თუ დაიწყებთ პროკლამაციების სპამს, შეგიძლიათ ფულის გამომუშავება. თუ ასე ფიქრობთ, სჯობს თქვენი გროშები ქველმოქმედებას გადასცეთ. თქვენ უნდა ისწავლოთ კომპლექსის ხელსაწყოების გამოყენება და აუცილებლად გაითვალისწინეთ ისინი საკუთარ თავზე. "აიღე მეტი - გადააგდე" საათი გავიდა. სისქე ივაჭრება გემრიელობის სანაცვლოდ. მაშ ასე, ჩვენთვის შევარჩიოთ ბაზა და თუ მუშაობას არ შეეგუებით, მატარებლიდან ჩამოხვალთ. ვინ დაგვეხმარება პირველ რიგში ხრეფერი. თუ თქვენ აპირებთ თქვენი რესურსების Google-ში ჩადებას, მაშინ ჩვენ ასევე უნდა მოვიძიოთ დონორთა საიტები Google-ის მეშვეობით. ვფიქრობ, ეს გასაგები და ლოგიკურია. ალე გუგლი, როგორც სპილენძის მთის მმართველი, თავის სიმდიდრეს ყველას არ უთმობს. აქამდე ეს მიდგომაა საჭირო. უბრალოდ იმის თქმა მინდა, რომ არ მოგატყუოთ იმ ნიშნებით, რომლებსაც წიგნში ნახავთ, შეგიძლიათ მიიღოთ ყველაფერი, რაც შეგიძლიათ. ისინი ასევე ხელმისაწვდომია საზოგადოებაში, მაგრამ ფასი სირცხვილია. თემას აღარ განვავითარებ. მოდით უკეთ გავიგოთ როგორ ავირჩიოთ სწორად, რომ მიიღოთ უკეთესი შედეგი, წინააღმდეგ შემთხვევაში თქვენ თავად შეისწავლით და გაიგებთ პრინციპს. აუცილებელია შევარჩიოთ სწორი კონკრეტული ძრავების ნიშნები, რომლებიც გვჭირდება და არა ფორუმების ნიშნები. ახალბედებისთვის მთავარი მიზანია არა კონკრეტულ საკითხზე კონცენტრირება, არამედ ყველაფრის შთანთქმის მცდელობა. ასევე, თუ გსურთ მეტ-ნაკლებად ნორმალური ბაზის გაანალიზება, განიხილეთ ოპერატორის მოთხოვნების გამოყენება. ჩვეულებრივი "inurl:", "site:", "title" და ა.შ. გუგლი დაუყოვნებლივ აკრძალავს ასეთ პრანკერებს. ამიტომ, ჩვენ საიმედოდ ვაძლიერებთ ძრავებს, რომლებითაც დღევანდელი მომენტიხრუმერი ამბობს:
თუმცა, ჩვენ უნდა მოვამზადოთ სწორი მოთხოვნები Hrefer-ის გარჩევისთვის. ავიღოთ ფორუმის საცავი კონდახისთვის SMF ფორუმები. დროა დაალაგოთ თქვენი იოგო სათადარიგო ნაწილების გარჩევისთვის. Google-ისადმი ჩვენი სიყვარული დაგვეხმარება. აკრეფილი Google-ში SMF ფორუმები- ამ მხრივ ბევრი ინფორმაციაა, გადახედე მე-13 გვერდს და აირჩიე გაგზავნილი თუ არა. მე წავაწყდი ამას: http://www.volcanohost.com/forum/index.php?topic=11.0. ეს არის მოქნილი და მოქნილი. ჩვენ უნდა ვიცოდეთ, რა არის ტიპიური საიტზე, რომელიც შეიძლება გამოყენებულ იქნას თქვენს ძრავზე სხვა საიტების მოსაძებნად. ქვედა კოლონტიტული აქვს მომავალი ნიშანი უზრუნველყოფილია SMF 1.1.14-ით, როდესაც დააჭერთ მას და შეიყვანთ Google-ში, ეს გვაჩვენებს, რომ ამ კითხვის უკან დაახლოებით 59 მილიონი ვარიანტია. ჩვენ განვიხილავთ შეტყობინებას, ვამატებთ ამ საკვანძო სიტყვას რამდენიმე სხვა ვარიანტს, მაგალითად, "იმუშავებს SMF 1.1.14" ვერხვიან კიდევ "მხარდაჭერილია SMF 1.1.14" viagra. მოდით გადავხედოთ რას დალევს ჩიკი, როგორც ფორუმის, ისე შესაძლოა თქვენი სმიტის თვალწინ.
ჩვენთვის, უფრო მეტიც, ეს არ არის ნაყოფის მოცულობა, არამედ სიტკბო, როგორც მე უფრო ხშირად ვამბობდი. მოდით წავიდეთ უფრო შორს. ამავე ფორუმიდან ვიღებთ კიდევ ერთ ფრაზას ქვედა კოლონტიტულიდან: , ასევე სასარგებლო და პოპულარული Google-ში. ანგარიში აჩვენებს, რომ მე მაქვს 13 მილიონზე მეტი შედეგი. კიდევ ერთხელ ვუყურებთ ხედს, ვამატებთ დამატებით სიტყვებს და მათთან ერთად ვამოწმებთ ხედს. ვაკეთებთ ხელახლა კონვერტაციას, რომ ჩამოირეცხოს და ფული არ იყოს. მეტიც, უკვე არის ორი ლითონის ელექტროგადამცემი ხაზი. მე გავაგრძელებ პირველი ფორუმის გამოყენებას, სანამ არ დავმშვიდდები და გავაგრძელებ კითხვების შეგროვებას სხვა ფორუმებიდან. საბედნიეროდ, Google ღიაა კითხვისთვის 2006-2008, მარტივი მანქანებიშპს. ჩვენ გავითვალისწინებთ, მაგალითად, ამ ფორუმს: http://www.snowlinks.ru/forum/index.php?topic=1062.0 და http://litputnik.ru/forum/index.php?action=printpage;topic =380.0 ქვედა კოლონტიტებში აქვთ შემდეგი სიტყვები: "Powered by SMF 1.1.7" და "Powered by SMF 1.1.10" (აკრიფეთ Khrefer-ისთვის, რომ წინასწარ ჩაიწეროს რაჯა, რადგან ჩვენ გვჭირდება იაკიტი პირველ ჩერგუში) . მე ვფიქრობ, როგორც ჩანს, რომ ჩვენ ვმუშაობთ, ჩვენ ვიპოვით SMF ძრავზე ფორუმების საძიებლად მოთხოვნების მონაცემთა ბაზას (მაგალითად, სხვა ძრავებთან, ეს მსგავსია).
ეს დაახლოებით ასე გამოიყურება:
ვაფასებ, რომ საწყის ეტაპზე კიდევ უფრო პატივისცემით სწავლობ ხრეფერთან კომპეტენტურად მოქცევას და ამას რომ ისწავლი, ყოველთვის შეგიძლია გაარკვიო, რომ ხრუმერი სტაგნაციაშია, თითქოს სიტუაცია არ შეცვლილა. პრობლემები გართულებულია და ყველა ტიპის ძრავაზე დაცვა გაძლიერდა და მისი მოგვარება შეუძლებელია ნარაზიხრუმერ, მაშინ აზრი არ აქვს რესურსების ფლანგვას ამ ლინკების შეგროვებაზე და შემდეგ მათ შემდეგ ხრუმერზე მუშაობაზე, უფრო სწორად, კონცენტრირდით თქვენს ძალისხმევაზე იმაზე, რაც შედეგს იძლევა. და ამავდროულად, ვინაიდან Botmeister Labs-ის გუნდმა ასწავლა ხრუმერს, რა არის ახალი, შესაძლებელია სწრაფად მოამზადოს ახალი პაციენტი და მოამზადოს ბაზა Khroomer-ისთვის, სანამ პაციენტი ჯერ კიდევ თბილია. ერთი საათი უმნიშვნელოა, რესურსი შეიძლება არ იყოს შესაბამისი, თუ მონაცემთა ბაზას იყიდით. კიმოები მოვაგროვე. გარდა ამისა, საკუთარი თავისთვის ბაზების სწორი შერჩევა მნიშვნელოვნად აფართოებს ხრუმერის "თეთრ" სტაგნაციას. და აქ ყველაფერი ინგრევა, რაც არ უნდა გვსურს, მაგრამ აღდგენის პროცესი გრძელდება. ჩერნიმ გაუწოდა, რატომ მხოლოდ შენ შეგიძლია ბოლომდე წასვლა.
რაშტა, უკვე ტექნიკური პუნქტებიხრეფერის რობოტები აღფრთოვანებული იქნებიან დახმარებაში და აზრი არ აქვს მათზე წუწუნს, ყველა თვალი-თვალი-წამი წინასწარ არის დაყენებული კანის აპარატისთვის ინდივიდუალურად.
ბონუსად, მე აქ ვდებ შაბლონს ჩინური საძიებო სისტემის Baidu-ს გასაანალიზებლად, ამაზე ვსაუბრობ დღეების განმავლობაში, შევქმენი ღერძი მარჯვნივ, გაითვალისწინეთ სიტყვა. :)
მასპინძლის სახელი=http://www.baidu.com
შეკითხვა=s?wd=
LinksMask=
სულ გვერდები=100
შემდეგი გვერდი =
შემდეგი გვერდი2=
CaptchaURL=
CaptchaImage=
CaptchaField=
მისი გაანალიზება რომ ვცადე, აკრძალვა არ ყოფილა, ხრეფერის რესურსები სწრაფად შეგროვდა, პარსინგის ყველა ჩანაწერი გუგლის მსგავსია, მაგრამ ჩინური რესურსები ზღვაა და მაღალი PR-ით და გარდა ამისა, ბევრი ადგილია. არცერთ ევროპელს ფეხი არ დაუდგამს. ჩინურ სასმელებთან გემო უკეთესია. თუ იყენებთ Google Translate-ს, ჩაწერეთ საკვანძო სიტყვების სია რუსულ ენაზე და თარგმნეთ ჩინურად. სიმართლე " სიტყვებისიტყვები ჩინურად არ იწერება, საჭიროა მათი ხელახალი კოდირება.
ჩინელების ჩანაცვლება:
დასასრულს, მინდა ვთქვა, რომ არავის ესმის იმ ადამიანების, რომლებიც გაბრაზებულები არიან მათზე, ვინც სისულელეა, მაგრამ მე მინდა ვთქვა, რომ მათ უბრალოდ ვერ მოამზადებ. კიდევ უკეთესი, თუ პარსერს არ შეუძლია შეარჩიოს vidach, უბრალოდ მოითხოვეთ სწორი. ხრეფერი მანქანაა: კარგი, მყარი, გერმანელის აშენებული, მაგრამ ადამიანია და ყველაფერი დევს, რადგან რაც არ უნდა გონივრული იყოს, არ შეიძლება მანქანის მართვა ერთდროულად მარჯვენა ხელით ან მარცხენა ხელით. .
ოკრემას თემაა ბაზების გაწმენდა, 3 წლის წინ ვითვლი მომავალ კონკურსს. ყველაზე მეტად, აქ ყველაფერი აქტუალურია, როგორც ადრე, გარდა 200 OK-ით ხელახალი შემოწმებისა, ახლა ხედავთ, თუმცა ეს პროცესი განსაკუთრებით არ იყო შესაფერისი, გატაცებებიც კი მშვენიერი იყო, ბევრი გართობა იყო გაფილტრული. ახლა უკვე შესაძლებელია პრაქტიკულად ავტომატურად იმუშაოს ხრუმერის რობოტის პროცესში, თუმცა ეს პროცესი არ არის ზუსტად იგივე, რაც "200 OK"-ის შემოწმებას. იმავდროულად, ცნობისთვის: ახლახან ხრუმერიაში გაჩნდა სასწაულებრივი უნარი - პროექტის განხორციელების დროს რესურსებიდან ინფორმაციის გაძარცვა. ეს ასე გამოიყურება. თქვენ შეიყვანთ შაბლონს, რომელიც დამუშავდება მუშაობის პროცესში, ხოლო შაბლონის უკან შეგროვებული ინფორმაცია შეიტანება xgrabbed.txt ფაილში Logs საქაღალდეში. ეს ფუნქცია შეიძლება განხორციელდეს მომავალში, ფანტაზიის ფრენა შესანიშნავია. კვირაში ერთხელ ვაგზავნიდი ამ vikory ფუნქციას სამუშაო მონაცემთა ბაზიდან ამოსაღებად "ვადაგასული". საიდუმლო არ არის, რომ ფორუმები დღეს კვდება; იმისათვის, რომ გავწმინდოთ ასეთი რესურსები მონაცემთა ბაზიდან, ჩვენ შეგვიძლია გამოვიყენოთ "Auto-Grab" ინსტრუმენტი, რომელიც დაგვეხმარება ამაში.
მოიცადე ერთი წუთით, ხშირად აკრიფე, მაგალითად, http://www.laptopace.com/index.php mi bachimo, ამ დომენით უკვე, მაგალითად, goddam არის დაკავებული და იქ ფორუმი არ არის. ასე რომ, ამოიღეთ წიდა ძირიდან, აითვისეთ წიდა. :) შეგიძლიათ ნახოთ გვერდის გასასვლელი კოდი და ასევე ეს ჩანაწერი:
ახლა ყველა "მოციმციმე" ჩვენთვის ხილული იქნება სახელით.
არის Autograb ინსტრუმენტის მცირე დამატება, თუ გსურთ მონაცემთა ბაზის გაწმენდა სხვადასხვა „ვადაგასული“ დომენებისგან: