Парсер вордпресс. Мій плагін WP Uniparser - універсальний парсер для автонаполненія блогу !!! Короткий опис функціоналу

Сфери діяльності, де може застосовуватися парсер, досить багато, але в основному це збір різної інформацію. Швидко зібрати картинки і посилання можна тільки програмно. Застосування парсеру для пошуку інформації дозволяє автоматизувати це процес, значно заощаджуючи час. Якщо у вас є сайт на wordpress, то ви легко зможете його зробити автонаполняемим за допомогою AftParser парсеру.

- це безкоштовний, універсальний парсер для WordPress. дозволяє збирати контент з одного або різних джерел, обробляючи його під потрібний форматна мові PHP. Парсер зроблений у вигляді плагіна для WordPress. Після звичайної установки плагіна в консолі wordpress з'явиться меню парсеру, як на картинці.

У парсером реалізовано два основні інструменти: парсер сайтів wordpress і rss парсер wordpress.

Парсер для WordPress вміє:

1.Парсіт дані по посиланнях

Треба лише вказати посилання на джерело. Якщо немає посилань їх можна зібрати парсером. Вкажіть шлях до карти сайту і граббер збере всі посилання. Або можна зібрати посилання з будь html сторінки. Посилання можна фільтрувати по потрібним критеріям. Присутній два фільтра посилань за допомогою яких можна змінювати умови парсинга. Досвідчені користувачі можуть самі складати макроси для парсинга, що робить парсер дуже гнучким під свої потреби.

2.Парсіт дані RSS стрічок

Тут все просто, вводите потрібний URL стрічки і натискаєте почати парсинг.
Одне з можливих застосувань парсеру для wordpress, це наповнення новинних колонок у себе на сайті, використовуючи такі джерела інформації, як блоги, rss стрічки, сторінки вконтакте і тд. Конкуренти - WP-O-Matic, FeedWordPress, CyberSyn.

Парсер для WordPress - це настройка Datacol, призначена для збору контенту (новини, статті, огляди і т.п.) з подальшим експортом в CMS WordPress.

У цьому прикладі експорт отриманого контенту здійснюється в. Результати по кожному посту зберігаються в окремий файл, назва якого генерується на базі назви посади, а вміст - на базі спарсенной інформації. Також можна налаштувати прямий експорт в ваш блог на WordPress. Як це зробити показано на відео.

Перевірити роботу парсеру для WordPress можна безкоштовно в демо-версії програми.
Основні переваги парсеру для WordPress на базі Datacol це:

  • Можливість донастройки парсинга для WordPress конкретно під ваші потреби (вами або).
  • Можливість, додатково обробити зібрані дані за допомогою плагінів а також завантажувати їх в.
  • Можливість циклічного запуску кампаній. Коли результати виконання першого завдання парсинга будуть вхідними даними для другого завдання зі збору даних. Детальніше .

Як використовується парсер для WordPress?

Якщо ви створили блог, то через якийсь час вам стає ясно, що для його просування постійно потрібен новий унікальний контент. А самостійно писати статті і наповнювати сайт вручну стає лінь. Але де ж взяти новий контент? Рано чи пізно приходить час, коли хочеться вдатися до автоблоггінгу. Простіше кажучи, використовувати парсер, який буде публікувати потрібну нам інформацію самостійно. Справитися з цим завданням нам допоможе парсер контенту для WordPress.

Всі сайти коли-небудь створювалися з нуля. Але якщо метою вашого сайту є надання інформації, він стане цікавим тільки тоді, коли обсяг інформації перевищить певну кількість. Парсер блогів WordPress - це прекрасне рішення для такого завдання. З його допомогою ви зможете за короткий час наздогнати конкурентів, істотно розширивши каталог інформації сайту. Парсер WordPress може бути реалізований у вигляді граббера для WordPress з конкретного сайту.

парсер для блогу WordPressможе допомогти у вирішенні безлічі завдань, ось деякі з них:
- первинне наповнення ресурсу (парсер сайтів для WordPress дозволить в найкоротші терміни провести наповнення блогу інформацією з нуля до необхідного обсягу);
- створення автонаполняемого блогу (парсер WordPress зможе забезпечити регулярне автообновление вмісту сайту)
- публікація контенту "за розкладом" (ви можете запланувати час додавання постів на ваш сайт)

Масовий постинг в WordPress

Парсер для WordPress, представлений в Datacol є наочним прикладом застосування парсеру для масового постінгу. Він дозволяє автоматично отримувати контент і публікувати його на своєму блозі. Процес парсинга WordPress можна розділити на кілька етапів:

1) Процес збору контенту. Парсер для Вордпресс збирає необхідну інформацію по кожному посту блогу: заголовок, контент (завантажується з картинками, які зберігаються на ваш комп'ютер для подальшого завантаження по FTP на ваш сервер), категорія, автор і посилання, з якої відбувався збір даних (URL).

2) Збереження інформації, зібраної парсером для WordPress. Після парсинга зібрана інформація зберігається TXT файли (кожен пост зберігається в окремий текстовий файл), імена яких генеруються відповідно до назви посади.

3) Експорт WordPress. Також є можливість прямого експорту спарсенной інформації в ваш блог на WordPress. Це робить процес наповнення дуже швидким і виключає можливість помилок, пов'язаних з людським фактором. Можливість експорту в Вордпресс передбачена в базовому функціоналі програми. Вам потрібно вказати в налаштуваннях програми було визначено відповідні установки до свого блогу і задати дані для експорту (заголовок, контент, категорію і т. Д.)

4) Обробка інформації. При бажанні зібрану в процесі парсинга WordPress інформацію можна обробляти (наприклад, піддавати автоматичному перекладу або сінонімізаціі). Ці можливості реалізуються за допомогою плагінів.

Чим Спарс сайт на Вордпресс?

Ви можете не тільки публікувати спарсенную інформацію в WordPress, але і можете парсити з нього. Завдання використання чужих WordPress блогів, як джерела контенту для своїх блогів, виникає досить часто. Для її вирішення вам допоможе парсер сайтів на WordPress. Алгоритм роботи парсера сайтів на WordPress аналогічний вищеописаному.

Переваги парсеру сайтів WordPress

Ви вже напевно переконалися в тому, що парсер блогів WordPress допоможе вам не витрачати багато часу і сил на ручне наповнення свого блогу. Завдяки йому ви зможете не тільки автоматизувати свою роботу, але і підвищите її ефективність. Завантажити парсер для WordPress, реалізований в рамках Datacol можна по

Тестування парсеру блогу

Щоб протестувати роботу парсеру блогу:

Крок 2. У дереві кампаній присутній кампанія content-parsers / kolchaka-net.par. Виберіть її та натисніть кнопку Запуск (Play). Перед запуском ви можете відредагувати Вхідні дані. Так ви зможете задати посилання на блог або на сторінки блогу, з яких будете парсити контент.

Крок 3. Дочекайтеся появи результатів роботи парсера блогів. Після появи результатів можна примусово зупинити парсинг (натиснувши кнопку Стоп).

клікніть на зображенні для збільшення

Крок 4. Після закінчення / примусової зупинки парсеру в папці Мої документи можна знайти текстові файли (кожен пост зберігається в окремий файл), назви яких генеруються на базі назв посад:

клікніть на зображенні для збільшення

Досить потужний універсальний парсер для WordPress. Дозволяє збирати контент з одного або декількох джерел і обробляти його, підганяючи під потрібний формат використовуючи всі можливості мови PHP. Присутня можливість відкладеного парсинга. Кращий безкоштовний парсер для wordpress на цей момент - AftParser завжди до ваших послуг!

Короткий опис функціоналу:

Парсер складається з 4х сторінок: Головною сторінки, Сторінки парсеру посилань, Сторінки парсеру RSS стрічок і сторінки налаштувань. Ось як все це буде виглядати після установки:

Увага:Як налаштувати AftParser можна прочитати.

Почнемо з головної сторінки. На ній відображається список парсеров, запущених в даний момент.

На кожній сторінці в блоках вказані пояснення. Вся документація поставляється з коробки, досить уважно почитати, щоб все стало ясно.

Парсер сайтів:

Сторінка парсеру сайтів дозволяє парсити дані як з одного, так і з декількох джерел. Необхідно лише вказати посилання на матеріали.

Що? Лінь копатися по мережі і в ручну збирати матеріали? Не впадайте у відчай - все автоматизовано.

Є два інструменти, які дозволяють наповнювати список посилань в автоматічскі режимі.

- своєрідна емуляція пошукової системи. Робот буде сам ходити по сторінках переданого в нього сайту і збирати з них все внутрішні посилання.

Природно, список посилань, наповнений автоматичними алгоритмами буде сильно засмічений непотрібними даними. І тут вам на помощ приходять фільтри.

- самий що ні на є простий і швидкий спосібфільтрації. Ви вбиваєте умови і фільтр сам виконує обробку.

Високий рівень фільтр посилань- фільтр посилань, що дозволяє міняти їх вміст і робити ще купу різних речей. Тільки для досвідчених користувачів. Раджу вивчити php, перед тим, як там то-небудь робити.

Якщо ви виконали збір посилань, то наступним кроком буде - додавання кордонів контенту.

За допомогою цих кордонів парсер буде визначати ділянки, які необхідно обробляти.

Підсвічування синтаксису реалізована засобами javascript редактора ACE. Вся документація і все доступні функціїнаводяться на сторінці плагіна. Список дуже значний і привести його тут я не можу, так як цей матеріал і так виходить дуже довгим. Просто встановіть плагін і прочитайте, ви будете вражені, я гарантую це.

Приблизно так-же виглядає і сторінка парсеру rss стрічок, З тією лише різницею, що там не потрібно приводити списки посилань.

Представляю вам універсальний WordPress граббер WP UniParser. Даний плагін є універсальним налаштованим парсером. При створенні постів плагін може здійснювати переклад контенту через сервіс Google Translate, використовуючи будь-які мовні пари.

Відгуки покупців

Тема на серч, де було близько 6-7 відгуків, була видалена модераторами (мовляв продукт не задовольняє правилам форуму). Проте один відгук можна почитати на форумі мульнета і армаді. Також є відгуки від блогерів: ось і ось. Зовсім недавно ще випадково натрапив на відгук.

Основна функціональність

Створений мною плагін WP UniParser вміє робити наступне:
витягати контент з сайтів на будь-яких двигунах(Парсер налаштовується за допомогою регулярних виразіві рядків обмежень, настройка дуже проста, я все поясню і покажу, крім того, до нього є);
вирізати з контенту скрипти, коментарі, посилання, форми, малюнки, спання, об'єкти, а також будь-які задані вами фрагменти.
планувати публікаціюпостів;
ложить распарсенние матеріали в певну вами категорію (або випадково розподіляти за категоріями);
здійснювати автоматичний переклад(В любою сторону) будь-якими мовами, які підтримує Google Translate.

З набором функцій плагіна можна докладніше ознайомитися на скріншоті його адмінки:

Також для повного розуміння роботи універсального граббера варто.

Іноді немає сенсу витрачати час на самостійне написання тексту для сайту WordPress. Цей випадок не стосується блогів і інфосайт, так як дохід на них формується саме завдяки розміщеним постам.

А мова йде про інтернет-магазинах, сайтах компаній та новинних порталах, Не розрахованих на органічний трафік. Ось для таких ресурсів унікальні матеріали - це не так важливо, як їх постійне оновлення.

Щоб зробити автонаполняемий сайт, вам знадобиться налаштувати парсер новин для вашого проекту. Для початку необхідно знайти підходящі майданчики, з яких ви будете парсити. Вони повинні відповідати тематиці вашого проекту, інакше немає сенсу дублювати з них інформацію. Якщо це так, тоді необхідно приступити до другої частини вирішення питання парсинга - це яким чином ви будете клонувати текст з іншого сайту. Найпримітивніший і незручний спосіб - це ручне копіювання. Але куди розумніше скористатися одним із наведених у цій статті плагіном, щоб активувати вдалий парсер новин і контенту.

WP-O-Matic

Вельми популярний модуль для WordPress, який дозволить вам налаштувати функціональний парсер новин з інших майданчиків. Встановлюється інструмент самим простим способом: Або через завантаження безпосередньо в папку на хостингу, або через вкладку "Додатки".

Далі вам належить налаштувати роботу плагіну, якщо хочете забезпечити парсинг контенту. Для цього достатньо чотири рази натиснути "Next" і в кінці "Submit". Таким чином, ви підтвердите згоду з правилами користування даним модулем WordPress. Зокрема, погодитеся з тим, що тільки ви несете відповідальність за крадіжку чужих матеріалів, утримання інших сайтів і т. Д.

Якщо крім текстової складової вас ще цікавлять картинки, тоді необхідно створити в папці з плагіном директорію під назвою Cache. Встановіть особливі права доступу до цієї папки. Далі вам належить повернутися в адмінку WordPress. Зайдіть в налаштування плагіна і уважно подивіться, чи немає галочки біля пункту Unix cron. Вам необхідно ствердно поставити галочку навпроти пункту Cache Image, щоб парсер новин також копіював і картинки до вас на ресурс.

Модуль WP-O-Matic хороший тим, що працює на будь-якій сторінці сайту. Ви зможете додати окрему рубрику, якщо хочете, щоб список новин і контенту, який надав парсер, відображався саме там. Для цього попередньо створіть необхідну рубрику. Потім в адміке WordPress в настройках інструменту WP-O-Matic натисніть Add Campaign. У рядку Categories відзначте галочкою створену вами спеціальну рубрику. А в формі Feeds пропишіть RSS стрічки, Яку ви зібралися парсити. Ви зможете прописати відразу кілька URL для стрічок, щоб парсер тексту збирав інформацію відразу з трьох або навіть чотирьох ресурсів.

І ще один величезний плюс в сторону плагіна WP-O-Matic - це автоматична публікація матеріалу. Вам не доведеться щогодини заходити в адмінку WordPress, щоб міняти статус постів на "Опублікований". Модуль зробить це самостійно. І якщо побажаєте, він може уникализировать текст через спеціальний механізм сінонімізаціі. У цьому ключова відмінність даного інструмент від його конкурента - плагіна FeedWordPress.

Datacol

Це функціональний граббер, який підходить не тільки для движка WordPress. Це не просто парсер тексту сторінок сайту - це розумне застосування, Яке дозволяє фільтрувати копіюється матеріал. Наприклад, ви зможете розміщувати тільки статті, в яких є певні ключові слова. Чи зможете дублювати новини прямо з Яндекса. Клоновані матеріали будуть експортуватися в одному з 15 доступних форматів. Сервіс збере не тільки текст, а й заголовки, фотографії, дату публікації, посилання і інші важливі дані.

Але Datacol поширюється на платній основі. Однак, він куди дешевше, ніж якби ви замовляли матеріал на сайт через біржі. Варто додаток менше 500 рублів і його можна використовувати практично для будь-якого движка. Є демо-версія.

FDE Grabber

Ще один платний парсер з великим числом функцій. Це вже з розряду дорогих граббер, так як обійдеться він приблизно в 90 доларів. Але використовувати його можна буде відразу на 10 серверах, тобто в теорії різні веб-майстра можуть скинутися по 9 доларів, здешевив таким чином покупку.

FDE Grabber - це не зовсім плагін для WordPress. Розробники називають своє творіння автономною системою, Яка працює незалежно від типу CMS, встановленої на сайті. Основні можливості цієї системи парсинга:

  • викачка повномасштабних новин або окремих фрагметов;
  • можна планувати публікації;
  • якщо хочете уникализировать дубльований матеріал, є вбудована функція сінонімайза;
  • можна працювати через проксі-сервери;
  • парсинг здатний обходити редіректи, які для інших плагінів можуть стати проблемою;
  • можна автоматично завантажити весь вміст з сайту і перемістити на вашу майданчик (якщо справа стосується не новинних порталів);

Ви зможете налаштувати парсинг повністю на власний розсуд, так як у програми є можливість впровадження мікропрограм для корекції роботи. Наприклад, так можна налаштувати особливості вирівнювання і оформлення копійованого матеріалу. Також ви зможете додати параметри noindex і nofollow для всіх посилань, які будуть в тексті сторінки. Парсер навіть дозволяє копіювати і автоматично перекладати статті з іноземних ресурсів. Це відмінний спосіб створити постійний потік контенту на ваші сторінки, який з часом почне залучати відвідувачів!