Как начать пользоваться школой!

Интересно? Полезно?
Подпишись на обновления в блоге одним кликом!
Реклама на блоге
Начинаем знакомство с лучших постов
Бронирование гостиниц
Продвижение сайтов


Rambler's Top100
Рейтинг блогов

Powered by  MyPagerank.Net
Яндекс цитирования

Моя аська: 155ноль54семь9 (всегда invisible)
Мой скайп: remarka.reklama
Мой емайл: masterxbablorub@gmail.com

понедельник, 28 марта 2011 г.

Базы Пастухова

Если человек просит, то чаще всего я не отказываю, если в просьбе есть хоть толика здравого смысла. А когда ее подкрепляют хорошим подарком, то и вовсе отказать нельзя. Тем более, что рассказать просят о самом подарке.

Итак, я стал обладателем лицензионной версии баз Пастухова. Вся соль там не в большом количестве собранных кеев, хотя я подозреваю, что сам Макс больше гордится именно своими коллекциями. Но есть и другие базы кеев, а вот своей оболочкой могут похвастаться лишь немногие. Так что в основном речь будет идти имено об оболочке и ее работе.

База состоит из программы (скачивается с сайта) и баз (скачиваются с торрента при сайте). Скорость вполне приемлемая, но на 10Гб (их потом еще распаковать надо) у меня все равно ушло больше суток. Дальше нехитрый процесс установки. Программа имеет, как я понимаю, серверную привязку. Так что после установки вам надо будет ввести логин и пароль, выданные при покупке. Сами базы зашифрованы и по сути бесполезны без программы.

После этого запасаемся терпением и ждем, пока программа прожует что-то там. Мультиков не показывают в это время, так что спокойно занимаемся своими делами. После того, как оболочка загрузится, надо будет создать что-то вроде своего проекта, который будет храниться на сервере Пастухова, как бэкап ваших выборок. Несколько странное решение, ну да ладно. Создали.

Следующий шаг: подключение баз. Не все так просто, как казалось - не понял я без прочтения мануала в чем отличие папок связей от папок баз, но методом тыка угадал. Собственно, на этом все с установкой - переходим к работе.


Сама работа с базой довольно проста: создаем внутри нашего проекта подпроекты и каждый такой проект формирует выборку. На основе выборок можно делать подвыборки. Из подвыборок - подподвыборки и так далее. Можно делать минус-выборки, когда выбирается все, кроме минус-слова: к примеру, если вам надо исключить какой-то мусор.

Результат можно экспортировать в файл. Дальше - используйте по своему усмотрению. Однако, не рассчитывайте, что вы получите идеальный результат. Придется поработать и руками. Я фильтровал еще знаки плюса, кавычки одинарные и двойные, слеши, тире. Есть и откровенно мусорные кеи вроде "надежный дрели, прокат электроинструмента екатеринбург лучший выбор 008/11/page/2" - сомневаюсь в достаточной частотности такого кея, чтобы он мог попасть в выборку. Впрочем, если сравнивать с другими базами, то база все-таки достаточно чистая.

Однако, отойдем от самой базы и поговорим о полезности таких баз. Раньше как-то было принято считать, что кеи собираются в основном для дорвеев. Сегодня ситуация несколько изменилась, и базы кеев сейчас продуктивно используют для работы с контекстной рекламой и в продвижении сайтов.

Мне в основном база пригодилась для подготовки рекламной кампании в адвордсе. Немного поработав, я надергал несколько тысяч кеев по нужной мне тематике и увеличил число ключей в разы. Не могу сказать, что траффик полился дождем - тематика у меня не та, но прирост на 20-30% могу отметить вполне достоверно. Прошел уже месяц, так что статистики у меня более чем хватает.

Любителям работать с НЧ в плане сео база пригодиться для оптимизации внутренних страниц. Сделали выборку, отобрали фразы с интересной вам частотностью и вперед - работать со страницами.

Со всей этой работой Базы Пастухова справляются неплохо. Конечно, выборка идет не быстро, а мой шестигиговый комп нехило нагибается, конечно, есть ошибки и в этих выборках, но лучшего инструмента на рынке пока нет и вряд ли скоро появится. Я бы сказал, что это разумное вложение капитала для тех, кто собирается работать с клиентскими или своими проектами в плане привлечения траффика с поиска или из контекста: по просьбе товарища, за 15 минут я дернул ему базу по "новогодние подарки" и, возможно, обеспечил ему несколько заказов, которые с лихвой перекроют его возможные траты на эту базу.

Глупо хвалить лидера рынка. Ругать? Да тоже ни к чему. Скорее, я просто напомнил, что такие базы есть, а вложенные в их покупку триста баксов окупятся достаточно быстро. Видимо, это и есть основная цель такого количества обзоров по базам Пастухова. Напомнить.

Впрочем, есть одна штука, которая дико раздражает - это постоянное соединение с Интернет. Какие-то бэкапы, проверки. Было бы неплохо иметь возможность задавать частоту обращения к сайту Пастухова. И, откровенно говоря, на этом фоне не только развивается паранойя, но и приходят мысли о том, что будет, если сайт вдруг ляжет.

Если это вас не беспокоит, то вот сайт: pastukhov.com

Майл Максима: support@pastukhov.com, отвечает быстро.

Блиц-интервью с Максимом:

Откуда собираются кеи, кроме вордстата?

Кеи собираются также с Google Adwords. В основном это, конечно, английские базы, для которых собираются не только кеи, но количество запросов в месяц с широким соответствием и ценой клика для рекламодателей Google Adwords.

Почему в кеях так много мусорных кеев с одинарными кавычками, слешами, тире, двойными кавычками?


В интернете и, соответственно, у поисковых машин собрано много мусорных запросов, и, конечно, при сборе баз они тоже попадают. Отфильтровать всех их невозможно физически. База, конечно, фильтруется после сбора от мусора с использованием различных фильтров, как грамматических так и лексических, но все-равно все вычистить невозможно.

Как за один шаг сделать вычитание. например, выбрать "подарки", а потом убрать из них все где есть "новый год"?

Для этого в полученной выборке по слову "подарки" нужно просто сделать новый фильтр по ключевым словам используя фильтр Не содержит ни одного из слов и ввести "новый год".

Год запуска продукта в продажу, т.е. сколько лет на рынке?


Базами я занимаюсь с 2007 года. Сперва это были небольшие базы. например русская 10 млн., потом английская 44 млн. Теперь алгоритмы сбора баз сильно изменились и улучшились, поэтому и размер новых баз стал гораздо больше - 170 млн. русская и 245 млн. английская.


---------------------------------
Подпишись на обновления в блоге одним кликом! Читать на твиттере! :: Реклама в блоге


5 коммент.:

Хотел бы я их, бле, протестировать.

нереальная цена отодвигает этт продук до лучших времён. ((

Анон, кстати, прав.
Но думаю это того стоит.

Большая цена это хорошо.
Чем меньше школьников в любом бизнесе - тем лучше.

База очень хорошая и очень дорогая. Пока пользоваться приходиться Магаданом

Отправить комментарий

Популярные сообщения

Эту страницу: Twitter Facebook Favorites More