Skip navigation

Sign up | Lost password? | Help

Идеология дорвеестроения

мысли по поводу и без

Keywords, Related and document scope

Естественно что без кивордов мы далеко не уедем. Долго думать не хотелось. Есть Увертюра - нужны киворды. Чтоб глубже рыть, сделал его рекурсивным. Чтоб шире - добавил adwords от гугли. Так появился на свет мой икстрактор кивордов.

На сайте выложена ранняя версия скрипта. Дополнительно был разработан более функциональный скрипт, который дает полный расклад: проверяет биды и определяет колво сайтов в гугле по киворду. Причем эту последнюю цифру я брал не из google API - нашел другой сервис с реальными цифрами. Если кому понадобится - обращайтесь.



Дальше то что?
Кивордов куча - а толку мало
Можно конечно доров нагенерить с одними только кивордами. На страницу пихать все которые найдем, содержащие нужное нам слово.
Скушно...
Не пойдет...

Можно еще травилку бидов прикрутить не скажу откуда. И получить свой первый список самых дорогущих.
Вот это интересней...

По слову 'buy' мне удалось выкурить около 25000 кивордов
Из них 138 стоили больше доллара.
Ух!!

Воодушевленный результатами, я взялся за написание генератора - 'киворды + цепи маркова'.
Ну написал. Ну работает.
Скучно...

И тут возникла подлая мысль:
- А почему это гуглю должны тревожить наши киворды, да еще и дико намешанные. Допустим два киворда содержат слово 'xanax': buy cheap xanax и какойнить xanax intoxication. Это же совершенно разные вещи. Те один киворд дискредитирует второй в смысле общей темы документа. Мое ИМХО, что у гугли свои понятия о близости кивордов.

Значит нужно анализировать serp. Допустим первые сто сайтов. И выделить в них общие ключевые фразы статистическими методами. По этому поводу нашел даже диссертацию на русском! С алгоритмом! Афтор - лапочка. В общем пришлось мне снова браться за перл. В итоге из под моих чутких пальцев вышла новая программа, которая по указанному запросу анализировала сайты из выдачи гугли (не сами сайты, а их закешированные версии) и выдывала чаще всего употребляемые слова и слова, их окружающие.
Вот это уже что-то...
Результат!!
Правда же?

Второстепенный, но результат.


Цепи марковаБЛИНгвистика

Write a comment

Comment
(BBcode and HTML is turned off for anonymous user comments.)

Please type this security code : af1f57

Smilies

January 2009
S M T W T F S
December 2008February 2009
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31