Keywords, Related and document scope
Tuesday, 4. October 2005, 07:56:03
Естественно что без кивордов мы далеко не уедем. Долго думать не хотелось. Есть Увертюра - нужны киворды. Чтоб глубже рыть, сделал его рекурсивным. Чтоб шире - добавил adwords от гугли. Так появился на свет мой икстрактор кивордов.
Дальше то что?
Кивордов куча - а толку мало
Можно конечно доров нагенерить с одними только кивордами. На страницу пихать все которые найдем, содержащие нужное нам слово.
Скушно...
Не пойдет...
Можно еще травилку бидов прикрутить не скажу откуда. И получить свой первый список самых дорогущих.
Вот это интересней...
По слову 'buy' мне удалось выкурить около 25000 кивордов
Из них 138 стоили больше доллара.
Ух!!
Воодушевленный результатами, я взялся за написание генератора - 'киворды + цепи маркова'.
Ну написал. Ну работает.
Скучно...
И тут возникла подлая мысль:
- А почему это гуглю должны тревожить наши киворды, да еще и дико намешанные. Допустим два киворда содержат слово 'xanax': buy cheap xanax и какойнить xanax intoxication. Это же совершенно разные вещи. Те один киворд дискредитирует второй в смысле общей темы документа. Мое ИМХО, что у гугли свои понятия о близости кивордов.
Значит нужно анализировать serp. Допустим первые сто сайтов. И выделить в них общие ключевые фразы статистическими методами. По этому поводу нашел даже диссертацию на русском! С алгоритмом! Афтор - лапочка. В общем пришлось мне снова браться за перл. В итоге из под моих чутких пальцев вышла новая программа, которая по указанному запросу анализировала сайты из выдачи гугли (не сами сайты, а их закешированные версии) и выдывала чаще всего употребляемые слова и слова, их окружающие.
Вот это уже что-то...
Результат!!
Правда же?
Второстепенный, но результат.
На сайте выложена ранняя версия скрипта. Дополнительно был разработан более функциональный скрипт, который дает полный расклад: проверяет биды и определяет колво сайтов в гугле по киворду. Причем эту последнюю цифру я брал не из google API - нашел другой сервис с реальными цифрами. Если кому понадобится - обращайтесь.
Дальше то что?
Кивордов куча - а толку мало
Можно конечно доров нагенерить с одними только кивордами. На страницу пихать все которые найдем, содержащие нужное нам слово.
Скушно...
Не пойдет...
Можно еще травилку бидов прикрутить не скажу откуда. И получить свой первый список самых дорогущих.
Вот это интересней...
По слову 'buy' мне удалось выкурить около 25000 кивордов
Из них 138 стоили больше доллара.
Ух!!
Воодушевленный результатами, я взялся за написание генератора - 'киворды + цепи маркова'.
Ну написал. Ну работает.
Скучно...
И тут возникла подлая мысль:
- А почему это гуглю должны тревожить наши киворды, да еще и дико намешанные. Допустим два киворда содержат слово 'xanax': buy cheap xanax и какойнить xanax intoxication. Это же совершенно разные вещи. Те один киворд дискредитирует второй в смысле общей темы документа. Мое ИМХО, что у гугли свои понятия о близости кивордов.
Значит нужно анализировать serp. Допустим первые сто сайтов. И выделить в них общие ключевые фразы статистическими методами. По этому поводу нашел даже диссертацию на русском! С алгоритмом! Афтор - лапочка. В общем пришлось мне снова браться за перл. В итоге из под моих чутких пальцев вышла новая программа, которая по указанному запросу анализировала сайты из выдачи гугли (не сами сайты, а их закешированные версии) и выдывала чаще всего употребляемые слова и слова, их окружающие.
Вот это уже что-то...
Результат!!
Правда же?
Второстепенный, но результат.

