Парсинг Google - несколько секретов мастерства

February 22, 2008

Приведу несколько примеров не очень распространенных запросов к Google, которые зачастую значительно помогают наиболее полно распарсить Google по интересующему вас запросу.

Итак, поехали…

Пример №1

Где-то с квартал назад Google изменил подход к тегу daterange, теперь запросы с тегом daterange помогают парсить выдачу по дате (диапазон дат задается согласно Юлианскому календарю).

Так например, по запросу daterange:2454496-2454496 Google выдает страницы от 30 января 2007.

Примеры запросов:

  • "guestbook" daterange:2454496-2454496
  • "guestbook" daterange:2454495-2454495
  • "guestbook" daterange:2454494-2454494

 

Пример №2

Использую следующие два типа запросов можно разделить выдачу Google на половинки, т.е. на сайты с www и без www

  • "some words" inurl:"www." только домены с префиксом www
  • "some words" -inurl:"www." только домены без префикса www

 

Пример №3

Теперь немного на примере самой популярной зоны com (приненимо и для всех других известных вам доменных зон) рассмотрим ряд специфических запросов, которые позволяют разбить выдачу на более мелкие кусочки

  • site:com только домены зарегистрированные в зоне com

  • site:*com только домены зарегистрированные в зоне com и без дефиса в имени домена
  • site:com -site:*com только домены зарегистрированные в зоне com и с одним или более дефисами в имени домена

  • site:*-*com только домены с одним дефисом в имени домена
  • site:*-*-*com только домены с двумя дефисами в имени домена
  • site:*-*…-*com только домены с N кол-вом дефисов в имени домена
  • site:com -site:*com -site:*-*com -site:*-*-*com только домены с двумя дефисами подряд или с тремя и более дефисами в имени домена

  • site:*.*com только домены с одной точкой в имени домена (сабдомены)
  • site:*.*.*com только домены с двумя точками в имени домена
  • site:*.*…*.*com только домены с N кол-вом точек в имени домена

  • site:com/* в адресе одна и более поддиректорий
  • site:com/*/* в адресе есть 2 поддиреторий
  • site:com/*/*/* в адресе есть 3 поддиреторий
  • site:com/*/*…/* в адресе есть n поддиреторий

Важно: подстановка дирректорий возможна совместно с точками и дефисами!

——————- 

kak-tak.com

2 Comments »

The URI to TrackBack this entry is: http://intrex.blogsome.com/2008/02/22/p61/trackback/

  1. зачетная статейка, спасибо

    Comment by Seo Красавчег — March 14, 2008 @ 6:25 pm

  2. Статья по теме
    http://www.seonews.ru/article/.publication/410/
    Посмотрите мой парсер гугл. Его можно скачать здесь:
    http://bajron.od.ua/?p=68

    Comment by Hkey — May 13, 2008 @ 11:10 pm

RSS feed for comments on this post.

Leave a comment

Line and paragraph breaks automatic, e-mail address never displayed, HTML allowed: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <code> <em> <i> <strike> <strong>



Anti-spam measure: please retype the above text into the box provided.