Типа уникальный контент, легкий способ

March 18, 2008

Гугл любит уникальный контент, поэтому не получится просто гнать посты на свой сайт с rss фидов, пользуясь каким либо сервисом и наслаждаться жизнью.
Один из самых простых способов получить "типа уникальный контент" используя трубы это делать перевод текста, благо специальный модуль для этого в трубах есть.
Можно тупо переводить в инглиш статьи с русского или еще какого, либо сделать хитрый финт ушами и перевести текст с инглиша на суахили например, а потом обратно с суахили на инглиш.
Трубопровод для такой фишки выглядит следующим образом:


В результате конечно не получим чистого текста который было бы приятно читать, но это в любом случае лучше простого набора слов.
Для более читаемого текста можно использовать другие фишки но о них в следующий раз, пока как пример исходный текст сообщения с фида новостей apple и полученный переводом результат.

Исходный текст:

APPLE today presented the thinnest book of the world: Air De MacBook.
It measures 0.16 inch without precedent at its meaner point while its
maximum height of 0.76 inch is less than the meanest point on the
books of competition. In more than one 13.3-inch astounding Carry
out-against enlightened widescreen posting, offers of air of MacBook
normal and the keyboard against enlightened, a visual camera of iSight
integrated for the visual communication, and a roomy trackpad with
multi-touch the support of gesture, leaving the pinching of users,
turn and strike it with any flight. The new book is actuated a
processor of duet by 1.6 gigahertz or 1.8 of core 2 of gigahertz INTEL
with the hiding-place of 4MB L2, and it includes as standard devices
2GB of memory, a hard ordering of 80GB 1.8-inch, and late technology
and Bluetooth 2.1 of 802.11n Wi-Fi. Starting just to $1.799, the air
of MacBook starts to embark in two weeks.

И то что получилось в результате

Apple today introduced the world’s thinnest notebook: MacBook Air. It measures an unprecedented 0.16 inches at its thinnest point while its maximum height of 0.76 inches is less than the thinnest point on competing notebooks. In addition to a stunning 13.3-inch LED-backlit widescreen display, MacBook Air offers a full-size and backlit keyboard, a built-in iSight video camera for video conferencing, and a spacious trackpad with multi-touch gesture support, letting users pinch, rotate and swipe. The new notebook is powered by a 1.6 GHz or 1.8 GHz Intel Core 2 Duo processor with 4MB L2 cache, and it includes as standard features 2GB of memory, an 80GB 1.8-inch hard drive, and the latest 802.11n Wi-Fi technology and Bluetooth 2.1. Starting at just $1,799, MacBook Air begins shipping in two weeks.

Не фонтан, но для определенных целей сойдет.

Кроме встроенного в трубы модуля перевода можно использовать и внешние сайты переводчики, у них и качества перевода может быть лучше.

 ———–

pocketmoney-online.blogspot.com 

Простой парсер google trends

March 14, 2008

Вот кусочек из моего php скрипта, который парсит гугл трендс

//Trends Parsing
$trends_url = ‘http://www.google.com/trends/hottrends/atom/hourly’;
$trends = file_get_contents($trends_url);
$trends = html_entity_decode(htmlentities($trends, ENT_COMPAT, ‘UTF-8′));
preg_match_all("/<a href=\"[^>]*>(.*?)<\/a>/is", $trends, $kw, PREG_PATTERN_ORDER);

На выходе получаем массив $kw, с которым уже можно что-нить химичить. У меня, например эти тренды идут дальше на парсинг контента по соответствующим кейвордам из google blog search, technorati, сниппеты google и msn и из них потом формируется пост в блог.

Например, парсим сниппеты гугла таким образом:

//Google Serps Parsing
$google_request = ‘http://www.google.com/ie?hl=en&num=’.$count.’&
start=0&lr=&q=’.urlencode(trim($kw[$j]));
$google_pattern = ‘/<a title="(.*)" href=(.*)>(.*)<\/a>/isU’;
$google_result = file_get_contents($google_request);
$google_result = html_entity_decode(htmlentities($google_result, ENT_QUOTES, ‘UTF-8′));
$google_result = str_replace("’", "’", $google_result);
$google_result = str_replace(" …", ".", $google_result);
$google_result = str_replace("…", ".", $google_result);
$google_result = str_replace(" | ", ", ", $google_result);
$google_result = str_replace("’", "’", $google_result);
$google_result = str_replace("#39;", "’", $google_result);
$google_result = str_replace("·", "", $google_result);
$google_result = str_replace("&", "and", $google_result);
$google_result = str_replace("amp;", "", $google_result);
$google_result = str_replace("middot;", "", $google_result);
$google_result = str_replace(""", "’", $google_result);
preg_match_all ($google_pattern, $google_result, $google_data);
$google_header = implode(". ", $google_data[3]);
$google_snippet = implode(" ", $google_data[1]);

Сниппеты Live/MSN вот так

//MSN Serps Parsing
$msn_url = ‘http://search.msn.com/results.aspx?format=rss&count=’.$count.’&
q=’.urlencode(trim($kw[$j]));
$msn_request = file_get_contents($msn_url);
$msn_request = html_entity_decode(htmlentities($msn_request, ENT_QUOTES, ‘UTF-8′));
$msn_request = str_replace(" …", " ", $msn_request);
$msn_request = str_replace("Live Search: ", "", $msn_request);
$msn_request = str_replace("#39;", "’", $msn_request);
$msn_request = str_replace("·", "", $msn_request);
$msn_request = str_replace("&", "and", $msn_request);
$msn_request = str_replace("amp;", "", $msn_request);
$msn_request = str_replace("middot;", "", $msn_request);
$msn_request = str_replace(""", "’", $msn_request);
preg_match_all("/<title[^>]*>(.*?)<\/title>/is", $msn_request, $msn_title, PREG_PATTERN_ORDER);
preg_match_all("/<description[^>]*>(.*?)<\/description>/is", $msn_request, $msn_desc, PREG_PATTERN_ORDER);
$msn_header = implode(". ", $msn_title[1]);
$msn_snippet = implode("
", $msn_desc[1]);

В итоге получим тексты сниппетов гугла/мсн и заголовки из выдачи, немного очищенные от мусора. Реализация возможно не фонтан, но все же рабочая.
Посидев с php учебником день-два можно наваять неплохой сборщик контента по трендсам :)

Если очень лениво, пишите в каменты может выложу готовый скрипт.

Бесплатный DNS-server

March 13, 2008

Как получить бесплатный DNS 

1. Зарегистрироваться http://freedns.afraid.org/signup/. Потом залогиниться, зайти сюда http://freedns.afraid.org/domain/, прописать домен (ы). На NS-ах можно прописать неограниченное количество доменов, все бесплатно. Если хотите собственные ns’ы вида ns1.вашдомен.com, ns2.вашдомен.com итд, то необходимо купить премиум аккаунт.

2. Идем на http://freedns.afraid.org/ (аккаунт на afraid уже должен быть зарегистрирван как описано выше), далее идем по ссылке Domains в верхнем левом углу.

3. После чего попадаем на страницу, на которой перечислены все ваши домены (пока эта страница пустая, поскольку домены еще не прописывали), нажимаем ссылку "Add A Domain"

4. Попадаем на страницу "Domain manager"

5. В поле Domain прописываем свой домен и жмем submit

6. Далее идем в панель управления своим доменом (который прописали на afraid). В поле для днс’ов, указываем днсы afraid, на которых мы прописали наш будущий домен: NS1.AFRAID.ORG (67.19.238.254) NS2.AFRAID.ORG (69.94.133.163)NS3.AFRAID.ORG (69.94.134.20)NS4.AFRAID.ORG (70.87.151.119)8) И нажимаем добавить домен

7. ждем пока инфа с afraid ns’ов разойдется по другим нс серверам (от часа до 2-ух суток) и пытаемся пробиться по адресу: доменкоторыйзарегистрировали.com. Если увидете приблизительно такое сообщение:"This hostname (доменкоторыйзарегистрировали.com) is not-available using the lightweight free shared domain system at freedns.afraid.org.", то все ок.