Блог хостинги под фарму

October 27, 2008

http://blogs.healthcare.com (на вп му) - Нормальный блогхостинг, только адсенс рекламы много слишком. Блоги в подпапках, а не на сабах.

http://medicinenexus.com/ - Блогов там практически нет. Заброшенный ресурс.

http://www.carepages.com/ - Непонятный движок. Из минусов - блоги в подпапках, а не на сабах.

http://www.healthblogs.org/ - WP MU, выглядит отлично. Блоги дают на сабах.

http://www.egmedicine.com/ - WP MU, совсем свежий блогхостинг, все блоги августовские и пустые. По одному посту в каждом, и то многие дефолтные посты (Hello World) вордпресса имеют.

http://communities.healia.com/ - Социально-коммуникативный сайт. Блогов как таковых там нет, есть как бы сообщества и люди.

http://www.revolutionhealth.com/ - Нормальный ресурс, блогов много и ведутся серьезно. Из минусов - они в подпапках, а не на сабах, и в правом сайдбаре крупная адсенс-площадка блогхостинга.

http://www.dailystrength.org/ - Один большой социальный блог, который ведут несколько мед.спецов. Минусы - нет индивидуальности у каждого мед.блоггера, обилие рекламы в сайдбарах.

http://pillsblogs.com/ - WP MU, выглядит отлично. Блоги дают на сабах.

Как выпарсить кейворды из Dogpile

October 22, 2008

Раньше при загрузке dogpile.com/info.dogpl/searchspy/inc/data.xml можно было вытягивать кейворды по которым осуществлялись запросы. Теперь там яваскриптом показывают слова. Как из яваскрипта их тянуть - хз.

Решение: Код на php

$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, ’http://www.dogpile.com/dogpile/ws/service/DPServices.asmx/GetSearchSpy’);
curl_setopt($ch, CURLOPT_HTTPHEADER, array(’Content-Type: 
application/json’));
curl_setopt($ch, CURLOPT_TIMEOUT, 15);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, ’{"numTerms":50,"filter":true}’); 
// numTerms - кол-во кеев за раз ;)

$response = curl_exec($ch);
curl_close($ch);

$feed = new SimpleXMLElement($response);
foreach ($feed->channel->item as $item) {
    echo (string)$item->title . ’<br />’;
}  

 Копия на livepad

Сплог на Wordpress: сравнение плагинов для грабинга rss лент

October 21, 2008

Плагин SmartRSS

Легкий в управлении и настройке, но мало функционален. Возможно ассоциировать ленты с отдельными категориями. К примеру, можно сделать “копию” Яндекс.Новостей и тянуть ленты новостей определенных категорий в определенные категории сплога.

Автоматизация с помощью крона(куда же без нее).

Минимальное кол-во символов в новости(зачем нам посты состоящие из двух слов?)

Ограничение на кол-во импортируемых новостей.

В SmartRSS есть функция отображения похожий записей(Related Articles). Для показа похожих записей нужно добавить в шаблон одной станицы(single.php) код:

<?php
smartrss_related_posts(limit, len, before_title, after_title , before_post, after_post , show_pass_post, show_limit);
?>

Например, < ?php smartrss_related_posts(5, 10, ‘<li>’, ‘</li>’, ”, ”, false, false); ?>

Лично я этой функцией не пользуюсь, с этим лучше справляется плагин Related Posts.

Основной недостаток плагина SmartRSS это, что он не работает с кодировкой windows-1251. Для решения этой проблемы в файле wp_smartrss.php находим $data = implode(”", file($filename));
добавляем после:
if (strstr($data,’encoding=”windows-1251″‘))
$data = mb_convert_encoding($data, ‘UTF-8′, ‘WINDOWS-1251′);

Если кому-то не нравиться, что в каждом посте ставиться ссылка на источник, то вам нужно отредактировать 123 строку в файле wp_smartrss.php. Обратите внимание на следующие 5 строк.

Не тянет новости с feedburner.

Плагин FeedWordPress

Что может плагин:

Тянет ленты автоматически или при ручном обновлении.
Возможно установить для каждой ленты свою категорию(или несколько).
Автоматическое создание категорий.(!)
Автоматическое создание пользователя для каждой ленты.(!)
Успешно грабит ленты с feedburner.
Permanent Link на свой сайт или на сайт источник(зачем?)

Не хочет тянуть ленты в кодировке windows-1251.

Плагин WP-o-Matic

Самый лучший плагин как по удобству управления, так и по функциональности.

Ручное или автоматическое(cron) обновление лент.
Можно использовать webcron.
Грабит ленты в любой кодировке.
Нет проблем с feedburner.
Кеширует изображения! что очень важно.
Выбор ставить ссылку на источник или нет(нет необходимости лезть в код).
Индивидуальные шаблоны для лент.
Замена текста(Rewrite) с использованием регулярных выражений(RegEx).
Можно удалить посты определенных лент(кампаний)
Импорт и экспорт лент в OPML файл
Индивидуальные шаблоны для лент
{content}
<a href=”{feedurl}”>Go to Source</a>
подробнее про шаблоны и используемые теги в хелпе плагина.

Из описания не трудно догадаться, что WP-o-Matic самый продвинутый плагин. Но из-за этой “продвинутости” появляется небольшая проблема - сложность настройки т.е. клепать сотни сплогов в сутки будет сложновато:)

Конечно это не все плагины для грабинга rss лент. Какой плагин использовать решать вам.

———————

Одесский манимейкер