Posts Tagged ‘ внешние ссылки

Как избавиться от внешних ссылок в WordPress

January 20, 08 by TracKer

Спросил меня недавно NOMAD “Как избавиться от ВС в комментариях”, решил поделиться опытом, как это сделать в WordPress.

Первое что важно запомнить, это то что ссылки на комментаторов нельзя ни в коем случае удалять, это признак плохого тона автора блога. Удаляя ссылку вы разрушаете связь с комментатором. Вместо этого ссылку можно немного модифицировать, отправив ее, например, через скрипт переадресации. Таким образом Внешний Адрес будет находится как-бы в вашем домене, и как Внешняя Ссылка учитываться не будет.

О том как сделать скрипт переадресации я писал в этом посте: Убираем внешние ссылки. Сделать нужно все что написано в посте, вплоть до запрета его индексации в robots.txt.

Как только скрипт готов идем в папку с темплейтом вашего блога, к примеру “/wp-content/themes/default/” находим файл “functions.php” и редактируем его.

Перед тем как перейти непосредственно к редактированию, разберем основные источники ВС в блоге на WordPress и методы борьбы с ними.

И так первый источник ВС это ссылки на автора темы. Обычно они расположен в футере (footer.php), но бывают и исключения, поэтому первым делом следует прошерстить темплейт на их наличие. Бороться с ними не сложно. Такие ссылки можно просто взять в “<noindex>“, примерно так:

<noindex>Powered by <a href="http://wordpress.org/">WordPress</a></noindex>

Все что попадает в “<noindex>” не будет учитываться роботом Яндекса, поэтому с этим тегом нужно быть по осторожнее.

Со статическими ВС разобрались, теперь приступим к динамическим. Осталось несколько мест где могут появляться ВС, это: посты (содержание постов), комментарии и sidebar (их может быть несколько и называться они могут по разному, но это сути не меняет). Теперь перейдем непосредственно к редактированию “functions.php” о котором я писал выше.

Начнем с Постов. Чтобы избавиться от ВС в содержании поста необходимо поставить фильтр на “the_content”. Система фильтров в WordPress очень хорошо развита и позволяет фильтровать практически все что угодно. Итак ставим фильтр:

add_filter('the_content', 'removeLinks');

Вторым параметром к add_filter мы указываем функци, которая и будет фильтровать текст. Собственно код функции:

function preg_callback2($matches) {
  $url = explode(':', $matches[2]);
  if (($url[0] == 'http') || ($url[0] == 'https')) {
    $need = "http://tracker2k.kiev.ua";
    $replace = "http://tracker2k.kiev.ua/redirect.php?";
    if (substr($matches[2], 0, strlen($need)) != $need) {
      $matches[2] = $replace.$matches[2];
    }
  }
  return $matches[1].$matches[2].$matches[3];
} 
 
function removeLinks($content) {
  if (! is_feed()) {
    $content = preg_replace_callback('@(]*href=")([^>\"]*)("[^>]*>)@i', "preg_callback2", $content);
    $content = preg_replace_callback('@(]*href=\')([^>\"]*)(\'[^>]*>)@i', "preg_callback2", $content);
  }
  return $content;
}

Для замены ссылок я использовал регулярные выражения, поэтому добавилась еще одна функция обратного вызова. Чтобы адаптировать под себя вам следует заменить всего два параметра в функции preg_callback2, а именно $need и $replace. В $need следует указать полный адрес вашего сайта без слеша в конце, а в $replace путь в redirect.php со знаком вопроса (“?“) в конце. В принципе с постами мы закончили.

Теперь перейдем к комментариям. С ними, в принципе, дела обстоят точно также. Следует отфильтровать всего три – четыре параметра, с использованием описанной выше функции. Другими словами к написанному выше следует дописать:

add_filter('comment_text', 'removeLinks');
add_filter('get_comment_author_link', 'removeLinks');
add_filter('get_comment_author_url_link', 'removeLinks');
add_filter('comment_url', 'removeLinks');

Идем дальше. Следующим пунктом идет sidebar. С ним сложнее всего. С сайдбаре может быть множество виджетов генерируемых другими плагинами, которые в свою очередь генерируют ВС. Однако весь сайдбар ставить в <noindex> было бы ошибкой, так как можно лишится индексации многих страниц и разделов. Я расскажу о тех Виджетах с которыми работал.

Проше всего бороться с ВС у виджета Text, в нем у меня лежали каунтеры, кнопки и пр. Тут всеголишь следует добавить в начало и конец кода в Виджете “<noindex>” и “</noindex>” соответственно. Далее виджет Links, он используется для генерации Blogroll. Тут необходимо установить еще один фильтр и написать еще одну функцию:

function removeLinks_Blogroll($p1) {
  foreach ($p1 as $obj) {
    $obj->link_url = "http://tracker2k.kiev.ua/redirect.php?" . $obj->link_url;
  }
  return $p1;
} 
 
add_filter('get_bookmarks', 'removeLinks_Blogroll');

Подразумевается, что в Blogroll все ссылки Внешние, поэтому их проверка не производится. Чтобы адаптировать под себя, следует заменить “http://tracker2k.kiev.ua/redirect.php?” на то же значения что и $replace в preg_callback2. Также генерировать ВС может виджет Meta, вместо него я использую собственный, заменяющий его. Чтобы внести изменения в остальные виджеты генерирующие ВС необходимо править код WordPress, что весьма не хорошо. Некоторые виджеты, работающие на базе дополнительных плагинов дают возможность вставлять свои теги в свои начало и конец, например Flickr.
Собственно все.

В итоге у вас должен получиться следующий код:

function preg_callback2($matches) {
  $url = explode(':', $matches[2]);
  if (($url[0] == 'http') || ($url[0] == 'https')) {
    $need = "http://tracker2k.kiev.ua";
    $replace = "http://tracker2k.kiev.ua/redirect.php?"; 
 
    if (substr($matches[2], 0, strlen($need)) != $need) {
      $matches[2] = $replace.$matches[2];
    }
  }
  return $matches[1].$matches[2].$matches[3];
} 
 
function removeLinks($content) {
  if (! is_feed()) {
    $content = preg_replace_callback('@(]*href=")([^>\"]*)("[^>]*>)@i', "preg_callback2", $content);
    $content = preg_replace_callback('@(]*href=\')([^>\"]*)(\'[^>]*>)@i', "preg_callback2", $content);
  }
  return $content;
} 
 
add_filter('the_content', 'removeLinks');
add_filter('comment_text', 'removeLinks');
add_filter('get_comment_author_link', 'removeLinks');
add_filter('get_comment_author_url_link', 'removeLinks');
add_filter('comment_url', 'removeLinks');  
 
function removeLinks_Blogroll($p1) {
  foreach ($p1 as $obj) {
    $obj->link_url = "http://tracker2k.kiev.ua/redirect.php?" . $obj->link_url;
  }
  return $p1;
} 
 
add_filter('get_bookmarks', 'removeLinks_Blogroll');

Убираем внешние ссылки

November 17, 07 by TracKer

Недавно писал про искоренение “ссылок через скрипт-редирект” непосредственно в браузере конечного пользователя. Теперь же хочу написать про совсем маленький скрипт который осуществляет этот редирект и помогает избавиться от внешних ссылок.

Применяют такой скрипт в определенных случаях, например: при искоренение внешних ссылок в случае их продажи, например в sape.ru, при подсчет кликов по ссылкам (при клике сначала статистические данные заносятся в БД, после чего осуществляется переадресация на нужный ресурс).

А сам скрипт совсем маленький, фактически вот он:

<?
$uri = "";
if (array_key_exists("QUERY_STRING", $_SERVER)) {
  $uri = $_SERVER["QUERY_STRING"];
}
header("Location: ".$uri);
?>

И все :) . Файл называется redirect.php и находится в корне вашего сайта (чтобы к нему было легче обращаться).

Обращаться же к нему необходимо следующим образом: если нужно сделать переадресацию на http://google.com, то необходимо указать следующий адрес в ссылке:

http://yoursite.com/redirect.php?http://www.google.com.

Если вы используете sape.ru, то это не запрещено их правилами и хорошо действует для избавления от внешних ссылок, но стоит также помнить, что такие ссылки очень плохо индексируются роботами (Google, Yandex), поэтому к ним лучше запретить доступ роботов через файл robots.txt со следующим содержанием:

User-Agent: *
Disallow: /redirect.php

Это значит что все ссылки которые начинаются с “/redirect.php” роботом обрабатываться не будут.

Приводим внешние ссылки в человеческий вид

November 15, 07 by TracKer

Сейчас на разных сайтах часто можно заметить ссылки на внешние ресурсы через какой-то внутренний скрипт, например такие: http://tracker2k.kiev.ua/redirect.php?http://google.com

Причины делать такие ссылки у каждого свои: кто-то продает место под ссылки в sape.ru или еще где-то и экономит внешние ссылки, кто-то не хочет, чтобы их индексировали роботы, кто-то считает переходы. В моем случае ссылки продаются в sape.ru :) и, честно говоря, меня не устраивал их внешний вид в браузере, и я решил это дело исправить и написал простенький скрипт на JavaScript с использованием jQuery и вставил его в header.php (шаблон верхней части страницы в WordPress’е).

Сам код выглядит так:

<script TYPE="text/javascript">   
$(document).ready(function(){   
  $("a").each(function(i){  
    var remove_str = 'http://tracker2k.kiev.ua/redirect.php?';  
    var str = this.href.substring(0, remove_str.length);  
    if (str == remove_str) {  
      this.href = this.href.substring(remove_str.length);  
    }  
  });  
});   
</script>

Работает это так: как только страница загрузилась мы ищем все ссылки на странице которые начинаются с remove_str, после чего удаляем из них remove_str. И все :)

В итоге получаем, уменьшение количества внешних ссылок за счет использования вашего внутреннего скрипта и человеческий вид ссылок в браузере за счет моего скрипта :)

Конечно это не применимо для подсчета переходов, потому что как только ссылка в браузере будет изменена переход будет осуществляться напрямую, а не через ваш скрипт.

Чтобы использовать у себя, в remove_str нужно указать с чего начинается ссылка, этот текст впоследствии будет из нее удален. Остальное можно оставить как есть и использовать. Код вставляется в тело HTML, то есть сразу после тега BODY.

Единственный замеченный минус – код не всегда до конца выполняется в Internet Explorer’е.

Возможно Арсений Фёдоров заинтересуется :)