PHP

Импорт контента

Библиотеки

Экспорт данных

PHP

www.php.net

Большинство парсеров сайтов пишутся на PHP. Причиной тому являются некоторые особенности языка, а именно:

  1. Низкий порог вхождения. «Пэхапешников» больше чем «рубистов», «питонщиков», «сишников» и «дельфистов» вместе взятых. Увы, это не тот случай, когда количество переходит в качество.
  2. «Заточенность» под работу с Web.
  3. Наличие хорошо проработанных тематических библиотек.
  4. Именно на этом языке написано подавляющее количество сайтов, а значит парсеры на PHP проще всего встраивать в их архитектуру.

Впрочем, у «гипертекстового процессора» есть и некоторые весьма ощутимые недостатки: