PHP
Импорт контента
Библиотеки
Экспорт данных

Большинство парсеров сайтов пишутся на PHP. Причиной тому являются некоторые особенности языка, а именно:
- Низкий порог вхождения. «Пэхапешников» больше чем «рубистов», «питонщиков», «сишников» и «дельфистов» вместе взятых. Увы, это не тот случай, когда количество переходит в качество.
- «Заточенность» под работу с Web.
- Наличие хорошо проработанных тематических библиотек.
- Именно на этом языке написано подавляющее количество сайтов, а значит парсеры на PHP проще всего встраивать в их архитектуру.
Впрочем, у «гипертекстового процессора» есть и некоторые весьма ощутимые недостатки:
- Нет возможности писать десктопные приложения. С одной стороны это накладывает существенные ограничения на использование скриптов: чтобы запустить парсер, необходимо произвести обращение браузера к серверу или пользоваться дополнительными приспособления наподобие cron. В любом случае, это создаёт дополнительные трудности если парсер необходимо запускать по графику. И, несомненно, ограничивает (зачастую критично) время исполнения программы.
- С другой стороны, PHP-скрипты, как и продукт любого интерпретатора, работают много медленнее, чем скомпиллированные EXE-шки. Если требуется написать робота, которому необходимо обойти десятки тысяч страниц, то в этой ситуации PHP подойдёт вряд ли.
- Важным минусом является однопоточность PHP, не позволяющая реализовывать асинхронность. Хотя её можно имитировать, запуская параллельно один и тот же скрипт. Однако сей метод является лишь бесхитростным костылём, наглядно вскрывающий недостатки интерпретатора.