Импорт контента

file_get_contents

cURL

Браузеры Дабы разобрать по косточкам страницу сайта, необходимо получить её html-код. PHP располагает средствами для этого.

Наиболее простой способ – функция file_get_contents. Впрочем, по ряду причин получение исходного кода не всегда представляет из себя элементарную процедуру. Кроме того, данная функция, обработав одну страницу веб-ресурса, прекращает своё действие и никак не заботится о том, чтобы продолжить парсинг остальной части сайта-донора. Также данную функцию не интересуют такие нюансы как докачка, аутентификация, куки и пр.

Чтобы более тонко работать с удалёнными файлами и поставить получение исходных кодов страниц на поток, в PHP есть прекрасный инструмент в виде библиотеки cURL.

См. также: Библиотеки, Экспорт данных