Экспорт данных
SQL
CSV
XML
XLS / XLSX
JSON
Document Object Model
Материал, полученный из распарсенного сайта, необходимо упаковать в виде, пригодном для дальнейшего использования. Конкретный формат зависит от того как в дальнейшем будет обрабатываться собранная информация.
Чаще всего это базы данных MySql/PostgreSQL. Заливать в БД можно не только посредством запросов SQL, но и с помощью JSON через Ajax. Во многих случаях из спарсенного контента с помощью XML формируется RSS-поток, что весьма удобно при использовании данных «как есть», без процедуры рерайтинга. Иногда результат парсинга помещают в CSV-файл – поскольку этот текстовый формат очень прост в дальнейшей обработке, легко конвертируется в SQL-запросы и без проблем открывается в Excel'е. В специальных случаях требуется, чтобы конечные данные были представлены в виде электронных таблиц XLS.
См. также:
















