Экспорт данных

SQL

CSV

XML

XLS / XLSX

JSON

Document Object Model

Экспорт данныхМатериал, полученный из распарсенного сайта, необходимо упаковать в виде, пригодном для дальнейшего использования. Конкретный формат зависит от того как в дальнейшем будет обрабатываться собранная информация.

Чаще всего это базы данных MySql/PostgreSQL. Заливать в БД можно не только посредством запросов SQL, но и с помощью JSON через Ajax. Во многих случаях из спарсенного контента с помощью XML формируется RSS-поток, что весьма удобно при использовании данных «как есть», без процедуры рерайтинга. Иногда результат парсинга помещают в CSV-файл – поскольку этот текстовый формат очень прост в дальнейшей обработке, легко конвертируется в SQL-запросы и без проблем открывается в Excel'е. В специальных случаях требуется, чтобы конечные данные были представлены в виде электронных таблиц XLS.

См. также: Парсинг: Что? Зачем? Как?, Что понадобится?, Этапы парсинга, Импорт/экспорт контента, Синтаксический анализ