XLS / XLSX

www.microsoft.com/.../

Иногда спарсенный материал требуется представить в виде электронной таблицы Excel.

ExcelБезусловно, электронные таблицы невозможно редактировать как обычный текстовый файл. Достаточно открыть документ XLS в текстовом редакторе (Notepad++, к примеру) и обнаружить там набор кракозябр, дабы придти к выводу о бесполезности стандартных функций для работы с файлами. Просто дописать в конец файла очередные данные (как в случае с CSV), выуженые с сайта-донора, не получится.

Что ж, если стандартные функции не подходят, то выручат нестандартные. Существует немало библиотек, призванных облегчить работу с книгами Excel. Подключив их, можно как считывать информацию с готовых электронных таблиц, так и средствами языков веб-программирования формировать «на лету» XLS-документы. Добавлять новые записи в таблицу можно непосредсвенно сразу после извлечения контента из сайта-донора. Или же спарсить материал в базу данных SQL, а затем из БД сформировать электронную таблицу.

См. также: SQL, CSV, XML, JSON, Document Object Model