Самым трудным процессом в парсинге для нас было составление технического задания. Трудности заключались в следующем:
- В рамках каждого бренда была своя специфика уровней вложенности;
- Между собой позиции могли содержать весьма различный набор описаний и характеристик;
- Каждый элемент нужно было согласовать, так как малейшая ошибка вела к перезапуску парсига, что означало кратное удорожание стоимости;
Помимо этого, под каждый бренд проводились доработки на стороне самого WordPress, что означало согласование действий не только с клиентом, но и двумя программистами, один из которых занимается парсингом, а другой доработками сайта.
В результате техническое задание состояло из двух документов:
- текстовый документ, в котором подробно описывался каждый нюанс парсинга;
- таблица-пример, в которой были прописаны названия полей и данные по одной позиции.
С примерами обоих документов вы можете ознакомиться
по ссылке.