iDatica – бесплатный парсер сайтов с готовыми шаблонами, вы можете собирать цены, характеристики, контакты, отзывы и многое другое.
iDatica – бесплатный парсер сайтов, собирает любые данные с сайтов в автоматизированном режиме и сохраняет в файл. С помощью парсера от компании iDatica вы сможете собирать цены конкурентов, контакты для лидогенерации, отзывы о товарах, ссылки на картинки и многое другое.
Возможности:
• Использование готовых шаблонов для сбора данных;
• Парсинг каталога с пагинацией – автоматический переход на следующую страницу;
• Парсинг карточек товаров и отдельных url;
• Парсинг определенной области на странице;
• Настраиваемый вид столбцов таблицы;
• Предпросмотр собираемых данных и их количества;
• Возможность работы с xPath и CSS стилями;
• Настраиваемая скорость перехода на страницу;
• Возможность задать нужный разделитель в csv;
• Просмотр лога процесса.
Ограничения парсера:
Парсер не собирает url адреса (ссылки с тегом
).
Подробнее о функциональности парсера:
Шаблоны - файлы с готовыми настройками для парсинга. Вы можете загрузить готовую настройку и быстро начать сбор данных с нужного сайта без предварительной настройки. Вы можете сохранять свои настройки в качестве шаблонов.
Парсинг каталога с пагинацией – возможность программы самостоятельно переходить на следующую страницу в каталоге, вам нужно только запустить парсинг на первой странице.
Парсинг карточек товаров и отдельных url - с помощью этой опции вы сможете отслеживать список нужных вам товаров.
Настраиваемый вид столбцов таблицы - программа позволяет добавлять нужное вам количество столбцов и удалять не нужные.
Предпросмотр собираемых данных и их количества - инструмент позволяющий быстро оценить правильность настройки парсинга. При нажатии на соответствующую кнопку программа покажет данные которые нашла на странице на которой вы находитесь и их количество.
Возможность работы с xPath и CSS - вы можете привязываться к данным на странице с помощью языка запросов xPath и CSS селекторов. Если вы не знакомы с возможностями xPath ищите в разделе информации наши обучающие статьи, за несколько минут вы научитесь основам и сможете настраивать сбор данных даже на сложных сайтах.
Настраиваемая скорость перехода на страницу - данная опция позволяет задавать время через которое начинается парсинг после перехода на новую страницу, это позволяет избегать блокировок со стороны сайта из-за частых обращений и дает время загрузиться новой странице.
Возможность задать нужный разделитель в csv - удобная опция позволяющая выбрать нужный символ в качестве разделителя.
Просмотр лога - информационное поле в котором отображается каждый шаг, на какой странице идет парсинг в настоящий момент, количество собранных элементов и другое.
Внимание! Соблюдайте политики целевых сайтов в отношении автоматического сбора данных.