Необходимо написать парсер, которому можно скормить список ключевых слов для отслеживания и он в многопоточном режиме получит информацию (первая страница поиска, обязательно с рекламными позициями).
Что должен собирать:
1) Позиция
2) Тип позиции (сео или реклама)
3) Название товара
4) Ссылка на товар
5) Ссылка на изображение товара
Сам парсер запускаться будет раз в час. Количество ключевых слов до 500.
Соответственно, парсер должен уметь обходить баны / защиты (работать с прокси если необходимо). Ожидается полностью рабочий инструмент, который будет работать до изменения механизмов защиты / верстки сайта.
Язык желательно Python (но nodejs тоже подойдет)
Опубликовано 2 года назад