новое событие
Информационный поток
Задания вакансии материалы разработки сообщения форума
work122
Приватное сообщение

Парсить прайс-лист партнера в виде html

Барнаул(Россия )
3 |  0
29 марта 2022 в 16:08:05 (2 года 38 недель 4 дня 10 часов назад)
3900
Текст задания
Есть необходимость отслеживать цены партнеров на сайте baza.drom.ru.
К примеру рассмотрим партнера - https://baza.drom.ru/user/NovosibirskAutr/
У него 58554 объявления, доступные на 1172 страницах.
То есть его прайс можно получить обращаясь к страницам:
https://baza.drom.ru/user/NovosibirskAutr/?page=1
https://baza.drom.ru/user/NovosibirskAutr/?page=2
https://baza.drom.ru/user/NovosibirskAutr/?page=3
и так далее.
На каждой странице будет по 50 объявлений.

Необходимо из этих объявлений взять наименование, цену, производителя.

Для самого первого объявления это будет:
- Стойка передняя Toyota Allion, Toyota Allion #ZT26# 07- 2WD, Toyota Allion #ZT265 07- 4WD, Toyota Premio, Toyota Premio #ZT26# 07- 2WD, Toyota Premio #ZT265 07- 4WD Tokico B3291
- 10 530 руб.
- Tokico

Как видим реализацию мы:
1. Реализация будет во внешней обработке
2. В форме будет указываться адрес страницы с сайта baza.drom.ru, и количество объявлений (чтобы можно было рассчитать количество страниц объявлений)
3. Обработка должна скачать все страницы, допустим в папку C:\\\\\\\\\\\\\\\\Temp (либо любую другую временную папку)
4. Обработка должна распарсить все html, чтобы получить оттуда - Наименование, цену, производителя
5. На выходе должен быть табличный документ с этой информацией.

Отдаем отчет, что работать это может не быстро, готовы с этим смириться.

Ждем ваших предложений по реализации и стоимости работ.
0
Выбранные исполнители
Отклики