ут 11. Нужны парсеры картинок и html описаний со страниц поставщиков
В архиве
31 |
0
18 сентября 2023 в 14:42:35
(1 год 13 недель 5 дней 21 час назад)
8100
12.07.2017 12:54:29
Текст задания
Есть регистр сведений: цены поставщиков. В этом регистре есть номенеклатура поставщика и номенклатура 1с, которая к ней привязана, кроме этого есть идентификатор номенклатуры поставщика. Нужно по этому идентификатору парсить и загружать картинку и описание для номенклатуры справочника, если этих данных еще нет. Описание загружается в виде файла html формате и привязывается к карточке товара. Эти данные используются на сайте после обмена.
Пример Идентификатор номенклатуры поставщика 1466432
адрес урл товара для парсинга описания будет иметь вид:
http://www.netlab.ru/descr.asp?id=466432 (первый символ в идентификаторе удаляется!)- отсюда парсим описание. Надо понять как определить, что это именно та таблица, которая нужна. Обычно она начинается со строки Основные характеристики и заканчивается Сайт производителя. Но это легко проверить поизучав исходный код. Из таблицы нужно удалить все теги цветов bgcolor.
Картинки:
На странице ищем код c адресом картинки <img src="/ISAPI/TestISAPI.dll?238248&0" это и есть урл картинки. Урл будет иметь вид
http://www.netlab.ru/ISAPI/TestISAPI.dll?238248&0
но его надо немного подкорректировать, заменив &0 на &178551- такую замену надо делать для всех картинок
Итоговый урл
http://www.netlab.ru/ISAPI/TestISAPI.dll?238248&178551 формат jpg. далее сохраняем картинку в карточке товара в виде Артикул.jpg
Вот и все. Основные моменты-парсинг должен проходить только для того элемента, которого в карточке товара еще нет. и выполняться по регл заданию. 2 задания- одно по описанию, другое по картинкам.
В самой обработке должен быть ручной режим с разными отборами номенклатуры, стандартные формы отбора+ по дате создания номенклатуры, нажимаем кнопку загрузить описание или загрузить картинку. Происходит парсинг.
работа по тимвьюверу, anydesk или rdp. Выслать базу крайне проблемно
Готов реализовать в кратчайшие сроки, т.к. есть большой опыт парсинга сайтов.
Описание разработки здесь http://odineskin.ru/index.php/razrabotki/parsing-sajtov-sbor-dannykh
В стоимость блока парсинга входит настройка одного сайта.
Далее сможете (если есть минимальный опыт веб программирования) сами добавлять новые сайты для парсинга
Есть демо база механизма http://185.159.130.133/calc_price/ru_RU/ можете посмотреть пощупать