новое событие
Информационный поток
Задания вакансии материалы разработки сообщения форума
McDos
Приватное сообщение

Доработка обработки снятия данных с сайтов.

55 |  1
5 июня 2021 в 13:04:48 (3 года 21 неделя 6 дней 17 часов назад)
41900
Текст задания
Есть обработка для снятия данных с сайтов за авторством Якова Когана.
Основная идея: вычитываются таблицы, а уже внутри их ячеек идут маленькие деревья DOM-объектов. Применяются только механика 1С, в отличие от первоначального парсера, поэтому всё быстрее.
Недостаток: это не рабочая модель, т.к. тут нет механизма сохранения настроек чтения, а есть лишь само чтение и раскладка.
Но, ориентируясь на полные пути, свойства-атрибуты и прочее, можно уже делать локальные настройки схем чтения и интерпретации.
Требуется доработать, чтобы её мог использовать человек, особо в среде хтмл не ориентирующийся.
Также, потребуется структурирование вычитанных данных, добавление новых свойств, внесение в список номеклатуры.
0
Выбранные исполнители
Отклики