5 июня 2021 в 13:04:48
(3 года 21 неделя 6 дней 17 часов назад)
41900
10.11.2013 11:44:39
Текст задания
Есть обработка для снятия данных с сайтов за авторством Якова Когана.
Основная идея: вычитываются таблицы, а уже внутри их ячеек идут маленькие деревья DOM-объектов. Применяются только механика 1С, в отличие от первоначального парсера, поэтому всё быстрее.
Недостаток: это не рабочая модель, т.к. тут нет механизма сохранения настроек чтения, а есть лишь само чтение и раскладка.
Но, ориентируясь на полные пути, свойства-атрибуты и прочее, можно уже делать локальные настройки схем чтения и интерпретации.
Требуется доработать, чтобы её мог использовать человек, особо в среде хтмл не ориентирующийся.
Также, потребуется структурирование вычитанных данных, добавление новых свойств, внесение в список номеклатуры.
Была аналогичная проблема. Пришлось дорабатывать программу. Обращались к знакомым «умельцам», но со временем споткнулись о те же проблемы, что и были в начале. Два или три раза переустанавливали, потом всё-таки хватило ума поискать в сети специалистов. Сейчас пользуемся – вопросов больше не возникает. Обращались на сайт http://www.1c-biz.ru.