Лайфхаки

Маленькие, полезные хитрости

Модуль парсинга интернет магазинов SimplePars. Какие данные модуль передает скрипту и какие заберет

10.03.2022 в 01:22

Модуль парсинга интернет магазинов SimplePars. Какие данные модуль передает скрипту и какие заберет

Это самая важная часть этого функционала!!! Ради нее все и писалось.

В разные моменты выполнения скрипта модуль получает разные наборы данных!!!
Эти данные вы можете использовать для написания своей логики модуля, так и для модификации их и отправки обратно модулю.
То есть, если вам не хватает возможностей поиск замены для обработки границы, вы можете в собственном скрипте при помощи всей мощи PHP обработать данные в границе парсинга, и вернуть результат парсеру. Он же в свою очередь применит полученные данные там где вы хотите. !!!!

В зависимости от того где применяется скрипт, меняется набор данных который передается модулю.
Все данные приходят в многомерном массиве под названием $script_data
Обратите внимание, что после выполнения работы модуль так же обратится к этому массиву и заберет обратно себе данные для работы.
Это значит, если вы хотите изменить что то в данных вам достаточно достать их из этого массива, изменить, и вернуть на место. То есть, это хук который прокидывает все данные от модуля SimplePars в ваш скрипт, и после него забирает обратно для своей работы.

При выполнении скрипта в любое время вам доступны

$script_data - (int) Числовое значение обозначающее id проекта, из который вы работаете.

Как парсить сайт с авторизацией. Зачем нужны парсеры


Парсер — это программа, сервис или скрипт, который собирает данные с указанных веб-ресурсов, анализирует их и выдает в нужном формате.

С помощью парсеров можно делать много полезных задач:

  • Цены . Актуальная задача для интернет-магазинов. Например, с помощью парсинга вы можете регулярно отслеживать цены конкурентов по тем товарам, которые продаются у вас. Или актуализировать цены на своем сайте в соответствии с ценами поставщика (если у него есть свой сайт).
  • Товарные позиции : названия, артикулы, описания, характеристики и фото. Например, если у вашего поставщика есть сайт с каталогом, но нет выгрузки для вашего магазина, вы можете спарсить все нужные позиции, а не добавлять их вручную. Это экономит время.
  • Метаданные : SEO-специалисты могут парсить содержимое тегов title, description и другие метаданные.
  • Анализ сайта . Так можно быстро находить страницы с ошибкой 404, редиректы, неработающие ссылки и т. д.

Для справки . Есть еще серый парсинг. Сюда относится скачивание контента конкурентов или сайтов целиком. Или сбор контактных данных с агрегаторов и сервисов по типу Яндекс.Карт или 2Гис (для спам-рассылок и звонков). Но мы будем говорить только о белом парсинге, из-за которого у вас не будет проблем.

Где взять парсер под свои задачи

Есть несколько вариантов:

  1. Оптимальный — если в штате есть программист (а еще лучше — несколько программистов). Поставьте задачу, опишите требования и получите готовый инструмент, заточенный конкретно под ваши задачи. Инструмент можно будет донастраивать и улучшать при необходимости.
  2. Воспользоваться готовыми облачными парсерами (есть как бесплатные, так и платные сервисы).
  3. Десктопные парсеры — как правило, программы с мощным функционалом и возможностью гибкой настройки. Но почти все — платные.
  4. Заказать разработку парсера «под себя» у компаний, специализирующихся на разработке (этот вариант явно не для желающих сэкономить).

Первый вариант подойдет далеко не всем, а последний вариант может оказаться слишком дорогим.

Что касается готовых решений, их достаточно много, и если вы раньше не сталкивались с парсингом, может быть сложно выбрать. Чтобы упростить выбор, мы сделали подборку самых популярных и удобных парсеров.

Законно ли парсить данные?

В законодательстве РФ нет запрета на сбор открытой информации в интернете. Право свободно искать и распространять информацию любым законным способом закреплено в четвертом пункте 29 статьи Конституции.

Допустим, вам нужно спарсить цены с сайта конкурента. Эта информация есть в открытом доступе, вы можете сами зайти на сайт, посмотреть и вручную записать цену каждого товара. А с помощью парсинга вы делаете фактически то же самое, только автоматизированно.

Но если вы хотите собрать персональные данные пользователей и использовать их для email-рассылок или таргетированной рекламы, это уже будет незаконно (эти данные защищены законом о персональных данных ).

SimplePars nulled. SimplePars - Универсальный парсер

    Модули
  • 5809
  • Версия: v4.9_stable
  • Описание
  • Характеристики
  • Файлы
  • Отзывов (6)
  • Установка
  • Поддержка

SimplePars - парсер товаров для наполнения вашего интернет-магазина на Opencart 2.x, 3.x

Работает по очень простой и понятной схеме. Сначала Вы настраиваете параметры, а именно откуда брать товар (с какого интернет-магазина и тд), а потом по каким критериям он должен попасть в каталог вашего сайта. Далее дополнение сделает всё остальное.

Возможности парсера SimplePars

  • Получение товары можно сохранять не только сразу в движок, но и в файл CSV (например, для обработки);
  • Гибкая настройка, можно работать только по необходимым ссылкам;
  • Кроме простой загрузки информации со сторонних сайтов, модель используется как обработчик прайса. Можно обновлять остатки, цены и другие данные;
  • Возможность устанавливать собственную наценку при заливке товаров;
  • При парсинге можно и даже нужно заполнить SEO - шаблон. Это для того что бы ваши новые товары сразу подходили под продвижение!
  • Прайсы спарсенные модулем SimplePars могут быть обработаны популярным обработчиком АОП;
  • Замена и поиск текстовой информации. Удаляйте ненужные для вас данные при загрузке контента, например копирайты. Поддержка регулярных выражений;
  • Парсинг работает в многозадачном потоке, это означает, что его скорость сравнима с разгоном Теслы :)
  • Поддерживается работа с авторизацией, Cookies, User-Agent и прокси серверами с собственным чекером;
  • Модуль также пишет информацию в логи;
  • Есть автоматический запуск парсинга данных по CRON'у;
  • Парсер данных в XML, YML;
  • Работать можно не только с данными, которые подходят к Opencart, но и с другими. Парсер можно настроить на блоги, порталы и другие данные;
  • И другое!

Какие данные можно парсить и загружать в товары?

  • Код товара (model);
  • Артикул (sku);
  • Название (name);
  • Цена (price);
  • Количество (quantity);
  • Производитель (manufacturer);
  • Описание (description);
  • Категории (category, categories);
  • Изображение (thumb, thumbs);
  • Атрибуты (attribute, attributes);
  • Опции (option, options);
  • Остальные данные - товара (подробнее на скриншотах).
Инструкция по работе с SimplePars

Установка модуля SimplePars

  1. Зайдите в папку соответствующую версии вашего Opencart и загрузите всё из неё в корень CMS;
  2. В браузер перейдите по пути: ваш_сайт/inst.php;
  3. Далее перейдите в раздел Система - Пользователи - Группы пользователей - Администратор нажмите выделить все в двух разделах^ "Разрешить просмотр" и "Разрешить редактировать", затем кнопку "Сохранить";
  4. Зайдите в "Модификаторы" или "Менеджер дополнений", и нажмите Обновить;
  5. Теперь можно удалить файл inst.php в корне.

В левом сайдбаре админки (Пункт: Каталог) появится SimplePars.

Если Вы увидите белый экран, то в архиве с модулем есть папка "Other versions of PHP". Возьмите файлы от нужной версии PHP и загрузите их в движок с заменой.

  • 1 Скачайте файл модуля . Платные дополнения можно скачать в личном кабинете только после оплаты.
  • 2 В админ-панеле вашего сайта перейдите в"Расширения" -> "Установка расширений", или"Модули" -> "Установка модификаторов"и нажмите кнопку "Загрузить" ;
  • 3 Выберите скачанный файл и нажмите"Продолжить", ожидайте появление надписи - "Успешно установлено" ;
  • 4 Затем перейдите в"Менеджер дополнений", либо"Модификаторы"и нажмите кнопку "Обновить" (синяя, в правом верхнем углу);

Если модуль не заработал, то перейдите в раздел "Группы пользователей", снимите все галочки и поставьте их обратно, нажав на кнопку "Выделить все"

Если у Вас по какой-то причине не получилось установить модуль, либо он не появляется в вашем шаблоне, то рекомендуем ручную установку с помощью файла в корневой папке модуля - install.xml .

SimplePars opencart. Возможности модуля SimplePars

Основные задачи которые решает модуль это парсинг данных с сайта и последующее заполнение интернет магазина. Вы можете как парсить напрямую в интернет магазин, так и парсить в CSV файл для дальнейшей обработки. Так же реализовано обновления товаров при помощи парсинга сайтов доноров.

Возможности модуля SimplePars
Основные задачи которые решает модуль это парсинг данных с сайта и последующее заполнение интернет магазина.
Вы можете как парсить напрямую в интернет магазин, так и парсить в CSV файл для дальнейшей обработки.
Так же реализовано обновления товаров при помощи парсинга сайтов доноров.

В двух словах не описать что умеет делать модуль, по этому обозначу только основные моменты.
- Полноценный парсер позволяющий парсить товары со сторонних магазинов и загружать себе.
- Встроенный гибкий сборщик ссылок , который поможет собрать ссылки на необходимые товары.

  • Код товара
  • Артикул
  • Название
  • Цена
  • Количество
  • Производитель
  • Описание
  • Категории
  • Изображения
  • Атрибуты
  • Опций
  • Данные - товара.

- Кроме загрузки возможно настройка обновления существующих товаров, цен, остатков и многое другое.
- Идентификация товара по артикулу, модели или имени товара.
- Доступна установка наценок любой сложности.
- Парсинг / Составление SEO шаблонов и заполнение Мета данных товара, категорий, производителей. Заполнение SEO_URL
- Формировать прайс csv с данными что вы парсите. Так же прайсы можно составлять в готовом формате для загрузки через АОП или любого другого загрузчика прайс листов.
- Поиск замена, мощный инструмент позволяющий вам налету изменять информацию. То есть, при парсинге вы можете вырезать или заменять определенные слова или целые блоки текста. Удалять или заменять в тексте названия сайта донора на ваш. И многое другое.
- Поиск замена полностью поддерживает регулярные выражения.
- Модуль способен парсить в многопоточном режиме. Что делает парсинг максимально быстрым.
- Поддерживается парсинг с авторизацией.
- Поддержка работы с прокси.
- Собственный прокси чекер, позволяющий отобрать прокси сервера котороые будут работать с конкретным донором.
- Возможна индивидуальная настройка запросов, Указание Cookies , User-Agent , Отправка собственных заголовков Headers
- Система логирования позволяющая контролировать процесс парсинга на любом этапе.