Форум на Kuban.ru (http://forums.kuban.ru/)
-   Веб-дизайн и программирование (http://forums.kuban.ru/f1030/)
-   -   Извлечь данные с чужого интернет магазина (http://forums.kuban.ru/f1030/izvlech-_dannye_s_chuzhogo_internet_magazina-7118422.html)

SergeyS 25.08.2015 12:19

Извлечь данные с чужого интернет магазина
 
Хочу извлечь данные из каталога интернет магазина, наименование и цену
[url]http://www.mvideo.ru/noutbuki-planshety-ko...ry=noutbuki-987[/url]
используя PHP и или JavaScript
если зайти через хром, нажать на таблице "просмотр кода элемента", как оттуда извлечь наименование и цену?
Как вообще получить этот код в переменную например?

Много чего начитался хочу конкретный пример.

SergeyS 25.08.2015 12:19

[url]http://www.mvideo.ru/noutbuki-planshety-komputery/noutbuki-118[/url]

eth0 26.08.2015 03:36

php
parse
regexp
Google

oxo 27.08.2015 06:25

[url]http://yandex.ru/yandsearch?text=mvideo%20%D0%BF%D0%B0%D1%80%D1%81%D0%B5%D1%80[/url]

Dude 29.08.2015 15:03

где-то видел скрипт для массового скачивания контента

PabloDende 06.09.2015 14:01

В конкретном примере со страничкой mvideo, всё довольно просто.
Наименование по селектору div.product-tile-info div.product-tile-description a.product-tile-title-link
А цену по селектору div.product-tile-info .product-price-current

Очень простой случай. Они ничего не прячут и не шифруют.

igorleee 07.09.2015 08:16

[quote=Pablo Dende;40014778]Очень простой случай. Они ничего не прячут и не шифруют.[/quote]
А что, есть примеры, где HTML можно зашифровать?

PabloDende 11.09.2015 09:33

[quote=Игорь2;40019054] Цитата: Сообщение от Pablo Dende Очень простой случай. Они ничего не прячут и не шифруют. А что, есть примеры, где HTML можно зашифровать? [/quote]
Если цены подгружаются через XHR запросы, то парсить становится сложнее.
Если цена передаётся в искажённом виде, а потом расшифровывается Java скриптом, задача станет совем трудной.

SergeyS 14.09.2015 11:41

Причитайте пожалуйста вопрос ещё раз.
"если зайти через хром, нажать на таблице "просмотр кода элемента", как оттуда извлечь наименование и цену?"

например другой интернет магазин e2e4online.ru, данных нет в html коде, как их достать
получил данные так:
$doc = new DOMDocument();
$doc->loadHTMLFile($link);
или так
$html = file_get_html($link);
каталога товаров там нет

как добраться до каталога товаров?

PabloDende 15.09.2015 14:16

[quote=SergeySS;40085430]получил данные так: $doc = new DOMDocument(); $doc->loadHTMLFile($link); или так $html = file_get_html($link);[/quote]
Это, как раз, случай, когда данные подгружаются через XHR. Тут придётся анализировать JavaScript страницы.
Либо, использовать IE через OLE.

PabloDende 15.09.2015 14:22

Копать надо в сторону такого запроса [url]http://adm.e2e4online.ru/client/postdata.php?new=0&location=http://novosibirsk.e2e4online.ru/catalog2/Komplektuyuschie/Videokarty/-=reshetka=-/category=11&referrer=http://novosibirsk.e2e4online.ru/shop/&session_id=tempval&site_id=1&flash=19&java=-&resolution=1920x1080&sess=tIq1OSoTZOvX3MNdqtaJU0qu2ng0Mv&doctitle=%D0%A2%D0%BE%D0%B2%D0%B0%D1%80%D1%8B%20-%20e2e4&charset=utf8&lang=ru_RU&keyw=-&callback=_jqjsp&_1442315981441=[/url]

Обратите внимание на "sess=tIq1OSoTZOvX3MNdqtaJU0qu2ng0Mv" - это ид сессии.

boss_ug 17.09.2015 12:37

могу сделать программку на php за 5 тыс, если надо

PabloDende 17.09.2015 12:38

[quote=bsg;40117473] могу сделать программку на php за 5 тыс, если надо [/quote]
Недорого! Я бы больше запросил.

SergeyS 21.09.2015 13:13

[quote=Pablo Dende;40097376]Копать надо в сторону такого запроса [url]http://adm.e2e4online.ru/client/post...1442315981441=[/url] Обратите внимание на "sess=tIq1OSoTZOvX3MNdqtaJU0qu2ng0Mv" - это ид сессии. [/quote]
Тут вообще не понял.

Выводится же HTML код, в браузере в объекте он виден, может как то можно его в переменную получить для разбора по тэгам

PabloDende 21.09.2015 22:04

[quote=SergeySS;40148765] Цитата: Сообщение от Pablo Dende Копать надо в сторону такого запроса [url]http://adm.e2e4online.ru/client/post...1442315981441=[/url] Обратите внимание на "sess=tIq1OSoTZOvX3MNdqtaJU0qu2ng0Mv" - это ид сессии. Тут вообще не понял. Выводится же HTML код, в браузере в объекте он виден, может как то можно его в переменную получить для разбора по тэгам [/quote]
Читайте про AJAX.

pidza 19.05.2016 16:09

[quote=SergeySS;39904642]Извлечь данные с чужого интернет магазина SergeySS 0 - 25.08.2015 - 12:19 Хочу извлечь данные из каталога интернет магазина, наименование и цену [url]http://www.mvideo.ru/noutbuki-plansh...y=noutbuki-987[/url] используя PHP и или JavaScript если зайти через хром, нажать на таблице "просмотр кода элемента", как оттуда извлечь наименование и цену? Как вообще получить этот код в переменную например? Много чего начитался хочу конкретный пример. [/quote]а это законно?

vertex 22.01.2017 13:24

Это законно

imported_Петр 24.01.2017 11:00

Сам уже дааавно при необходимости пользуесь этими парсерами [url]https://goo.gl/JzldQh[/url] (реф ссылка). Помимо готовых шаблонов парсинга, достаточно просто сделать свои или заказать. Ну и выгружай потом куда хочешь.


Текущее время: 00:09. Часовой пояс GMT +3.