![]() |
Извлечь данные с чужого интернет магазина Хочу извлечь данные из каталога интернет магазина, наименование и цену [url]http://www.mvideo.ru/noutbuki-planshety-ko...ry=noutbuki-987[/url] используя PHP и или JavaScript если зайти через хром, нажать на таблице "просмотр кода элемента", как оттуда извлечь наименование и цену? Как вообще получить этот код в переменную например? Много чего начитался хочу конкретный пример. |
[url]http://www.mvideo.ru/noutbuki-planshety-komputery/noutbuki-118[/url] |
php parse regexp |
[url]http://yandex.ru/yandsearch?text=mvideo%20%D0%BF%D0%B0%D1%80%D1%81%D0%B5%D1%80[/url] |
где-то видел скрипт для массового скачивания контента |
В конкретном примере со страничкой mvideo, всё довольно просто. Наименование по селектору div.product-tile-info div.product-tile-description a.product-tile-title-link А цену по селектору div.product-tile-info .product-price-current Очень простой случай. Они ничего не прячут и не шифруют. |
[quote=Pablo Dende;40014778]Очень простой случай. Они ничего не прячут и не шифруют.[/quote] А что, есть примеры, где HTML можно зашифровать? |
[quote=Игорь2;40019054] Цитата: Сообщение от Pablo Dende Очень простой случай. Они ничего не прячут и не шифруют. А что, есть примеры, где HTML можно зашифровать? [/quote] Если цены подгружаются через XHR запросы, то парсить становится сложнее. Если цена передаётся в искажённом виде, а потом расшифровывается Java скриптом, задача станет совем трудной. |
Причитайте пожалуйста вопрос ещё раз. "если зайти через хром, нажать на таблице "просмотр кода элемента", как оттуда извлечь наименование и цену?" например другой интернет магазин e2e4online.ru, данных нет в html коде, как их достать получил данные так: $doc = new DOMDocument(); $doc->loadHTMLFile($link); или так $html = file_get_html($link); каталога товаров там нет как добраться до каталога товаров? |
[quote=SergeySS;40085430]получил данные так: $doc = new DOMDocument(); $doc->loadHTMLFile($link); или так $html = file_get_html($link);[/quote] Это, как раз, случай, когда данные подгружаются через XHR. Тут придётся анализировать JavaScript страницы. Либо, использовать IE через OLE. |
Копать надо в сторону такого запроса [url]http://adm.e2e4online.ru/client/postdata.php?new=0&location=http://novosibirsk.e2e4online.ru/catalog2/Komplektuyuschie/Videokarty/-=reshetka=-/category=11&referrer=http://novosibirsk.e2e4online.ru/shop/&session_id=tempval&site_id=1&flash=19&java=-&resolution=1920x1080&sess=tIq1OSoTZOvX3MNdqtaJU0qu2ng0Mv&doctitle=%D0%A2%D0%BE%D0%B2%D0%B0%D1%80%D1%8B%20-%20e2e4&charset=utf8&lang=ru_RU&keyw=-&callback=_jqjsp&_1442315981441=[/url] Обратите внимание на "sess=tIq1OSoTZOvX3MNdqtaJU0qu2ng0Mv" - это ид сессии. |
могу сделать программку на php за 5 тыс, если надо |
[quote=bsg;40117473] могу сделать программку на php за 5 тыс, если надо [/quote] Недорого! Я бы больше запросил. |
[quote=Pablo Dende;40097376]Копать надо в сторону такого запроса [url]http://adm.e2e4online.ru/client/post...1442315981441=[/url] Обратите внимание на "sess=tIq1OSoTZOvX3MNdqtaJU0qu2ng0Mv" - это ид сессии. [/quote] Тут вообще не понял. Выводится же HTML код, в браузере в объекте он виден, может как то можно его в переменную получить для разбора по тэгам |
[quote=SergeySS;40148765] Цитата: Сообщение от Pablo Dende Копать надо в сторону такого запроса [url]http://adm.e2e4online.ru/client/post...1442315981441=[/url] Обратите внимание на "sess=tIq1OSoTZOvX3MNdqtaJU0qu2ng0Mv" - это ид сессии. Тут вообще не понял. Выводится же HTML код, в браузере в объекте он виден, может как то можно его в переменную получить для разбора по тэгам [/quote] Читайте про AJAX. |
[quote=SergeySS;39904642]Извлечь данные с чужого интернет магазина SergeySS 0 - 25.08.2015 - 12:19 Хочу извлечь данные из каталога интернет магазина, наименование и цену [url]http://www.mvideo.ru/noutbuki-plansh...y=noutbuki-987[/url] используя PHP и или JavaScript если зайти через хром, нажать на таблице "просмотр кода элемента", как оттуда извлечь наименование и цену? Как вообще получить этот код в переменную например? Много чего начитался хочу конкретный пример. [/quote]а это законно? |
Это законно |
Сам уже дааавно при необходимости пользуесь этими парсерами [url]https://goo.gl/JzldQh[/url] (реф ссылка). Помимо готовых шаблонов парсинга, достаточно просто сделать свои или заказать. Ну и выгружай потом куда хочешь. |
Текущее время: 00:09. Часовой пояс GMT +3. |