Парсинг и граббинг
56 сообщений
#16 лет назад
Парсинг это сбор и анализ информацииграббинг это стягивание информации(контента) на жесткий диск
если в двух словах, более подробно в сети можно найти при желании
86 сообщений
#16 лет назад
Это совершенно разные вещи.в двух словах -
Parser - программа выделяющая элементы данных из общего набора по определенным правилам.
граббер - это просто тупое скачивание всего контента и сохранение... где нибудь... возможно для передачи парсеру....
57 сообщений
#16 лет назад
Ну как для чего. Например, хотите на своем сайте вывод ТВ-программы, или хотите организовать лайв-результаты спортивных событий - можно много примеров перечислить.
37 сообщений
#16 лет назад
Парсер это синтаксический анализатор.Грабер процесс (можно так назвать), можно назвать программное или техническое средство для сбора информации.
В данный момент понятия парсер и грабер взаимо заменяемы, зачастую непосвященный представляет себе их одним и тем же.
Примеры: да вагон ... гугль, придет в помощь.
Вот скажем скрипт который каждый день заливает к себе в базу курсы валют , это кто?????
и скрипт который тупо отображает на странице курс валют, а это что????
Еще пример парсера: в некоторые поля ввода кроме чисел вводить ничего нельзя, это простейший пример .... но имеет место быть.
1594 сообщения
#16 лет назад
Цитата:Вот скажем скрипт который каждый день заливает к себе в базу курсы валют , это кто?????
и скрипт который тупо отображает на странице курс валют, а это что????
По-моему и то и другое - граббер. И то и другое берйт контент с чужого сайта и выдаёт его за свой.
Оффтопик
Однако, смею предположить что первое граббер, а второе парсер
56 сообщений
#16 лет назад
С технической стороны это разные вещиГраббингом называется стягивание(скачивание) контента с какого-то источника и сохранение его на жестком диске(не важно где в файлах, в БД, в специально оформленном формате), так как эти все вещи лежат на жестком диске и файлы БД и текстовые файлы и т.д., так что условно все что сохраняется на жестком диске.
А парсеры это анализаторы, они не стягивают контент, они предоставляют только информацию по этому контенту(к примеру ссылки). По большому счету то что вы видите в выдаче поисковиков это результат парсинга, а то что сохранено в кеше это результат граббинга. Парсеры сейчас стоят везде практически в качестве фильтров, при вводе комментариев к примеру, они ищут код зачастую это теги, скрипты и т.д.
56 сообщений
#16 лет назад
Цитата:По-моему и то и другое - граббер. И то и другое берйт контент с чужого сайта и выдаёт его за свой.
Цитата:
Однако, смею предположить что первое граббер, а второе парсер
Все верно.
41 сообщение
#16 лет назад
Цитата ("Anexroid"):Цитата:Вот скажем скрипт который каждый день заливает к себе в базу курсы валют , это кто?????
и скрипт который тупо отображает на странице курс валют, а это что????
По-моему и то и другое - граббер. И то и другое берйт контент с чужого сайта и выдаёт его за свой.ОффтопикОднако, смею предположить что первое граббер, а второе парсер
Не совсем верно.
В каком виде заливает в базу?
Допустим курсы валют с ссылка
Результатом работы граббера будет сохранение целой страницы в базу/файл.
Результатом работы парсера будет извлечение необходимых данных из сохраненной страницы, а дальше уже можно либо сохранять извлеченные данные либо отображать на странице.
56 сообщений
#16 лет назад
Цитата:сохранение целой страницы
Нет. Если к примеру я стягиваю скриптом ролики с youtube это граббинг(не обязательно целую страницу, только ролики), но в этом мне помогает парсер, который рекурсивно перебирает ссылки на ролики. Парсер - так и перводится _синтаксический анализатор_. Граббер - тот что вытягивает, хапуга.
1594 сообщения
#16 лет назад
Странно.Много раз видел ссылки типа "скачать граббер". (wap-загрузки)
Результат его работы -> предоставление пользователю ссылок на файлы с чужого сервера. То есть, если конкретнее, это скрипт загрузок, вкотором файлы берутся не с данного сервера, а с чужого.
А на самом деле это парсер что ли?
56 сообщений
#16 лет назад
Цитата:А на самом деле это парсер что ли?
нет, почему? они ведь скачивают контент к примеру grab_audio_vkontakte
ну по сути легче всего понять где есть что, на том же курсе валют, парсер когда обновляем страницу обращается на сервер к примеру нац.банка и получает курс на текущую минуту(он нигде его не сохраняет!) граббер к примеру тот же парсер только он с переодичностью в 1 час обращается а промежуточный результат хранит в БД.
Парсеры очень часто используются для работы с разными API, которые предосталяют информацию в каком то формате например XML.