Александр Загородний
176 сообщений
#15 лет назад
Здравствуйте
Помогите с написанием граббера изображений, нужно чтоб он действовал как поисковый паук и доставал изображения спрятанные при помощи css наряду с простыми изображениями.\

С чего начинать, может у вас есть линк на какую то статью по данной теме
Дмитрий Н.
46 сообщений
#15 лет назад
Можно ссылку на пример сайта с такой защитой?
Артем Л.
11416 сообщений
#15 лет назад
Lovelas, жестокий парсер будет...
А по логике... ищется див с картинкой, берется название класса, потом ищется в css это название, оттуда выдирается картинка и сохраняется куда нужно...
Александр Загородний
176 сообщений
#15 лет назад
Цитата ("Hungry_Hunter"):
Lovelas, жестокий парсер будет...
А по логике... ищется див с картинкой, берется название класса, потом ищется в css это название, оттуда выдирается картинка и сохраняется куда нужно...

Согласен =)
А вы не знаете никаких статей по написанию парсеров/грабберов ?
Николай Г.
601 сообщение
#15 лет назад
Задача какая, спарсить тупо все картинки? Все примитивнейше - лезете в CSS и цепляете оттуда все, что background-image, ну или как еще можно задавать картинку в CSS, возможно я чего-то не знаю. Если хотите сделать хороший, быстрый грабер - учите матчасть по методу конечных автоматов. Если производительность во главу угла не ставится (насколько я понял писаться это будет на PHP, судя по Вашей аватарке) - зубрите регулярки.
Александр Загородний
176 сообщений
#15 лет назад
Цитата ("dervinar"):
насколько я понял писаться это будет на PHP, судя по Вашей аватарке


Сарказм это хорошо, но нет не на PHP, а на C++. =)
Николай Г.
601 сообщение
#15 лет назад
Цитата ("lovelas"):
Цитата (dervinar):
насколько я понял писаться это будет на PHP, судя по Вашей аватарке


Сарказм это хорошо, но нет не на PHP, а на C++. =)

Это тот случай, когда очень приятно ошибаться. И еще более приятно извиниться, что и делаю.
В таком случае, если грабер предполагается более-менее промышленный, советую почитать про Threads (время распарсивания достаточно мало, по сравнению со временем ожидания загрузки, так что логично сделать его в 20-30 потоков), ну и про метод конечных автоматов, собственно. Ссылки даже кидать лениво - уж очень их в гугле много.
Александр Загородний
176 сообщений
#15 лет назад
В языке Python в стандартной библиотеке есть замечательный класс HTMLParser (анализатор HTML-кода).
А есть ли аналог в C++ ?