Content Downloader, программа парсинга, как парсить, спарсить сайт, парсить сайт Content Downloader

Content Downloader — спасаем сайт.

Автор

Content Downloader — спасаем сайт.

Content Downloader, программа парсинга, как парсить, спарсить сайт, парсить сайт Content Downloader

Решил разнообразить свой блог, давно не делал записи по вебке. Тем более недавно столкнулся с этой проблемой.

Итак, есть один сайт, который скоро закроется, так как срок регистрации домена почти истек. Сайт очень популярен, люди его читают, но вот владелец сайта почти его забросил. Сайт самописный, во всяком случае я не нашел там странички, которые хоть как-то связывались с MySQL. Движок отсутствует. Материала на нем тонна! Раньше это было хобби автора сайта, но со временем человек вырос, возможно, новые интересы у него появились.

Связался с владельцем сайта, предлагал свои услуги по переносу сайта на движок, или хотя бы оплатить домен, но автор сайта сначала отвечал, а потом пропал.

Еще раз скажу, информации было очень много, если начать читать ее, уйдет несколько месяцев, копировать каждую страницу — легче забросить свое хобби.

Конечно тот автор очень-очень увлеченный человек, поэтому мое хобби и коллекция ничтожество по сравнению с его знаниями и его собраниями.

Долго искал метода, чтобы «стащить» его сайт, на случай, если он не продлит срок регистрации домена, а потом на досуге почитать, а по возможности создать «свой» такой же сайт (и пофиг, что контент не уникален, читатели всегда найдутся!).

 

Погуглил, нашел прогу Content Downloader. Разбирал функции программы-парсера полдня. Опять же в гугле нашел советы по настройке программы. Прога оказалась платной, но в странах СНГ мало кто платит за то, что можно найти на «черном рынке»=). Снова с помощью гугла нашел кряк-версию Content Downloader, настроил и пошел «спасать» сайт.

Парсер оказался действительно неплохим, как его рекламировали в интернете. Скорость парсинга сайта зависит от скорости подключения вашего интернета.

Не знаю как надо настраивать прогу для сайтов, которые стоят на «движках», я парсил с самописного HTML-сайта. Все спарсенные странички получились взаимосвязанными друг с другом. Много ума на настройку не нужно.

Почти спарсил весь сайт, вышло несколько сотен мегабайт. Представляете, если бы я по одной страничке копировал, сколько бы это ушло времени, а тут всего за пару часиков. Доволен как слон!

Качайте прогу, радуйтесь, НО только не забывайте, что парсить нужно для блага людей, а не чтобы создавать ГовноСайты для набивания своего кармана!

Написать ответ

Ваш e-mail не будет опубликован. Обязательные поля помечены *

*

code