(http://forum.kinopoisk.ru/showthread.php?p=1360861#post1360861)
И вот я задумался... Почему понятно-то?
1. Чтобы не украли базу?
http://lmgtfy.com/?q=%D1%81%D0%BA%D1%80%D0%B8%D0%BF%D1%82+%D0%BA%D0%B8%D0%BD%D0%BE%D0%BF%D0%BE%D0%B8%D1%81%D0%BA
Пропускаем первые ссылки, ведущие на сам кинопоиск и качаем. Я было подумал: "если целыми днями парсить кп и качать страницы, то забанят". Но мне вовремя напомнили про товарищей, спокойно ставящих по 100 оценок в минуту в течение нескольких дней, которые потом месяцами\годами висят в рекомендациях.
Да и по похожим запросам в гугле можно найти сайты со спертой базой. Саму базу не искал, меня статическая\спертая не интересует.
2. Чтобы трафик на кп не упал?
Во-первых, xml существуют и так, для тех же медиаплееров парсеры и плагины, и т.д. При этом в xml нет id фильмов на самом кп, чтобы дать на кп ссылку. Уже просил добавить в xml id — игнор.
Во-вторых, просили платный вариант. Почему он невозможен, я тоже не понял. Или ставить обязательную рекламу. Ограничить запросы и снимать ограничение по оплате или согласованию с администрацией ("вот, смотрите, мы не воруем базу, реклама и ссылки на кп везде").
3. "Потому что никто этим заниматься не будет, мы раскрашиваем оценки"? Слишком большая нагрузка на сервер?
Это очень грустно, при этом тот же ластфм дает апи совершенно бесплатно и пользоваться им очень приятно. Более того, у ластфма очень богатый набор функций, xml\json и все радости. Разные графики, пайчарты и облака тегов можно увидеть у многих в профилях. Возможно, тут на пользу ластфма играет то, что сам по себе процесс скроббла уникален, по api его не заменить. Но ничего не мешает скачать опенсорсный скробблер (фубар) и по апи тянуть все данные.
____
Зачем?
Потому что есть желание делать разные интересные штуки, графики и диаграммы, не преследуя при этом цели нажиться на рекламе или украсть базу. Но загрузка страниц на кп иногда бывает по 10 секунд (только что проверил, 3 секунды, не считая изображений), чтобы построить связи двух актеров из своего профиля надо скачать как минимум 3 страницы и распарсить. Это все печаль. Да и хочется делать прозрачно и правильно, а не втихаря качать.
Разные примеры:
http://bost.ocks.org/mike/miserables/
http://zgrossbart.github.com/hborecycling/
http://visual.ly/network-actors-james-bond-movies?view=true