Перейти к содержанию
Форум на Кинопоиске

vvtt

Пользователи
  • Сообщений

    53
  • Зарегистрирован

  • Посещение

Весь контент vvtt

  1. 1. С хамством не сталкивался, так как к врачам почти не хожу. 2. Вся история официальной медицины - это история ошибок, большинство врачей даже не ориентируются в современных исследованиях, многие из которых финансируются фармацевтическими компаниями. Доверяю ли я врачам?:lol: 3. Скорую помощь на дом вызывать не доводилось. 4. Наказание должно быть в зависимости от вины и результатов деяний. 5. Если не считать стоматолога, к врачу ходил максимум раз 5 за 28 лет. После того как ЛОР начал доказывать, что у меня не катаральный гайморит, а сужение сосудов в голове, больше к ним не хожу. Тогда каждое утро были сопли, останавливал их грызением хрена. А пропали они после того как начал делать массаж стоп (топтать щебенку). 6. Клятва Гиппократа - пустой звук в большинстве стран. Где-то у врачей пустые карманы, где-то слишком развитый дух предпринимательства. 7. Риторический вопрос. 8. Нетрадиционная медицина - понятие довольно широкое. Нельзя доверять или не доверять ей в целом. Есть эффективные методы, а есть лютый бред и ересь. 9. Наши врачи придумали дисбактериоз, вегетососудистую дистонию, эрозию шейки матки. В цивилизованных странах таких болезней нет. А придумывать болячку в глобальных масштабах нет смысла - болезней и так хватает, фармацевты голодными не останутся. Главное - не вводить в медицинскую практику препараты или методики, которые действительно лечат.
  2. Это хорошо, но я писал насчет близости vvtt-Alpt и vvtt-malyktodos И уверен, что такие примеры может найти каждый пользователь. Если поищет, конечно
  3. Это скорее вопросы к Пирсону… http://www.kinopoisk.ru/level/79/user/523889/ http://www.kinopoisk.ru/level/79/user/957403/ В Вопросах по сайту это все уже давал, вот еще более интересный пример Надеюсь, этот пользователь не будет против http://www.kinopoisk.ru/level/79/user/566049/
  4. Вижу, революционно-реформистские настроения угасают. Разве это можно назвать правильным?
  5. У меня тоже появляются новые друзья по интересам, но с небольшим количеством общих фильмов. То есть, КП развивается, ставится больше оценок, некоторые пользователи с высокой близостью (извиняюсь, пропорциональностью ) достигают определенного количества общих фильмов и попадают в друзья по интересам. Кажется, Ваша формула работает лучше, если оБИ=0, то есть эта часть мОФ/(ОФ+мОФ) * оБИ отпадает, и остается ОФ/(ОФ+мОФ) * СР Но если значение мОФ большое, то коэффициент очень занижается. А при мОФ=1%*К_оцененных очень даже неплохо И еще обращаюсь к тем, кто читает эту тему - присоединяйтесь к обсуждению, чем больше голов, тем лучше
  6. Немного не так. Пользователь может фильтровать друзей по интересам по количеству общих фильмов, а на коэффициенты близости это никак не влияет
  7. Спасибо за стимул продолжать исследования Сомневаюсь, что администрация пойдет на то, чтобы пользователь сам выбирал мОФ. Намного проще привязать мОФ к количеству оценок пользователя. А вот это остается актуальным при любом значении мОФ если оБИ>0
  8. Вопрос не может быть исчерпан, пока при совпадении оценок близость падает, а при увеличении разницы растет. Таких примеров у меня куча, могу еще найти. Только что проверил - считает так, как прежде Меняю оценку Большому кушу на 7 - близость увеличивается Интересно придумывать оптимальную формулу, но если она никому не нужна, зачем трудиться? John Doe давно писал перестать донимать админов. Напишите честно - не будем ничего менять, и перестану
  9. А может 1,11 маловато будет. Ведь разница в 1 балл - это почти ничего. У каждого пользователя оценки могут прыгать вверх-вниз на 1 б. Предлагаю хотя бы 1,15, и смещенность будет меньше влиять на близость. В этой формуле 100 - 11*S - 100/К близость уменьшается, если количество общих фильмов <100. Но если всех оценок пользователя < 100, то это бессмысленно. Поэтому предлагал привязать число в формуле к количеству оценок каждого пользователя. Кч означает часть оценок, которой, как предполагается, достаточно для получения коэффициента близости с высокой вероятностью. Например, треть оцененных фильмов. После этого числа близость будет расти за счет количества общих фильмов. В формуле (100-11,11*S)*(1+(Ко/Кч)/100) Кч утратила свое первоначальное назначение и служит инструментом для регулирования влияния количества общих фильмов на коэффициент близости. Кч=Квсе_оценки_пользователя*% Чем <%, тем больше количество общих фильмов увеличивает близость Интересное предложение, но не все так просто. При мОФ=300, оБИ=50%, ОФ=20 и - противоположных оценках близость 46,88% - одинаковых оценках близость 53,13% При СР=0-49,9% близость почему-то уменьшается при уменьшении ОФ А при СР=50% ОФ вообще не влияет на близость
  10. Меня уже ничего не удивляет. Существующая система подсчета близости показала свою полную неадекватность. Давайте будем общими усилиями совершенствовать формулу с 11,11 Как насчет коэффициентов к разрывам по оценкам и предложения по количеству общих оценок - согласны или нет? Если да, нужно двигаться далее в этом направлении, если нет - давайте свои варианты или замечания. Не сказал бы, что формула Топа проще. И ее результатом является оценка, как это привязать к близости?
  11. А почему тема на меня записана? Я ее не создавал...
  12. Это все очень хорошо, еще бы знать, что такое "смещённость" и "зеркальность", ничего не понял А нет, поспешил, уже раздуплился Трудно будет придумать формулу, которая б различала смещённость. Кроме того, смещенность скорее всего бывает частичная. Думаю, это бесполезно. Кто-то предлагал прикрепить к оценкам расшифровку, например, хуже некуда, плохо, средне и т. д. Или эталонную систему оценки фильмов. Это частично решит проблему смещенности
  13. Zulenium писал здесь, что тему пробовал создать, но ее не пропустили. Так что пишите свою формулу сюда, будем обсуждать. Ну, понятно, что если > 100%, то нужно ставить 100%. Но на практике такое вряд ли будет, так как нужно очень низкую разность по оценкам и много общих фильмов Пробуйте, я только „за”
  14. Я уже передумал Влияние количества общих фильмов все-таки имеет смысл. Например, если пользователь любит классику, то много общих фильмов будет с теми, кто тоже оценивает много старых фильмов. То есть коэффициент близости будет показывать не только похожесть оценок, но и жанровые предпочтения. В таком случае, кажется, лучше не отнимать у тех, с кем мало общих фильмов, а додавать тем, с кем много. Например, так 100 - 11,11 * S + Ко/Кч Ко - количество общих фильмов Кч - часть оцененных пользователем фильмов (10-30%) Но в таком случае пользователям, с которыми близость 50% и 90% при равном количестве общих фильмов добавится одинаковый % Думаю, так будет лучше Уменьшив % Кч, можно увеличить влияние количества общих фильмов на коэффициент близости, и наоборот
  15. Если один, то согласен. Но проблема возникает при определении степени противоположности, при какой это можно расценивать как исключение. И такого, чтобы оценки по всем фильмам совпадали, а по одному были противоположны, практически не бывает. Я тоже ни на чем не настаиваю. Это все детали, главное - желание администрации изменить систему
  16. Заметил, как мне кажется, недостаток в расчете средней разности (S) В первом случае близость очень велика, во втором - не очень. По-моему, разность в 9 баллов должна больше снижать коэффициент, чем 9 разностей по 1 б. Поэтому можно добавить коэффициенты важности, например, такие: Разность в 1 балл *1 2*1,05 3*1,1 4*1,15 5*1,2 6*1,25 7*1,3 8*1,35 9*1,4 Хотя не согласен с тем, что количество оценок должно влиять на близость, но если уже начали обсуждать, то вставлю и свои 5 коп. По формуле 100 - 11*S - 100/К возникает вопрос - почему 100? Для пользователя, который оценил 50 фильмов, 100 общих фильмов - это очень много, кто 2000 фильмов - очень мало. Можно вместо 100 брать часть оцененных фильмов, например 20%. Хотя тогда коэффициенты близостей между двумя пользователями будут немного отличаться для каждого из них
  17. Но зачем так все усложнять? Чем эта корреляция лучше за формулу с 11,11? И еще меня это смущает В том, что меня смущает, написано "Корреляция Пирсона (далее называемая просто корреляцией) предполагает, что две рассматриваемые переменные измерены, по крайней мере, в интервальной шкале. Она определяет степень, с которой значения двух переменных "пропорциональны" друг другу" В примере Ustas.SSR пропорциональность 100%, а близость должна быть 0% О, здесь еще интересные вещи написаны. "По определению, выбросы являются нетипичными, резко выделяющимися наблюдениями... Поэтому единичный выброс ... способен существенно изменить наклон прямой и, следовательно, значение корреляции... Некоторые исследователи применяют численные методы удаления выбросов. Например, исключаются значения, которые выходят за границы ±2 стандартных отклонений (и даже ±1.5 стандартных отклонений) вокруг выборочного среднего." Вот это дела! Большой разрыв по оценке может быть интерпретирован как "выброс". Поэтому он не учитывается. Теперь понятно, почему при увеличении разрыва "близость" (или точнее пропорциональность) может возрастать.
  18. Когда-то я спрашивал, по какой формуле рассчитывается прогнозная оценка фильма и формируются персональные рекомендации здесь Ответом был „Коэфф. Пирсона” Но так как его результатом не может быть оценка, то предположил, что по этому коэффициенту может рассчитываться только близость. Действительно, результат по коэффициенту может изменяться от -1 до 1. А как эту близость определяют, пес его знает Небольшое замечание - на сайте не существует близости со знаком "-". Соответственно, 54% и есть 54%, а не 72% Зы: надеюсь, Zulenium не обижается, что я постоянно так нагло вмешиваюсь в обсуждение его предложения
  19. Так ведь по этому Пирсону при увеличении разрыва близость может даже возрастать! Недавно заметил еще одну забавную вещь. Поставил один пользователь фильму 8, близость 52%. Я удалил свою 4-ку, смотрю близость - изменились только сотые. Нормально, да? Что есть разрыв в 4 балла, что нет, то же самое. Так что в объективности рекомендаций по Пирсону я сомневаюсь больше всего. Указанный Вами недостаток (с которым не соглашаюсь), отпадает, если посмотреть на список друзей по интересам. Чем меньше близость, тем больше предпочтение отдается пользователям с большим количеством общих фильмов. Кроме того, существует фильтр друзей по интересам, где каждый пользователь поставит такой порог общих фильмов, какой захочет. По-моему эта формула практически идеальна. Хотя, конечно, не верю, что что-то измениться
  20. Всеми руками "за". Эта формула намного лучше за мое предложение по подсчету близости Если б нормально считалась близость, может и не было бы шантропы
  21. Ура! У меня единомышленник появился! Можете полюбоваться, что я по близости накопал - ст. 348-350 этой темы. Когда-то я спрашивал об этой жуткой формуле. Кажется, она коэффициент Пирсона называется. Проверил Вашу формулу - очень доволен результатом. Полностью поддерживаю предложение. Для меня адекватность - это когда при увеличении разрыва между оценками близость уменьшается, и наоборот. Вы так не считаете?
  22. Это нормально. Рекомендации формируются не по жанрам или странам, а по всем оценкам друзей по интересам. Я слишком категорично выразился, странности в подсчете близости - это может и не главная причина появления в рекомендациях попсы. Но они, безусловно, искажают список друзей по интересам, и, соответственно, рекомендации. Но если администрацию сайта это не волнует, ничего не могу поделать. Все. Надоело. Выполняю пункт 5 сообщения John Doe
  23. Я тоже некоторые удаляю. Недавно провел эксперимент- поставил все низкие оценки, подождал день, чтобы список друзей по интересам обновился. Список очень поменялся, а на второе место выскочил пользователь с близостью 71%, удаляю то, что наставил, близость - 51% и он вылетает из списка. Так вот, я считаю, что низкие оценки могут нести или пользу или вред для рекомендаций. Полезные оценки фильмам, которым часть друзей по интересам поставили 6 и выше баллов. В этом случае близость с теми, кто высоко оценивает то, что вы оценили низко, упадет. А если друзья по интересам поставили фильму от 1 до 5, то такая низкая оценка будет вредить рекомендациям. Она повысит близость с теми, кто оценил этот фильм, а те, кто такое даже не смотрит, понизятся в списке друзей по интересам. Что и подтвердил эксперимент. Конечно, если фильм оценили все 300 друзей по интересам, то оценка будет полезной в любом случае. Но такого не бывает. Проблема в том, при какой части высоких оценок друзей по интересам удалять низкую оценку. Ведь если вы поставили 4, то близость упадет с теми, кто оценил и на 7, и на 1. Но хотелось бы просто не заморочивать себе голову и ставить все оценки всем фильмам. Для этого хорошо бы при оценке близости не учитывать те фильмы, по которым высшая из оценок двух пользователей 5 и меньше. Ну, можно снизить планку до 4 и меньше
  24. Вообще-то 10 будет мало, нужно минимум 20 Попробовал. Да, близость действительно 100%. Это радует Сколько можно отслеживать? Уже указал примеры по разным пользователям и фильмам Насчет последнего - не обещаю... Но с радостью перестану, когда все станет на свои места. Теперь понятно, откуда у меня в рекомендациях всякие Властелины колец. Раньше, до появления фильтров друзей по интересам, такого не было. Не знаю, как тогда считали близость, но, может, стоит вернуться к этому?
×
×
  • Создать...