[Skillbox] Профессия‌ ‌Data‌ ‌Scientist‌ - рекомендательные системы


1.2 Простейшие методы построения рекомендательных систем

Рекомендация фильма с помощью KNN.

  • User-based kNN
  • Item-based kNN

Корреляция Пирсона Косинусное расстояние

Используется surpriselib

1.7 Метрики ранжирования

Ранжирование — это класс задач машинного обучения с учителем, заключающихся в автоматическом подборе ранжирующей модели по обучающей выборке, состоящей из множества списков и заданных частичных порядков на элементах внутри каждого списка.

Метрики ранжирования

  1. Precision@n
  2. Recall@n
  3. Mean Reciprocal Rank (MRR)
  4. Normalized Discounted Cumulative Gain (NDCG@n)
  5. Mean Average Precision (MAP)

Recall@n – доля из первых n релевантных объектов, показанных пользователю относительно всех релевантных объектов. Метрика не учитывает ни порядок, ни количество релевантных объектов.

AvgRecall@n – усреднение по всем пользователям.

Precision@n — это доля релевантных пользователю объектов из первых n объектов.

AvgPrecision@n — показывает среднюю точность для первых n объектов.


Методы ранжирования

• Pointwise (поточечный), • Pairwise (попарный), • Listwise (списочный).

1.8 Демонстрация к задаче ранжирования

1.11 Домашняя работа

2.2 Демонстрация

2.3 Разбор практики

2.4 Проблема холодного старта и длинного хвоста

2.5 Разбор практики

2.9 Демонстрация

2.12 Домашняя работа