[Skillbox] Профессия Data Scientist - рекомендательные системы
1.2 Простейшие методы построения рекомендательных систем
Рекомендация фильма с помощью KNN.
- User-based kNN
- Item-based kNN
Корреляция Пирсона Косинусное расстояние
Используется surpriselib
1.7 Метрики ранжирования
Ранжирование — это класс задач машинного обучения с учителем, заключающихся в автоматическом подборе ранжирующей модели по обучающей выборке, состоящей из множества списков и заданных частичных порядков на элементах внутри каждого списка.
Метрики ранжирования
- Precision@n
- Recall@n
- Mean Reciprocal Rank (MRR)
- Normalized Discounted Cumulative Gain (NDCG@n)
- Mean Average Precision (MAP)
Recall@n – доля из первых n релевантных объектов, показанных пользователю относительно всех релевантных объектов. Метрика не учитывает ни порядок, ни количество релевантных объектов.
AvgRecall@n – усреднение по всем пользователям.
Precision@n — это доля релевантных пользователю объектов из первых n объектов.
AvgPrecision@n — показывает среднюю точность для первых n объектов.
Методы ранжирования
• Pointwise (поточечный), • Pairwise (попарный), • Listwise (списочный).