diff --git a/docs/project/README.md b/docs/project/README.md index 1aed2b71..a9a417b4 100755 --- a/docs/project/README.md +++ b/docs/project/README.md @@ -23,4 +23,5 @@ | [habr-articles-labler](./habr-articles-labler/) | Резбаев Радмир, Марченко Артем | | [comment-emotionality-classification](./comment-emotionality-classification/) | Проскурин Глеб, Мангараков Александр | | [face-emotion-recognition](./face-emotion-recognition) | Якушев Алексей | +| [movie-recommender](./movie-recommender) | Владимирский Сергей | | [movie-recomender](./movie-recomender) | Филиппенко Илья | diff --git a/docs/project/movie-recommender/README.md b/docs/project/movie-recommender/README.md new file mode 100644 index 00000000..1be54605 --- /dev/null +++ b/docs/project/movie-recommender/README.md @@ -0,0 +1,51 @@ +# Проект "Рекомендация фильмов" +----- +### Автор - Владимирский Сергей (P4115) + +#### Цель +Создание рекомендательной системы для рекомендации фильмов для конкретного пользователя + +#### Задачи +1. Сбор данных; +2. Проектирование архитектуры системы; +3. Обучение моделей на основе обучающей выборки; +4. Оценка моделей на тестовой выборке; +5. Выбор лучшей модели; +6. Разворачивание лучшей модели. + +Датасет: [The Movies Dataset](https://www.kaggle.com/datasets/rounakbanik/the-movies-dataset) +Проект: [movie-recommendation](https://github.com/hotstreams/movie-recommendation) + +#### Характеристика: + +Датасет содержит метаданные для 45000 фильмов, которые располагаются в нескольких файлах. +movies_metadata.csv - содержит информацию о самих фильмах: названия, оригинальные названия, идентификаторы, бюджет, синопсис, бюджет и т.д. +keywords.csv - содержит информацию о ключевых словах фильмов +links.csv - содержит информацию о соответствии различных идентификаторов фильмов +ratings.csv - содержит информацию о оценках конкретных пользователей фильмам + +#### Целесообразность использования датасета для решения поставленной задачи +Датасет имеет достаточный объем данных для обучения модели, содержит текстовое описание по tagline, keywords, genres и overview, которое можно использовать для content-based модели, а также достаточное количество рейтингов пользователей. +Распределения по жанрам и ключевым словам изображены ниже. + + +Пример датасета + +![изображение](images/info.png) +![изображение](images/genres.png) +![изображение](images/keywords.png) +![изображение](images/corr.png) +![изображение](images/cor2.png) +![изображение](images/nan.png) + +#### Диаграмма активности + +![Диаграмма без названия drawio(13)](images/activity.png) + +#### Диаграмма компонентов + +![Диаграмма без названия drawio(14)](images/component.png) + +#### Диаграмма развертывания + +![Диаграмма без названия drawio(14)](images/deployment.png) diff --git a/docs/project/movie-recommender/images/activity.png b/docs/project/movie-recommender/images/activity.png new file mode 100644 index 00000000..99cd8f5e Binary files /dev/null and b/docs/project/movie-recommender/images/activity.png differ diff --git a/docs/project/movie-recommender/images/component.png b/docs/project/movie-recommender/images/component.png new file mode 100644 index 00000000..c63512ab Binary files /dev/null and b/docs/project/movie-recommender/images/component.png differ diff --git a/docs/project/movie-recommender/images/cor2.png b/docs/project/movie-recommender/images/cor2.png new file mode 100644 index 00000000..cf820f1d Binary files /dev/null and b/docs/project/movie-recommender/images/cor2.png differ diff --git a/docs/project/movie-recommender/images/corr.png b/docs/project/movie-recommender/images/corr.png new file mode 100644 index 00000000..6db99cf4 Binary files /dev/null and b/docs/project/movie-recommender/images/corr.png differ diff --git a/docs/project/movie-recommender/images/correlation.png b/docs/project/movie-recommender/images/correlation.png new file mode 100644 index 00000000..870e9d81 Binary files /dev/null and b/docs/project/movie-recommender/images/correlation.png differ diff --git a/docs/project/movie-recommender/images/deployment.png b/docs/project/movie-recommender/images/deployment.png new file mode 100644 index 00000000..8d2b8df4 Binary files /dev/null and b/docs/project/movie-recommender/images/deployment.png differ diff --git a/docs/project/movie-recommender/images/genres.png b/docs/project/movie-recommender/images/genres.png new file mode 100644 index 00000000..bcb579f6 Binary files /dev/null and b/docs/project/movie-recommender/images/genres.png differ diff --git a/docs/project/movie-recommender/images/info.png b/docs/project/movie-recommender/images/info.png new file mode 100644 index 00000000..47057489 Binary files /dev/null and b/docs/project/movie-recommender/images/info.png differ diff --git a/docs/project/movie-recommender/images/keywords.png b/docs/project/movie-recommender/images/keywords.png new file mode 100644 index 00000000..e16fe85a Binary files /dev/null and b/docs/project/movie-recommender/images/keywords.png differ diff --git a/docs/project/movie-recommender/images/nan.png b/docs/project/movie-recommender/images/nan.png new file mode 100644 index 00000000..f0b375dd Binary files /dev/null and b/docs/project/movie-recommender/images/nan.png differ