Репозиторий с моими проектами программы курсов Яндекс.Практикум по направлению Data Science.
No | Проект | Описание | Инструменты |
---|---|---|---|
01 | Яндекс Музыка | Исследование поведения пользователей Яндекс Музыки двух столиц. | pandas |
02 | Исследование надёжности заёмщиков | Проанализировать статистику о платёжеспособности клиентов кредитного отдела банка. | pandas , seaborn , plotly.express |
03 | Исследование объявлений о продаже квартир | На основании данных сервиса Яндекс.Недвижимость определить рыночную стоимость объектов недвижимости и установить параметры, которые помогут отследить аномалии и мошенническую деятельность. | pandas , numpy , seaborn , matplotlib |
04 | Исследование данных о российском кинопрокате | Изучить рынок российского кинопроката и выявить текущие тренды. Обратить внимание на фильмы, которые получили государственную поддержку. Изучить, насколько такие фильмы интересны зрителю. | pandas , numpy , seaborn , matplotlib , missingno |
05 | Статистический анализ | Статистический анализ данных для определения перспективного тарифа телеком-компании, проект делался в тренажёре. | pandas , numpy , seaborn , matplotlib.pyplot , scipy |
06 | Рекомендация тарифов | Построение модели для задачи классификации, которая способна проанализировать поведение клиентов и предложить пользователям новый тариф. | pandas , numpy , sklearn , seaborn , matplotlib |
07 | Отток клиентов | Построение модели прогноза оттока клиентов из банка. | pandas , matplotlib , sklearn |
08 | Выбор локации для скважины | Построение модели машинного обучения, которая поможет определить регион, где добыча принесёт наибольшую прибыль. Анализ возможной прибыль и риски техникой Bootstrap. | pandas , numpy , matplotlib , sklearn |
09 | Прогнозирование оттока клиентов в сети отелей | Выявление потенциальных постояльцев отеля которые с большой долей вероятности отменят бронирование гостиничного номера. Данное исследование призвано улучшить планирование расходов бизнеса и минимизировать финансовые издержки для отеля. | pandas , numpy , seaborn , sklearn |
10 | Предсказание стоимости жилья | На основе данных нужно предсказать медианную стоимость дома в жилом массиве. | pandas , numpy , seaborn , pyspark |
11 | Защита персональных данных клиентов | Защита данных клиентов страховой компании. Разработка метода преобразования данных, чтобы по ним было сложно восстановить персональную информацию | pandas , numpy , seaborn , scipy , sklearn , matplotlib |
12 | Определение стоимости автомобилей | В нашем распоряжении исторические данные: технические характеристики, комплектации и цены автомобилей. Цель проекта построить модель для определения стоимости автомобиля по имеющимся данным. | pandas , numpy , seaborn , sklearn , catboost , lightgbm |
13 | SQL-запросы в Jupyter Notebook | Подключение к базе с помощью SQLAlchemy и зарные SQL запросы. | pandas , matplotlib , seaborn , sqlalchemy |
14 | Прогнозирование температуры звёзды. | Прогнозирование температуры на поверхности обнаруженных звёзд при помощи нескольких методов и применении нейросети как инструмента решения задачи. | pandas , matplotlib , numpy , seaborn , math , sklearn , torch |
15 | Оценка риска ДТП. | Создатние системы, которая могла бы оценить риск ДТП по выбранному маршруту движения. | pandas , matplotlib , numpy , seaborn , scipy.stats , sklearn , sqlalchemy , multiprocessing |
16 | Прогнозирование заказов такси. | Чтобы привлекать больше водителей в период пиковой нагрузки, нужно спрогнозировать количество заказов такси на следующий час. Строим модель для такого предсказания. | pandas , matplotlib , numpy , seaborn , catboost , sklearn , lightgbm , statsmodels |
17 | Проект для интернет-магазина. | Создание инструмента, который будет искать токсичные комментарии и отправлять их на модерацию. | pandas , numpy , catboost , sklearn , lightgbm , tqdm , nltk |
18 | Определение возраста покупателей по фотографии. | Задача посторения модели определяющей возраст человека по фотографии с коэффецентом MAE не более 8-ми. | pandas , tensorflow , matplotlib |
19 | Поиск изображения по запросу. | Обучение модели, которая получит векторное представление изображения, векторное представление текста, а на выходе — покажет, насколько текст и картинка подходят друг другу. | pandas , numpy , tensorflow , matplotlib , PIL , torch , sklearn , catboost , ydata_profiling |
20 | Прогнозирование отока клиентов телекоммуникационной компании. | Строим модель, которая будет предсказывать, разорвёт ли абонент договор или нет. | pandas , numpy , seaborne , matplotlib , sqlalchemy , torch , sklearn , catboost , phik |