Проекты выполненные в ходе обучения по профессии "Аналитик данных"
🎓Диплом
🎓Diploma (english version)
Название проекта | Задачи проекта | Навыки и инструменты |
---|---|---|
Финальный проект в формате буткемпа | Часть 1: На основе данных о транзакциях интернет-магазина товаров для дома и быта выявить профили покупателей, а также провести анализ товарного ассортимента. Часть 2: Используя данные о действиях пользователей провести оценку корректности A/B-теста и проанализировать его результаты. Часть 3: Произвести различные выгрузки данных о книгах, издательствах, авторах, а также пользовательских обзорах книг с помощью SQL. |
Python , Pandas , NumPy , Matplotlib , Seaborn , Plotly , SciPy , Scikit-learn , SQL , SQLAlchemy , PostgreSQL |
Прогнозирование вероятности оттока пользователей для фитнес-центров | На основе данных о посетителях сети фитнес-центров спрогнозировать вероятность оттока для каждого клиента в следующем месяце, сформировать с помощью кластеризации портреты пользователей. | машинное обучение , классификация , кластеризация , Python , Pandas , Matplotlib , Seaborn , SciPy , Scikit-learn |
Создание дашборда по пользовательским событиям для агрегатора новостей | Используя данные Яндекс.Дзена построить дашборд с метриками взаимодействия пользователей с карточками статей. | продуктовые метрики , построение дашбордов , Python , SQLAlchemy , PostgreSQL , Tableau |
Анализ пользовательского поведения в мобильном приложении | На основе данных использования мобильного приложения для продажи продуктов питания проанализировать воронку продаж, а также оценить результаты A/A/B-тестирования. | A/B-тестирование , событийная аналитика , продуктовые метрики , проверка статистических гипотез , визуализация данных , Python , Pandas , Matplotlib , Seaborn , Plotly , SciPy , Math |
Исследования рынка общепита в Москве для принятия решения об открытии нового заведения | Исследование рынка общественного питания на основе открытых данных, подготовка презентации для инвесторов. | визуализация данных , Python , Pandas , Matplotlib , Seaborn , Plotly , Requests |
Проверка гипотез по увеличению выручки в интернет-магазине — оценить результаты A/B теста | Используя данные интернет-магазина приоритезировать гипотезы, произвести оценку результатов A/B-тестирования различными методами. | A/B-тестирование , проверка статистических гипотез , Python , Pandas , NumPy , Matplotlib , SciPy |
Анализ убытков приложения ProcrastinatePRO+ | Несмотря на огромные вложения в рекламу, последние несколько месяцев компания терпит убытки. Ваша задача — разобраться в причинах и помочь компании выйти в плюс. | когортный анализ , юнит-экономика , продуктовые метрики , Python , Pandas , NumPy , Matplotlib , Seaborn |
Исследование данных об инвестиции венчурных фондов в компании-стартапы | Произвести различные выгрузки данных инвестиций венчурных фондов с помощью SQL. | SQL , PostgreSQL |
Изучение закономерностей, определяющих успешность игр | Используя исторические данные о продажах компьютерных игр, оценки пользователей и экспертов, жанры и платформы, выявить закономерности, определяющие успешность игры. | предобработка данных , исследовательский анализ данных , описательная статистика , проверка статистических гипотез , Python , Pandas , NumPy , Matplotlib , Seaborn , SciPy |
Определение выгодного тарифа для телеком компании | На основе данных клиентов оператора сотовой связи проанализировать поведение клиентов и поиск оптимального тарифа. | описательная статистика , проверка статистических гипотез , Python , Pandas , Matplotlib , NumPy , SciPy |
Продажа квартир в Санкт-Петербурге — анализ рынка недвижимости | Используя данные сервиса Яндекс.Недвижимость, определить рыночную стоимость объектов недвижимости и типичные параметры квартир. | предобработка данных , исследовательский анализ данных , визуализация , Python , Pandas , Matplotlib |
Исследование надёжности заёмщиков — анализ банковских данных | На основе статистики о платёжеспособности клиентов исследовать влияет ли семейное положение и количество детей клиента на факт возврата кредита в срок. | предобработка данных , лемматизация , Python , Pandas , Pymystem3 |
Исследование данных сервиса “Яндекс.Музыка” — сравнение пользователей двух городов | На реальных данных Яндекс.Музыки c помощью библиотеки Pandas и её возможностей проверить данные и сравнить поведение и предпочтения пользователей двух столиц — Москвы и Санкт-Петербурга. | Python , Pandas |