Задача 🎯
Пять файлов, предоставленных заказчиком:
- users (данные 500 пользователей заказчика: кто они, откуда, каким тарифом пользуются),
- tariffs (данные о тарифных планах заказчика),
- calls (информация о совершенных пользователями звонках в течение года),
- internet (данные о пользовательском трафике за тот же срок),
- messeges (информация об отправленных в течение года SMS .
Данные 📊
Необходимо провести анализ пользовательского поведения и определить, какой тариф (из двух существующих) прибыльнее с точки зрения компании. Для ответа на этот вопрос будут проверены две гипотезы:
- средняя выручка пользователей тарифов «Ультра» и «Смарт» различаются;
- средняя выручка пользователей из Москвы отличается от выручки пользователей из других регионов.
Используемые библиотеки 🧰
На нашем волшебном пути мы воспользуемся магией следующих инструментов:
— 🐼 pandas
— 🔢 numpy
— 📊 matplotlib
— 🌈 seaborn
—🧮 scipy