Задача 🎯
Провести исследование с целью построения модели машинного обучения, которая поможет определить регион, где добыча нефти принесёт наибольшую прибыль.
Результаты исследования позволят увеличить прибыль добывающей компании «ГлавРосГосНефть».
- Изучить данные.
- Подготовить данные.
- Обучить и проверить модель.
- Подготовить данные к расчёту прибыли.
- Рассчитать прибыль и риски.
- Проверить гипотезу.
- Написать общий вывод.
После оценки рисков нужно оставить лишь те регионы, в которых вероятность убытков меньше 2.5%. Среди них нужно выбрать регион с наибольшей средней прибылью.
В ходе проведения исследования необходимо проверить гипотезу:
- Гипотеза: среди трёх регионов есть те, в которых вероятность убытков меньше 2.5%
Данные 📊
Входные данные: пробы нефти в трёх регионах. Характеристики для каждой скважины в регионе уже известны.
Используемые библиотеки 🧰
На нашем волшебном пути мы воспользуемся магией следующих инструментов:
— 🐼 pandas
— 🔢 numpy
— 📊 matplotlib
— 🌈 seaborn
—🧠 sklearn