Инструменты

Поиск токсичных комментариев (NLTK) 🗣️🚫

Задача 🎯


Провести исследование с целью построения модели машинного обучения, которая поможет классифицировать комментарии на позитивные и негативные.

Результаты исследования позволят магазину искать токсичные комментарии и отправлять их на модерацию.

Входные данные: набор данных с разметкой о токсичности правок.

Решим поставленную в проекте задачу с помощью библиотеки NLTK.

  1. Изучить данные.
  2. Подготовить данные.
  3. Лемматизировать данные.
  4. Построить и обучить модели.
  5. Протестировать лучшую модель.
  6. Написать общий вывод.

Построим модель со значением метрики качества F1 не меньше 0.75.

Данные 📊


Входные данные: набор данных с разметкой о токсичности правок.

Используемые библиотеки 🧰


На нашем волшебном пути мы воспользуемся магией следующих инструментов: 

— 🐼 pandas 
— 🔢 numpy 
— 📊 matplotlib 
— 🌈 seaborn 
—🧠 sklearn 



Ссылка на GitHub 🚀✨


Пред.
Рекомендация тарифов для телеком компании 🔀

Рекомендация тарифов для телеком компании 🔀

Задача 🎯 Провести исследование с целью построения модели машинного обучения,

След.
Определение стоимости автомобилей 🚗💰

Определение стоимости автомобилей 🚗💰

Задача 🎯 Сервис по продаже автомобилей с пробегом «Не бит, не крашен»

Вам также может понравиться