Изучаем Data Science. Обработка, исследование, визуализация и моделирование данных с помощью Python

Издательство:
Автор
Метки:
обработка данных,анализ данных,хранилища данных,Data Science,компьютерные науки / Computer ScienceПеревод:
К. НазаровПрактическое руководство по анализу данных, раскрывающее полный цикл работы с информацией: от сбора и обработки до построения моделей машинного обучения. Рассмотрена работа с инструментами pandas и SQL, методы выявления закономерностей и очистки данных. Описаны различные источники информации, включая текстовые, бинарные и веб-данные. Подробно изложены статистические методы: доверительные интервалы, проверка гипотез, конструирование признаков. Приведены практические примеры на языке Python из разных областей: анализ транспортных систем, экологические исследования, ветеринарная аналитика. Заключительные разделы посвящены логистической регрессии и оптимизации моделей с применением к задачам классификации текстов.



