Книга о качестве данных

черновик
Что такое качество данных за 30 секунд
Данные чистят не ради перфекционизма, а чтобы бизнес не терял деньги.
Семь измерений качества: СВУПК+Д (Своевременность, Валидность, Уникальность, Полнота, Консистентность, Доступность + Точность).
Автоматизируйте правило контроль триггер (ПКТ), а не чините вручную.
Одна ошибка в таблице может стоить миллиона. Дубликаты, NULL, устаревшие цены, неверный формат - это не досадные мелочи, это реальные потери.
В этой книге - полный набор инструментов для работы с качеством данных: от простых SQL-проверок до автоматизации с Great Expectations, наблюдаемости, Data Contracts и этики.







