Реальные данные почти никогда не приходят готовыми: лишние столбцы, текст вместо чисел, «01.06.2026» строкой, пустые строки, склеенные поля. Если тащить это прямо в модель — меры будут врать, а связи не соберутся. Чистят данные до модели, в отдельном инструменте внутри Power BI — Power Query.
Сквозной набор курса: Продажи, Товары, Регионы, Календарь. Представим, что выгрузка из источника пришла «грязной» — на ней и потренируемся.
Где живёт Power Query
В Power BI Desktop: Главная → Преобразовать данные — открывается отдельное окно редактора Power Query. Это «кухня»: здесь данные моются и режутся, а в модель попадает уже результат. Отчёт и DAX работают с тем, что вышло из Power Query, а не с исходным файлом.
Power Query (язык M) готовит и преобразует данные при загрузке/обновлении. DAX считает меры уже на готовой модели, во время просмотра отчёта. Грубое правило: всё, что можно сделать на этапе загрузки (почистить, переименовать, отфильтровать «мусор») — делайте в Power Query, а не в DAX. Это легче и быстрее.
Применённые шаги — главная идея
Справа в редакторе — панель Применённые шаги. Каждое ваше действие (удалил столбец, поменял тип) записывается отдельной строкой. Это как история: шаги можно перематывать, править, удалять и менять местами.
Вы не правите данные «руками» один раз — вы записываете рецепт. При следующем обновлении Power Query повторит все шаги на свежей выгрузке автоматически. Поэтому чистка в Power Query — это не разовая уборка, а постоянный конвейер.
Базовый набор операций
Типы данных. Самое важное и самое частое. Каждый столбец должен иметь правильный тип: Дата, Целое число, Десятичное, Текст. Клик по значку типа слева от имени столбца. Если Сумма осталась текстом — SUM по ней не сработает.
Удалить лишние столбцы. ПКМ по столбцу → Удалить, или выделить нужные → Удалить другие столбцы. Чем меньше лишнего — тем легче и быстрее модель (см. урок про оптимизацию в экспертном курсе).
Убрать мусорные строки. Удалить строки → пустые, дубликаты, верхние/нижние N. Часто выгрузки несут «шапку» или итоги — их вырезают здесь.
Фильтр строк. Стрелочка в заголовке столбца — как автофильтр в Excel: оставить только нужные значения/диапазон. Например, убрать тестовые заказы.
Заменить значения. Заменить значения — поправить опечатки, привести «Москва»/«МОСКВА» к одному виду, заменить пустые на 0.
Разделить столбец. Разделить столбец по разделителю или числу знаков — «Иванов И.И.» на части, «ЦФО-001» на регион и номер.
Разворот и свёртка (unpivot / pivot)
Частая беда — данные «широкие»: месяцы разнесены по столбцам (Янв, Фев, Мар…). Для модели нужен узкий формат: один столбец «Месяц» и один «Значение».
- Отменить свёртку столбцов (Unpivot) — превращает широкую таблицу в узкую. Выделяете столбцы-месяцы → Отменить свёртку. Получаете пары «месяц → значение».
- Свернуть столбцы (Pivot) — обратная операция, реже нужна для модели.
Модель и DAX устроены под узкий (длинный) формат: измерения в столбцах, факты в строках. Если данные «широкие» (показатель размазан по столбцам-периодам) — почти всегда нужен Unpivot. Это один из самых полезных приёмов Power Query.
Query folding — коротко
Когда источник — база данных (SQL), Power Query старается перевести ваши шаги в запрос к источнику (folding): фильтр и выбор столбцов выполнит сама БД, а Power BI получит уже урезанные данные. Это быстрее. Тяжёлые «ручные» шаги могут folding сломать — подробно об этом в уроке про инкрементальное обновление (экспертный курс).
Типичная ошибка новичка — загрузить грязные данные «как есть» и лечить их вычисляемыми столбцами в DAX: убирать пробелы, переназначать типы, склеивать поля. Это медленнее, раздувает модель и хуже читается. Правильное место для чистки — Power Query, на этапе загрузки. DAX — для бизнес-логики и мер, а не для уборки.
Применить и закрыть
Готово — Главная → Закрыть и применить. Power Query выполнит все шаги, и очищенные таблицы попадут в модель. С этого момента вы строите связи и пишете меры уже на чистых данных.
Загрузите Продажи из набора курса в Power Query. Проверьте тип столбца Сумма (должно быть число, а не текст), при необходимости смените. Сколько строк в таблице фактов?
Показать ответ
3000 строк. В наборе курса ровно 3000 строк продаж — это позиции заказов. Если после ваших шагов число другое, вы случайно отфильтровали часть данных — проверьте панель «Применённые шаги».
Что дальше
Одну таблицу почистили. Но данные часто лежат в нескольких таблицах/файлах, которые надо соединить. Следующий урок — объединение запросов: merge и append.