Урок 09 · 11 мин чтения

Power Query: чистка и преобразование данных

Где в Power BI приводят сырые данные в порядок до модели — типы, лишние столбцы, фильтры, разделение и разворот. На сквозном наборе курса.

Реальные данные почти никогда не приходят готовыми: лишние столбцы, текст вместо чисел, «01.06.2026» строкой, пустые строки, склеенные поля. Если тащить это прямо в модель — меры будут врать, а связи не соберутся. Чистят данные до модели, в отдельном инструменте внутри Power BI — Power Query.

На каком примере

Сквозной набор курса: Продажи, Товары, Регионы, Календарь. Представим, что выгрузка из источника пришла «грязной» — на ней и потренируемся.

Где живёт Power Query

В Power BI Desktop: Главная → Преобразовать данные — открывается отдельное окно редактора Power Query. Это «кухня»: здесь данные моются и режутся, а в модель попадает уже результат. Отчёт и DAX работают с тем, что вышло из Power Query, а не с исходным файлом.

Два разных языка

Power Query (язык M) готовит и преобразует данные при загрузке/обновлении. DAX считает меры уже на готовой модели, во время просмотра отчёта. Грубое правило: всё, что можно сделать на этапе загрузки (почистить, переименовать, отфильтровать «мусор») — делайте в Power Query, а не в DAX. Это легче и быстрее.

Применённые шаги — главная идея

Справа в редакторе — панель Применённые шаги. Каждое ваше действие (удалил столбец, поменял тип) записывается отдельной строкой. Это как история: шаги можно перематывать, править, удалять и менять местами.

Преобразования воспроизводимы

Вы не правите данные «руками» один раз — вы записываете рецепт. При следующем обновлении Power Query повторит все шаги на свежей выгрузке автоматически. Поэтому чистка в Power Query — это не разовая уборка, а постоянный конвейер.

Базовый набор операций

Типы данных. Самое важное и самое частое. Каждый столбец должен иметь правильный тип: Дата, Целое число, Десятичное, Текст. Клик по значку типа слева от имени столбца. Если Сумма осталась текстом — SUM по ней не сработает.

Удалить лишние столбцы. ПКМ по столбцу → Удалить, или выделить нужные → Удалить другие столбцы. Чем меньше лишнего — тем легче и быстрее модель (см. урок про оптимизацию в экспертном курсе).

Убрать мусорные строки. Удалить строки → пустые, дубликаты, верхние/нижние N. Часто выгрузки несут «шапку» или итоги — их вырезают здесь.

Фильтр строк. Стрелочка в заголовке столбца — как автофильтр в Excel: оставить только нужные значения/диапазон. Например, убрать тестовые заказы.

Заменить значения. Заменить значения — поправить опечатки, привести «Москва»/«МОСКВА» к одному виду, заменить пустые на 0.

Разделить столбец. Разделить столбец по разделителю или числу знаков — «Иванов И.И.» на части, «ЦФО-001» на регион и номер.

Разворот и свёртка (unpivot / pivot)

Частая беда — данные «широкие»: месяцы разнесены по столбцам (Янв, Фев, Мар…). Для модели нужен узкий формат: один столбец «Месяц» и один «Значение».

  • Отменить свёртку столбцов (Unpivot) — превращает широкую таблицу в узкую. Выделяете столбцы-месяцы → Отменить свёртку. Получаете пары «месяц → значение».
  • Свернуть столбцы (Pivot) — обратная операция, реже нужна для модели.
Power BI любит «длинные» таблицы

Модель и DAX устроены под узкий (длинный) формат: измерения в столбцах, факты в строках. Если данные «широкие» (показатель размазан по столбцам-периодам) — почти всегда нужен Unpivot. Это один из самых полезных приёмов Power Query.

Query folding — коротко

Когда источник — база данных (SQL), Power Query старается перевести ваши шаги в запрос к источнику (folding): фильтр и выбор столбцов выполнит сама БД, а Power BI получит уже урезанные данные. Это быстрее. Тяжёлые «ручные» шаги могут folding сломать — подробно об этом в уроке про инкрементальное обновление (экспертный курс).

Не чистите данные в DAX

Типичная ошибка новичка — загрузить грязные данные «как есть» и лечить их вычисляемыми столбцами в DAX: убирать пробелы, переназначать типы, склеивать поля. Это медленнее, раздувает модель и хуже читается. Правильное место для чистки — Power Query, на этапе загрузки. DAX — для бизнес-логики и мер, а не для уборки.

Применить и закрыть

Готово — Главная → Закрыть и применить. Power Query выполнит все шаги, и очищенные таблицы попадут в модель. С этого момента вы строите связи и пишете меры уже на чистых данных.

Проверь себя на наборе

Загрузите Продажи из набора курса в Power Query. Проверьте тип столбца Сумма (должно быть число, а не текст), при необходимости смените. Сколько строк в таблице фактов?

Показать ответ

3000 строк. В наборе курса ровно 3000 строк продаж — это позиции заказов. Если после ваших шагов число другое, вы случайно отфильтровали часть данных — проверьте панель «Применённые шаги».

Что дальше

Одну таблицу почистили. Но данные часто лежат в нескольких таблицах/файлах, которые надо соединить. Следующий урок — объединение запросов: merge и append.

Столбец «Сумма» загрузился как текст, и SUM по нему не работает. Где это правильно исправить?
Тип данных — это задача этапа загрузки, то есть Power Query: один клик по значку типа столбца. Чистка и приведение типов в Power Query легче, быстрее и не раздувает модель. DAX предназначен для бизнес-логики и мер, а не для уборки данных.
Прогресс сохраняется в вашем браузере.
§ Power BI под ключ

Нужно внедрить
это в компании?

Соберём DWH, модель и дашборды под ваши данные. Бесплатная консультация — 30 минут.

Телефон+7 918 042 34 43