Как работать с Microsoft Power BI — подробное руководство. Энциклопедия маркетинга

Знание основ и их однозначная трактовка облегчает понимание нового материала и позволяет нам разговаривать на одном языке. Нам важны оба аспекта, поэтому, учитывая многочисленные вопросы пользователей, которые начали к нам поступать при освоении Power BI в начале работы, мы сделали шаг назад (чтобы потом прыгнуть на два вперёд) и подготовили маленькую, но весьма полезную серию статей по основным понятиям программы. Наборы данных и их обновления, отчёты и панели мониторинга, плитки и визуализации, из чего состоят все эти блоки, какие из них входят в другие, можно ли (и как) создать отчёт, основанный на нескольких наборах данных одновременно – всё это и многое другое мы раскладываем по полочкам. Дальше будет легче. В первой части мы расскажем вам всё о данных, во второй – всё о стандартных блоках Power BI. Итак, данные и как их готовить.

Источники и наборы данных

Мы уже писали про данные (например, про ), но, видимо, не достаточно ёмко и не всегда просто, раз у вас возникают вопросы. Этот раздел расставит все точки над i.

Следует изначально разделить связанные, но абсолютно разные понятия, которые иногда смешивают (забегая чуть вперёд – да, частично они пересекаются): «источник данных » и «набор данных «.

Источник данных – это только конечный путь к информации, с которой вы хотите работать. Путь к файлу на жёстком диске, URL-ссылка на фейсбук или место хранение базы данных в облаке – всё это путь и всё это – источник данных.

А набор данных – это, в свою очередь, совокупность и источника данных, и самих данных (в ряде случаев, при необходимости, ПО копирует данные, а не просто на них ссылается), и учётных записей, которые позволяют подключится Power BI к этим источникам данных. Т.е. каждый раз, когда вы подключаетесь к данным (статическим или динамическим) или импортируете их, Power BI автоматически создаёт набор данных. Которые затем, как правило, используются при создании отчётов и визуализаций.

Подключение к некоторым источникам данных иногда требует расширенных функций запросов и моделирования Excel или установленного приложения Power BI Desktop. В конце этот статьи мы кратко перечислим те возможности, которые предоставляет Power BI Desktop в разрезе подключения к данным.

Перед тем, как перейти непосредственно к разбору типов данных, которые можно загружать в Power BI, хочется обратить Ваше внимание на то общее, что есть у этих типов или, если точнее, – какими характеристиками должны обладать ваши источники для того, чтобы с ними можно было работать в Power BI. И вот основное, что нужно об этом знать:

Формат данных

Формат данных, естественно, должен поддерживаться Power BI. Обычно с этим проблем не возникает, однако, некоторые типы данных уже готовы к работе с Power BI, а какие-то придётся «подготовить». Так, например, при создании наборов данных из таких источников как Google Analytics или Twilio – никаких сложностей с синхронизацией не возникает. Аналогично и просто загружаются данные и из облачных баз данных типа SQL Azure. Они полностью готовы к работе. Наслаждайтесь.

Но в отдельных случаях прямое импортирование данных невозможно. В частности, – при попытке подключиться к данным, которые расположены на серверах Вашей компании (данные с закрытым доступом) или при попытках загрузить простой TXT-файл. В такой ситуации необходимо:

  1. Извлечь эти данные;
  2. Воспользоваться всеми любимым Excel или Power BI Desktop для первоначальной загрузки данных;
  3. Сохранить полученные данные в виде файла;
  4. Импортировать файл в Power BI.
  5. Profit!

Обновления данных

Хотите всегда иметь актуальную информацию? Наверняка хотите и Power BI может предоставить Вам такую возможность. Используя сведения о подключении (которые, как мы уже говорили, входят в набор данных наряду с указанием источника данных), Power BI подключается к нужным данным, проверяет их на наличие изменений, обновляет свой набор данных а, заодно, и всё связанное с этим набором (отчёты, визуализации и т.д.).

В ближайшем будущем мы обязательно подробно рассмотрим тему обновления данных отдельно, потому как об этом можно и нужно рассказывать много и долго, а в рамках этой статьи мы коснёмся только самого важного: как часто обновляются данные и что для этого нужно сделать?

Частота обновления зависит от типа обновляемых данных, но, например, для некоторых облачных хранилищ данных (таких, как файлы службы OneDrive) Power BI проверяет источник примерно раз в час. Однако стоит помнить, что сами пакеты того же OneDrive обновляются примерно раз в сутки. И, конечно, вы можете настроить время обновлений по своему желанию (если оно поддерживается набором данных) или обновить отчёт по только что изменённому файлу в любой момент времени вручную.

Ответ на вопрос «что нужно для обновлений» также зависит от типа данных. Иногда для этого ничего не требуется, а иногда вам придётся воспользоваться персональным шлюзом Power BI Gateway. Это такой мост безопасной передачи данных, который, например, понадобится для обновления табличных данных Excel, расположенных на локальном диске. Или для настройки обновлений. Подробнее о шлюзе мы также расскажем в статье про обновления данных. Или обратитесь к профессионалам , если не можете ждать.

Типы данных

Итак, мы подошли к самому интересному, к типам данных, с которыми «дружит» Power BI. Для Вашего удобства мы объединили их в группы – это файлы, пакеты содержимого и базы данных .

Если Вы расстроены малым количеством типов данных, к которым можно подключиться через Power BI непосредственно, ещё раз обращаем Ваше внимание на то, что используя Power BI Desktop, Вы получаете около полусотни новых возможностей. Просто это потребует чуть больше дополнительных действий. И, возможно, помощь специалиста.

Чтобы разом охватить максимальное количество данных, к которым вы можете получить доступ и не ограничиваться одним лишь Power BI, мы также расскажем о том, к чему можно получить доступ используя Power Bi Desktop. В нём загрузка данных разделена на категории «Файл», «База данных», «Azure» и «Другие».

Файлы

Некоторые файлы загружаются в Power BI без проблем (например, Excel таблицы или PBI-файлы), некоторые (обычные.txt или таблицы.xml) – нужно сначала преобразовывать (мы писали об этом чуть выше).

Базы данных

Power BI может подключаться как к локальным базам данных, так и к тем, что находятся в облаке. При этом подключения к облачным хранилищам являются динамическими, т.е. каждый раз, когда вы, например, создаёте визуализацию в отчёте, Power BI формирует запрос к набору данных. Для подключения к локальным базам данных необходим корпоративный шлюз Power BI. Для его настройки нужно обратиться к своему администратору (IT службе). Или, опять же, к профессионалам .

В настоящий момент Power BI Desktop предоставляет возможность подключениям к следующим базам данных: SQL Server, Access, SQL Server Analysis Services, Oracle, IBM DB2, MySQL, PostgreSQL, Sybase, Teradata и SAP HANA.

Пакеты содержимого

Пакет – это удобно. В пакете есть всё, что нужно для начала работы. Как, простите за сравнение, в суповом наборе. Набор (данных, на всякий случай, не суповой) может быть как загружен из разных служб (Google Analytics, например), так и создан (и опубликован) пользователем вашей компании.

На пользование пакетами часто есть ограничения. Так, для служб, это необходимость иметь учётную запись, а для организаций – это обязательность использования версии Power BI Pro.

Возможности Power BI Desktop

В завершении статьи мы кратко остановимся на тех возможностях подключения к данным, которые даёт Power BI Desktop:

«Другие» данные Power BI Desktop

Категория «Другие» включает в себя приличное количество возможных подключений: Веб-приложение, Список SharePoint, Веб-канал OData, Файл Hadoop (HDFS), Active Directory, Microsoft Exchange, Dynamics CRM Online, Facebook, Google Analytics, Объекты SalesForce, Отчеты SalesForce, ODBC и бета-версии следующих подключений: R Script, appFigures, GitHub, MailChimp, Merketo, QuickBooks Online, Smartsheet, SQL Sentry, Stripe, SweetIQ, Twilio, ZenDesk, Spark. Маловероятно, что начинающий изучать Power BI не найдёт тут необходимого. Кстати, при подключении к «Web», программа сама ищет информацию на странице и представляет её в режиме предварительного просмотра в области Навигатор. Выбирайте, что вам нужно, редактируйте, загружайте, работайте.

«Azure» Power BI Desktop

Power BI Desktop обеспечивает солидные возможности по подключению и интеграции со службами Azure, поэтому этот вариант подключения данных даже выделен в отдельный раздел меню ми включает в себя следующие возможности для подключения: База данных Microsoft Azure SQL, Хранилище данных SQL Microsoft Azure, Microsoft Azure Marketplace, Microsoft Azure HDInsight, Хранилище BLOB-объектов Microsoft Azure, Табличное хранилище Microsoft Azure. И к перечисленному ещё три бета-версии продуктов: Azure HDInsight Spark, Microsoft Azure DocumentDB и Хранилище озера данных Microsoft Azure. В общем, сценариев функционального объединения Azure и Power BI достаточное количество.

Итог

Как видите, при должном количестве знаний, красивую и полезную аналитику с помощью Power Bi можно вытянуть из такого разнообразного количества источников данных, что мы даже и не знаем, чего тут может не хватать обывателю. Надеемся, вопросов по данным после прочтения этой статьи у Вас не осталось и в следующем обзоре мы расскажем об основных понятиях Power BI – о рабочей области и обо всём, что там находится и что со всем этим делать. Stay tuned.

  • Визуализация данных
    • Tutorial

    UPD: Обновил публикации в связи с выходом Power BI Desktop из стадии Preview 24 июля.

    Сегодня хочу рассказать про построение простого дашборда с план-фактным анализом доходов и расходов в Power BI Desktop и Power BI . В первой части рассмотрим работу с запросами, научимся объединять данные из нескольких источников и выполнять их очистку.

    Исходные данные: несколько файлов Excel в которых хранится информация о показателях доходов и расходов компании за некоторое время. Поскольку форма отчетов и статьи учета несколько раз менялись, то листы с информацией имеют похожую, но не совсем одинаковую структуру. На выходе требуется получить нечто, что позволит руководителям получить представление о том, что происходит с финансами компании
    Давайте посмотрим, как Power BI Desktop позволит объединить данные и их визуализировать.

    Рисунок 1. Стартовое окно Power BI Desktop


    При запуске Power BI Desktop просит указать источник данных или выбрать один из недавних источников. Кстати, по поводу источников – возможно подключение к большому их количеству, включая онлайн и локальные источники. Например, Google Analytics. В нашем случае все отчеты хранятся в одной папке, поэтому выберем в качестве источника «Папка». Такой выбор позволит в дальнейшем добавлять новые отчеты в эту папку и подгружать их данные для анализа нажатием кнопки «Обновить».


    Рисунок 2. Выбор источника данных

    После нажатия кнопки «Подключиться» отображается окно предварительного просмотра результатов запроса к источнику данных. Можно загрузить данные «как есть» или перейти в режим редактирования запроса, нажав на кнопку «Изменить». В большинстве случаев результаты запроса требуется обрабатывать.


    Рисунок 3. Предварительный просмотр результатов запроса

    После нажатия кнопки «Изменить» автоматически открывается окно «Редактор запросов», в котором можно и нужно выполнить очистку и подготовку данных.


    Рисунок 4. Окно редактора запросов

    Как видно на снимке экрана, Power BI Desktop подгрузил файлы из папки и основную метаинформацию. Удалим все столбцы, кроме «Content», «Name» и «Extension». Поскольку имя файла показывает, к какому году относится соответствующий отчёт, мы его для этого и используем.
    Если нажать на любую строку в столбце «Content», Power BI Desktop откроет содержимое соответствующей книги. Обратите внимание, что в разделе «Параметры запроса» все выполненные шаги записываются и их можно изменять или удалять. Если же открыть окно «Расширенный редактор», то откроется окно, в котором будет виден программный код для всех выполненных действий. Да в Power BI Desktop есть свой язык программирования “M” и это очень круто.


    Рисунок 5. Расширенный редактор запросов

    Поскольку для формирование отчета требуется содержимое всех файлов Excel в папке, а не только одного, то я удалю два последних шага и использую некоторые функции языка “M” для парсинга содержимого книг Excel из папки.
    Перед дальнейшей обработкой данных также нужно учесть то, что в папку могут быть подгружены не только файлы Excel. Поэтому нужно применить фильтр к столбцу «Extension», что позволит исключить ненужные типы файлов.


    Рисунок 6. Применение фильтра

    Теперь нужно выполнить «извлечение» содержимого книг Excel. Для этого я добавлю новый столбец, используя функцию Excel.Workbook, которая позволяет «извлекать» содержимое книг Excel. Новый столбец содержит в себе значения типа «Таблица», что позволяет «развернуть» его содержимое на несколько других столбцов. При «развертывании» можно выбирать, какие столбцы будут отображены. В данном случае смысловую нагрузку несут столбцы «Data» и «Item»


    Рисунок 7. Добавление пользовательского столбца

    Столбец «Data» содержит в себе данные листов Excel, а «Name» и «Item» я в дальнейшем использую для временных отметок.
    Поскольку столбец «Name» содержит данные вида yyyy.xlsx, где yyyy это год отчета, то выполним простую операцию разделения данных в столбце. Разделение можно выполнять как по количеству символов, так и по разделителю. В данному случае столбец нужно делить по разделителю.


    Рисунок 8. Разделение столбца


    После разделения столбца нужно будет его переименовать.


    Рисунок 9. Окно настройки параметров разделения столбца


    Рисунок 10. Подготовленный к «развертыванию» запрос

    Затем я «развертываю» столбец Data и вижу содержимое всех файлов и листов Excel, при этом в виде, который непригоден для построения итоговой отчетности. Но я могу использовать возможности Power BI Desktop для очистки данных.


    Рисунок 11. Запрос после «развертывания» содержимого файлов

    1. Использую верхние строки как заголовки и затем переименую столбцы. Удалю столбцы «Фактическое отклонение» и «Отклонение в %». В дальнейшем их пересчитаем.
    2. Удалю строки, которые содержат пустые значения и значение «Показатель» в столбце «Показатель», применив фильтрацию. Таким же образом удалю строки, в которых содержатся суммарные значения, например «Итого ЧОД», «Итого» и т.д.


    Рисунок 12. Меню фильтрации данных

    3. Используя функцию «Замена значений» выполню замену синонимов, например «Доход» и «Доходы».


    Рисунок 13. Замена значений

    4. Еще немного изучив содержимое столбца «Показатель» обнаруживаю, что все доходы у меня относятся к показателю «Доход» или «Доходы». Всё остальное относится к расходам, что сильно облегчает задачу. Для удобства дальнейшей обработки и фильтрации создам столбец «Категория», который будет содержать значение «Доход», если в столбце «Показатель» присутствует слово «Доход», а во всех остальных случаях примет значение «Расход».


    Рисунок 14. Добавление столбца «Категория»

    5. Дальше, мне нужно указать, что тип значений в столбцах «План» и «Факт» - десятичное число. Но перед этим мне нужно удалить из содержимого этих столбцов пробелы.
    6. После выполнения операции проверяю столбцы на наличие ошибок и отрицательных значений. Поскольку в нашем случае наличие отрицательного значения означает ошибку ввода, то используя функцию преобразования значений выделяю абсолютное значение в столбцах «План» и «Факт». На этом базовая очистка данных закончена.
    7. Для того, чтобы отображать показатели с привязкой по времени требуется указать дату для каждой записи. В таблице содержится месяц в текстовом виде и год. Для удобства примем, что данные отображаются на конец каждого месяца. Здесь нас подстерегает проблема – язык «М» не позволяет на текущий момент конвертировать названия месяцев в даты. Поэтому потребуется сделать несколько промежуточных шагов.
    8. Создадим новый запрос, который будет содержать названия месяцев и их номера. Для этого создаем пустой запрос, открываем расширенный редактор и вставляем следующий код:
    let
    Source = {"январь", "февраль", "март", "апрель", "май", "июнь", "июль", "август", "сентябрь", "октябрь", "ноябрь", "декабрь"},
    #"Converted to Table" = Table.FromList(Source, Splitter.SplitByNothing(), null, null, ExtraValues.Error),
    #"Added Index" = Table.AddIndexColumn(#"Converted to Table", "Index", 0, 1),
    #"Added to Column" = Table.TransformColumns(#"Added Index", {{"Index", each List.Sum({_, 1})}}),
    #"Renamed Columns" = Table.RenameColumns(#"Added to Column",{{"Column1", "Месяц"}})
    in
    #"Renamed Columns"


    Рисунок 15. Добавление пустого запроса

    9. Перехожу в запрос «План-Факт» и объединяю запросы, выбрав нужный тип объединения.


    Рисунок 16. Объединение запросов

    10. Данные из запроса «Месяцы» добавились как новый столбец. Раскрываю его и теперь у нас есть все данные для формирования даты. Создаю новый столбец с названием «Дата», используя формулу: =Date.EndOfMonth(#date([Год],,1)) Столбец добавлен и он содержит последнее число каждого месяца. Для того, чтобы Power BI Desktop мог группировать даты по месяцам и годам, нужно будет явно задать тип «Date»


    Рисунок 17. Добавление столбца «Дата»

    11. Удалим столбцы Index, Год и Месяц. Они нам больше не нужны. Затем нужно нажать на кнопку «Закрыть и загрузить», чтобы перейти к моделированию и визуализации данных.

    На этом базовая часть обработки данных закончена и можно перейти к визуализации. Возможности визуализации данных в Power BI Desktop рассмотрим в

    2 сентября 2015

    Вам нужно подготовить бизнес-презентацию и на это у Вас есть пара дней. Но это может быть весьма непростой задачей даже для опытного пользователя, особенно когда данные находятся в нескольких источниках, в облачных и локальных, и Ваш ИТ отдел занят совершенно другими задачами и не может Вам помочь в подготовке презентации.

    Было бы замечательно иметь под рукой доступные и понятные инструменты, которые помогли бы преобразовать и визуализировать Ваши данные для создания наглядной презентации, чтобы посмотреть на ситуацию «свежим взглядом».

    Вам повезло. Power BI - это облачная бизнес-аналитика, которая помогает пользователям визуализировать и анализировать данные с большей скоростью, эффективностью и простотой. Вы можете зарегистрироваться на сайте Power BI и начать использование сервиса совершенно бесплатно.

    1. Получите данные в несколько кликов

    Подключитесь к источнику данных за считанные минуты. Нажмите кнопку Получение данных на панели навигации.

    Затем выберите источник данных: пакет содержимого, файл, базу данных или примеры. Источник данных может располагаться в Вашей организации, локально или в облаке, или в онлайн-службах, например, Microsoft Dynamics, Salesforce.com, QuickBooks Online или Google Analytics. Соединять данные вместе очень просто.





    2. Создание информационных панелей.

    Информационные панели позволяют следить за важной информацией о деятельности организации. Информационная панель в Power BI является подобием панели приборов в автомобиле, на которой выводится важная информация о нем: скорость, уровень топлива и исправность двигателя, только в этом случае приводится информация о вашей компании.

    Информационная панель показывает локальные и облачные данные в одном месте. Каждая плитка на информационной панели является визуализацией, созданной из данных одного или более набора данных.

    Посмотреть, как устроена информационная панель, Вы можете на готовом примере данных по розничной торговле, который доступен в сервисе Power BI.



    Как создаются информационные панели? Все просто!

    Нажмите на иконку Плюс рядом с заголовком «Информационные панели » и введите название.


    Подключитесь к источнику данных, используя данные из Ваших отчетов или наборов данных, которые уже доступны в Power BI, или добавьте новый источник данных. Закрепите плитку на информационной панели, измените ее размер и название. Плитки также можно перемещать по экрану и удалять в случае необходимости. Поэкспериментируйте с плитками и выберите подходящие для Вас параметры.

    3. Общий доступ к информационным панелям



    Ваши коллеги получат по электронной почте приглашение со ссылкой на информационную панель. При нажатии на ссылку, информационная панель добавляется к Вашим информационным панелям Power BI.

    4. Просмотр информационных панелей на мобильных устройствах

    Коллега прислал вам ссылку на информационную панель? Теперь Вы можете просмотреть ее на своем мобильном устройстве. Вы можете исследовать данные, комментировать плитки и делиться ими с другими из любой точки мира. Power BI доступен на устройствах под управление iOS и Android, работает на всех версиях Windows 8.1 и Windows 10 устройств, таких как планшет Surface Pro.



    Вы слышали выражение: «Пусть факты говорят сами за себя»? Но иногда самый быстрый способ получить данные, это задать вопрос. В Power BI Вы можете запрашивать данные с использованием естественного языка.

    Введите свой запрос в поле на информационной панели. Например: 2014 sales by month and territory as stacked bar.

    В процессе набора своего запроса, Power BI выбирает лучшие визуализации для отображения данных по Вашему запросу и при этом визуализация динамически изменяется при изменении запроса. Потрясающе!

    6. Создание впечатляющих отчетов

    Используйте инструменты Power BI, чтобы впечатлить Ваших коллег интуитивно понятным представлением Ваших данных. Разные варианты визуализаций предоставляют возможность по-новому взглянуть на Ваши данные и оценить их в нужном разрезе.



    Чтобы создать новый отчет, выберите набор данных, чтобы открыть, или щелкните правой кнопкой мыши и выберите Просмотреть .

    Алексей Селезнёв Head of Analytics Dept. , Netpeak™

    Для пользователей Microsoft Windows 10 есть отдельная версия Power BI Desktop, которую вы можете найти, перейдя по этой ссылке.

    Откуда можно загружать данные?

    Power BI имеет множество встроенных коннекторов к различным сервисам и базам данных, с помощь которых вы в считанные минуты можете загрузить в программу нужный набор данных из различных источников, связать их между собой и построить консолидированные отчеты и диаграммы. На момент написания статьи все доступные коннекторы распределены на четыре группы: 1. Группа «Файл»:

    Как видите, в Power BI можно импортировать данные из наиболее известных баз данных и сервисов, используя различные форматы файлов. После загрузки информации из доступных источников в Power BI, перед вами открываются большие возможности по очистке и преобразованию данных, в связи с тем, что в платформе присутствует достаточно мощный ETL функционал. Загружаемые таблицы можно редактировать, а на основе их столбцов создавать расчетные столбцы и меры - таким образом вы можете преобразовать массивы информации в наборы данных со структурой, необходимой для построения визуализации.

    Какие визуализации можно построить?

    Сформировав набор данных, загруженных из различных источников, вам станут доступны множество встроенных элементов визуализации:

    • линейчатая диаграмма с накопление;
    • гистограмма с накоплением;
    • линейчатая диаграмма с группировкой;
    • гистограмма с группировкой;
    • нормированная линейчатая диаграмма;
    • нормированная гистограмма;
    • график;
    • диаграмма с областями;
    • диаграмма с областями с накоплением;
    • линейная гистограмма и гистограмма с накоплением;
    • линейная гистограмма и гистограмма с группировкой;
    • каскадная диаграмма;
    • точечная диаграмма;
    • круговая диаграмма;
    • диаграмма дерева;
    • карта;
    • таблица;
    • матрица;
    • заполненная карта;
    • воронка;
    • датчик;
    • многострочная карточка;
    • карточка;
    • ключевой показатель эффективности;
    • срез;
    • кольцевой график;
    • визуальный элемент r-script (на данный момент включается в параметрах программы).

    Все элементы имеют достаточно широкий спектр настроек, направленных на изменение нужных параметров: цвет, фон, название, границы и так далее. Если вам будет недостаточно стандартного набора, можно загрузить пользовательские визуальные элементы.

    Как загрузить данные в Power BI Desktop?

    1. Установите связь с Google Analytics

    1.1. Приступим непосредственно к загрузке информации из представления Google Analytics. На вкладке «Главная» в группе «Внешние данные» жмем на кнопку «Получить данные».

    После чего в диалоговом окне «Получить данные» в группе «Другое» выбираем сервис «Google Analytics» и жмем «Подключить».

    1.3. Последний шаг - предоставить разрешение на просмотр данных в нужном представлении Google Analytics.

    1.4. После клика по кнопке «Разрешить» мы автоматически возвращаемся в окно «Учетная запись Google», где будет оповещение, что вы вошли в систему. Жмем на кнопку «Подключение».

    В открывшимся окне «Навигатор» вы увидите список всех доступных аккаунтов, ресурсов и представлений Google Analytics.

    В каждом представлении присутствует одинаковый набор параметров и показателей, распределенных на 28 групп:

    • Ad Exchange - информация об эффективности рекламы в Ad Exchange;
    • AdSense - информация об эффективности показов рекламы AdSense;
    • AdWords - информация об эффективности рекламных кампаний в AdWords;
    • App traking - информация о взаимодействии с мобильным приложением;
    • Audience - демографическая информация о посетителях сайта;
    • Channel grouping - группы каналов трафика;
    • Content Experiments - информация о проводимых экспериментах;
    • Contetn Grouping - классификация контента сайта по группам;
    • Custom variables or colunms - пользовательские параметры и показатели;
    • DoubleClick Campaign Manager - информация о эффективности рекламы в DoubleClick;
    • Ecommerce - данные электронной торговли;
    • Event tracking - информация о событиях;
    • Exceptions - исключения;
    • Geo network - геоданные посетителей;
    • Goal conversion - данные о достижении целей;
    • Internal Search - информация об использовании поиска на сайте;
    • Page Tracking - информация о страницах, которые просмотрели пользователи;
    • Platform or device - операционные системы и устройства пользователей;
    • Related product - связанные сервисы;
    • Session - информация о сеансах;
    • Site speed - скорость загрузки страниц;
    • Social activities - показатели активности в социальных сетях;
    • Social interaction - показатели взаимодействия трафика из социальных сетей;
    • System - информация о системных показателях посетителей;
    • Time - информация о времени совершения событий;
    • Traffic source - информация об источниках трафика;
    • User - информация о пользователях;
    • User timings - длительность сеанса.

    В качестве примера давайте выберем следующие параметры: Channel grouping -> Default channel grouping; User -> User Type; Time -> Month of year. В качестве показателей возьмем: Session -> Sessions; Session -> Bounces; Session -> Session duration. Хочу заметить, что в Power BI, как и при любом API запросе в Google Analytics, существует ограничение на максимальное количество запрашиваемых параметров (не более семи) и показателей (не более десяти).

    1.5. Для того, чтобы загрузить выбранные данные в модель данных Power BI, жмем кнопку «Загрузить», которая располагается в нижнем правом углу окна «Навигатор».

    Теперь загруженный набор данных отображается в области полей, и мы можем строить на основе этой информации любой доступный визуальный элемент.

    2. Как загрузить данные из MySQL?

    Чтобы показать функциональность Power BI, я сгенерировал и загрузил в MySQL данные о продажах. Следуя описанным ниже инструкциям, можно подключать любые доступные базы данных и после соединять всю загруженную информацию в одну таблицу или график.

    2.1. Для загрузки данных о продажах из MySQL, как в описанном примере, необходимо воспользоваться командой «Получить данные», которая находится на вкладке «Главная».

    2.2. В диалоговом окне «Получить данные» в группе «База данных» выбираем пункт «База данных MySQL».

    2.3. После клика по кнопке «Подключить» в окне «База данных MySQL» вводим IP сервера, имя базы данных и текст SQL запроса. Если вы не знакомы с SQL и хотите просто выбрать некоторые таблицы из базы данных целиком, то вводить SQL запрос не следует, на следующем шаге у вас будет возможность выбора таблицы. Поскольку я загрузил тестовые данные с локального ПК, то в поле «Сервер» вместо IP я укажу «localhost».

    2.5. На этом этапе подключение к MySQL серверу установлено. В случае, если вы ранее прописали SQL скрипт, то результат его работы будет загружен в модель данных. Поскольку мы не указывали запрос, в левой части диалогового окна «Навигатор» появится список доступных таблиц из указанной ранее базы данных. В моем случае доступна всего одна одна таблица «sales», все остальные - системные, в связи с чем ставим галочку напротив названия таблицы продаж и жмем «Загрузить».

    Теперь в модель данных Power BI загружены данные из двух источников: Google Analytics и MySQL.

    3. Как упорядочить данные?

    После того, как все необходимые данные загружены, необходимо привести их к нужному виду. Наиболее удобный способ редактирования данных - перейти в режим «Данные», с помощью одноименной команды, расположенной на левой панели рабочего окна Power BI.

    В режиме данных вы можете изменить тип данных, хранящихся в любом столбце, создавать новые столбцы и меры, используя возможности языка формул DAX, заменять значения хранящиеся в столбцах - в общем делать с данными все, что считаете нужным. В нашем случае следует изменить формат вывода поля «Sale» на денежный. В меню «Поля», которое в режиме «Данных» находится в правой части окна, выбираем нужный набор данных (в нашем случае «Данные из MySQL»), после чего кликаем на название столбца «Sales» и меняем формат данных, перейдя на вкладке «Моделирование» в группу «Форматирование».

    4. Как установить связи между таблицами

    Для того, чтобы строить визуализацию на основе данных из двух различных источников необходимо настроить между ними связи. Power BI поддерживает три типа связей:

    • многие к одному;
    • один к одному;
    • один ко многим.

    Единственный подходящий для загруженных таблиц тип связи - многие ко многим. Он создается через промежуточные таблицы (справочники) и средствами создания двух связей типа многие к одному и один ко многим. В нашем наборе данных существует три параметра, по которым необходимо настроить связи между таблицами «Default Channel Group», «YearMonth», «UserType». Соответственно необходимо создать три одноименных справочника, которые будут содержать список всех уникальных элементов каждой из перечисленных категорий. В качестве примера мы загрузим список уникальных элементов по каждому полю из CSV файлов.

    • channelGroup;
    • yearMonth;
    • userType.

    4.1. Процесс загрузки CSV файлов в Power BI так же прост, как и описанные раннее подключения к Google Analytics и MySQL: жмем кнопку «Получить данные», в группе «Файл» выбираем «CSV» и по очереди загружаем в модель данных три скачанных CSV файла.

    4.2. При загрузке таблиц «channelGroup» и «userType» необходимо указать, что первая строка является заголовком столбца. Для этого перейдите в режим редактирования запроса, на вкладке «Преобразование» в выпадающем меню «Таблица» используйте команду «Использовать первую строку в качестве заголовка»:

    Если на этом этапе вы все сделали правильно, модель данных будет состоять из пяти таблиц. Чтобы в этом убедиться, можно посмотреть в область полей либо перейти в режим визуального интерфейса просмотра модели данных (для этого кликните по иконке с изображением связей между таблицами на левой панели Power BI).

    Power BI самостоятельно определил некоторые связи, поэтому модель данных выглядит следующим образом.

    4.3. Для дальнейшего создания всех связей нам необходимо изменить тип текущих связей на однонаправленные, в противном случае связи, которые мы планируем создать, будут неоднозначны и при их определении Power BI выдаст ошибку. Чтобы изменить тип связей необходимо дважды кликнуть по связи левой кнопкой мыши и в диалоговом окне «Изменение связи» поменять направление кроссфильтрации на однонаправленную.

    Изменив направление кроссфильтрации связей, созданных автоматически, можно переходить к процессу создания остальных связей.

    4.4. В Power BI существует два способа определения связей между таблицами: в визуальном режиме и с помощью диалогового окна «Управление связями». Чтобы создать связь в режиме визуализации модели данных, нужно перетащить с помощью мыши поле из одной таблицы в ту, с которой хотим создать связь. Давайте таким образом активируем связь по полю «Default channel group» в таблице «Данные из GA» с полем «Channel» в таблице «channel».

    Как в предыдущих примерах, необходимо изменить направление кроссфильтрации на однонаправленную. Теперь модель данных выглядит следующим образом:

    4.5. Оставшиеся связи мы будем создавать с помощью диалогового окна «Управление связями», для этого кликните на кнопку «Управление связями» на вкладке «Главная».

    Диалоговое окно «Управление связями» содержит все созданные ранее связи, для создания новых связей следует нажать на кнопку «Создать».

    В окне создания связи необходимо указать таблицы и поля, по которым вы планируете настроить связь, а так же указать кратность связи и направление кроссфильтрации.

    4.6. Для создания связи между таблицей «данные из GA» и «yearMonth» необходимо в окне создания связи установить следующие параметры.

    Таким же образом нам надо связать таблицу «данные из MySQL» и «yearMonth».

    Модель данных теперь выглядит следующим образом.

    Как видите, таблицы «Данные из GA» и «Данные из MySQL» теперь связаны между собой через справочники и имеют друг к другу кратность связи многие ко многим.

    5. Как построить визуализацию?

    5.1. Чтобы создать визуализацию, вернемся в режим «Отчет», воспользовавшись одноименной кнопкой в меню, расположенном в левой части окна Power BI.

    5.2.1. В качестве элемента визуализации будем использовать вид «Линейная гистограмма и гистограмма с накоплением».

    5.2.2. Перетягиваем поле «month» из таблицы «yearMonth» в область «Общая ось».

    5.2.3 Перетягиваем поле «Session» из таблицы «Данные из GA» в область «Значения столбцов».

    5.2.4. Перетягиваем поле «sales» из таблицы «Данные из MySQL» в область «Значения строк».

    В результате этих манипуляций в области отчетов будет построена диаграмма следующего вида.

    Как видите, диаграмма сочетает в себе информацию о сеансах и продажах из двух разных источников.

    5.3. Дополнительно можно воспользоваться опциями форматирования объектов визуализации, кликнув по иконке с кисточкой.

    В результате чего вы можете изменять цвета, размер, шрифт, фон и прочие параметры элемента визуализации.

    6. Как настроить фильтры данных?

    Для более удобной работы с фильтрами данных следует добавить на рабочий лист три среза. 6.1. Перетащите с помощью мыши в пустое место области отчетов следующие поля:


    6.2. После чего по очереди выделите мышкой каждый из этих объектов и переключите в режим «Срез».

    В результате у нас получится лист с возможностью фильтрации данных по типу пользователя, источнику / каналу и месяцу года.

    6.3. Если вам понадобится сменить аккаунт Google, к которому привязаны определенные представления Google Analytics, воспользуйтесь меню «Файл» -> «Параметры и настройки» -> «Настройки источника данных».

    6.4. Поэкспериментируйте с элементами визуализации и выберите наиболее подходящие, (более подробно о правилах выбора диаграммы можно узнать из публикации «Как построить диаграмму и не облажаться»), после чего все диаграммы и таблицы обновляйте нажатием одной кнопки.

    1. Как установить связь Power BI Service с Google Analitycs?

    Чтобы открыть рабочую область, нажмите на кнопку с изображением меню. С помощью кнопки «Получение данных» начинаем процесс подключения к Google Analytics.

    В списке доступных служб находим и выбираем Google Analytics.

    Жмем кнопку «Подключится».

    Для Google Analytics на данный момент существует только один способ проверки подлинности «oAuth», поэтому в диалоговом окне проверки подлинности ничего не изменяем и жмем «Войти».

    1.2. Выбираем нужный нам Google аккаунт.

    Подтверждаем разрешение Power BI Service на просмотр данных Google Analytics.

    1.3. Следующий шаг - выбор аккаунта, ресурса и представления Google Analytics.

    После того, как вы нажмете «Импорт», в рабочей области автоматически будет сформирован набор данных, отчет и информационная панель.

    2. Как работать с отчетами?

    Также вы можете посмотреть все сформированные автоматически отчеты, для этого кликните в основном меню в области отчетов по пункту «Google Analytics».

    2.1. Отчеты сгруппированы по страницам:

    • Site trafic;
    • System usage;
    • Total users;
    • Page performance;
    • Top pages.

    2.1.1. Соответственно страница Site traffic содержит информацию о сеансах и хитах, а также о поведенческих показателях пользователей.

    2.1.2. Страница System usage содержит информацию о геолокации, операционной системе и типе устройства пользователей.

    2.1.3. На странице Total User вы найдете информацию о количестве посетителей.

    2.1.4. На странице Page Performance содержится информация о скорости загрузки страниц.

    2.1.5. Последняя страница Top Pages отображает информацию о количестве уникальных просмотров, а также о количестве входов и выходов с сайта в разрезе страниц.

    2.2 Можно изменить любой элемент отчета либо добавить новую страницу, для этого достаточно кликнуть по кнопке «Изменить отчет».

    В нижней части экрана отобразится кнопка добавления новых страниц в отчет.

    2.3. Как вы могли заметить, в онлайн версии Power BI нет возможности выбора параметров и показателей при загрузке данных из Google Analytics, в связи с чем вы можете работать только со стандартным набором полей, который в свою очередь состоит из пяти таблиц:

    2.3.1. Calculaions :

    • Avg.daily new users - среднедневное количество новых пользователей;
    • Avg. daily new users (weekday) - среднедневное количество пользователей в разрезе дней недели;
    • Avg. daily users - среднедневное количество пользователей;
    • Avg.daily users weekday - среднедневное количество пользователей в разрезе дней недели;
    • Avg. session duration (sec) - средняя длительность сеанса в секундах;
    • Bounces MoM - прирост количества отказов за последние 30 дней;
    • Hits MoM - прирост количества хитов за последние 30 дней;
    • New users MoM - прирост новых пользователей за последние 30 дней;
    • Session MoM - прирост объема сеансов за последние 30 дней.

    2.3.2. Overwiev :

    • Avg. session duration - средняя длительность сеанса;
    • Bounces - количество отказов;
    • Browser - браузер пользователя;
    • Country - страна пользователя;
    • Date - дата сеанса;
    • DayOfMonth - день месяца, когда был совершен сеанс;
    • DayOfWeek - день недели, когда был совершен сеанс;
    • Device category - тип устройства;
    • Hits - количество хитов;
    • MonthName - название месяца;
    • MonthYear - месяц года;
    • Operating system - операционная система пользователя;
    • Page / sessions - среднее количество просмотренных страниц на сеанс;
    • Pageviws - общее количество просмотренных страниц;
    • Sessions - количество сеансов;
    • Year - год.

    2.3.3. Page performance :

    • Date - дата;
    • DayOfMonth - день месяца;
    • DayOfWeek - день недели;
    • DomainLookupTime - время поиска домена;
    • MonthName - название месяца;
    • MonthYear - месяц года;
    • PageLoadTime - время загрузки страницы;
    • RedirectionTime - время редиректа;
    • Year - год.

    2.3.4. Pages :

    • Date - дата;
    • DayOfMonth - день месяца;
    • DayOfWeek - день недели;
    • Entrances - количество заходов;
    • Exits - количество выходов;
    • MonthName - название месяца;
    • MonthYear - месяц года;
    • Page - url страницы;
    • PageTitle - название страницы;
    • Pageviews - количество просмотров страницы;
    • TimeOnPage(sec) - общее время, проведенное на странице в секундах;
    • Unique pageviews - количество уникальных просмотров страниц;
    • Year - год.

    2.3.5. User :

    • Date - дата;
    • DayOfMonth - день месяца;
    • DayOfWeek - день недели;
    • DaysFromToday - количество дней с сегодняшнего дня;
    • MonthName - название месяца;
    • MonthYear - месяц года;
    • New users - количество новых пользователей;
    • Users - количество пользователей;
    • Year - год.

    Эти пять таблиц, загруженные из Google Analytics, не связаны между собой, так как в онлайн версии Power BI у вас нет возможности создавать связи. Но в Power BI Service можно публиковать файлы, разработанные в Power BI Desktop файлов.

    3. Как опубликовать информацию с Power BI Desktop?

    Для этого достаточно быть зарегистрированным пользователем данной службы и нажать кнопку «Опубликовать».

    После чего начинается процесс публикации файла в службе Power BI.

    Если вы все сделали правильно, то получите сообщение, что файл был успешно опубликован, и вы можете запустить автоматический анализ данных. Power BI Service выведет на экран найденные в данных закономерности.

    4. Как создавать информационные панели?

    4.1. Вы можете создавать новые информационные панели и добавлять на них любой элемент отчета, кликнув по кнопке закрепить.

    Заключение

    Сегодня я рассказал:

    1. Как загрузить в программу нужный набор данных (я показал как это делать на примере интеграции с Google Analytics или загрузки данных из MySQL).
    2. Как упорядочить данные, чтобы привести их к нужному для визуализации виду.
    3. Как построить отчет, где будут отображаться данные из разных источников.
    4. Как настроить фильтры данных, выбрать подходящие элементы визуализации и опубликовать результат для просмотра в онлайн-версии Power BI.

    Power BI - мощный и многофункциональный инструмент, поэтому достаточно тяжело описать весь его функционал в рамках одной статьи. Ответы на базовые вопросы по работе с Power BI можно узнать из официального мануала, который вы можете найти по этой ссылке. На остальные - с радостью отвечу в комментариях.

    Microsoft Power BI - это набор средств бизнес-аналитики для анализа данных и предоставления ценной информации. Контролируйте свой бизнес с любого устройства в любой точке мира в режиме реального времени!

    В основе концепции Power BI следующие идеи:





    1. Красочная современная графика
    Современные технологии с учётом последних трендов в анализе данных.

    2. Самостоятельный анализ (Self-BI)
    Бизнес-пользователи могут самостоятельно анализировать и создавать интерактивные панели без помощи ИТ-отдела.

    3. Мобильность
    Приложения для мобильных устройств на базе Windows, Android и iOS.







    4. ВСЁ и СРАЗУ!
    Анализируйте сразу все ваши данные в удобном формате. Встроенные коннекторы к большинству систем и сервисов.

    5. Представление данных
    Большой набор визуальных представлений.

    6. На одном языке с вами
    Просто спросите у Power BI: “Какая маржа по всем проектам за II квартал 2018 года?”, и система сразу даст ответ в виде интерактивной панели.










    7. Единый центр анализа
    Больше не надо искать информацию о делах компании по разным папкам и файлам. Вся аналитика формируется в ОДНОМ интерактивном интерфейсе.

    8. Общий доступ
    Общий доступ ко всем приложениям с любых устройств.


    Интерактивный (кликабельный) демо-пример


    Получить демо


    Стоимость и функционал Power BI

    Power BI

    Power BI Pro

    Ограничение ёмкости данных

    1 ГБ на пользователя

    10 ГБ на пользователя

    Создавайте, просматривайте и используйте персональные панели мониторинга и отчеты совместно с другими пользователями Power BI

    Создавайте содержимое с помощью Power BI Desktop

    Просматривайте данные с использованием естественного языка

    Получайте доступ к информационным панелям на мобильных устройствах, используя нативные приложения для iOS, Windows и Android

    Используйте проверенные пакеты содержимого для таких служб, как Dynamics, Salesforce и Google Analytics

    Импортируйте данные и отчеты из файлов Excel, CSV и Power BI Desktop

    Публикация в Интернете

    Обновление данных

    Используйте содержимое с запланированными обновлениями

    Ежедневно

    Каждый час

    Используйте данные потоковой передачи на информационных панелях и в отчетах

    10 тыс. строк в час

    1 млн строк в час

    Используйте динамические источники данных с полными интерактивными возможностями

    Получите доступ к локальным данным с помощью шлюзов подключения к данным (персональным и для управления данными)

    Совместная работа

    Совместно работайте с командой, используя группы Office 365 в Power BI

    Создавайте, публикуйте и просматривайте пакеты содержимого организации

    Управляйте доступом и совместной работой с помощью групп Active Directory

    Общие запросы данных через каталог данных

    Контролируйте доступ к данным с помощью средств безопасности на уровне строк для пользователей и групп


    Получить демо

    Зачем Вам Power BI?

    С Power BI вы сможете анализировать все данные своей компании, как облачные, так и локальные. Включив воображение и используя визуальные инструменты Power BI, вы создадите интерактивные отчёты за считанные секунды в режиме реального времени. Система сама автоматически устранит проблемы с форматированием данных. Работая с Power BI, вы сможете подключить базы данных SQL Server, модели Analysis Services и другие источники данных к одним и тем же интерактивным панелям в Power BI.



    Какие знания нужны для работы с Power BI?

    После внедрения системы бизнес-пользователю не потребуется специальных знаний, чтобы эффективно работать с данными. Удобный, интуитивно понятный интерфейс позволит быстро и легко изменить или создать аналитику в нужном представлении.

    Проект внедрения Power BI

    BI команда компании Первый БИТ - это команда экспертов отрасли, имеющая большой опыт внедрения проектов на различных платформах. Мы комплексно закрываем все потребности клиента в рамках внедрения бизнес-аналитической системы Power BI:

    • Обследование ваших бизнес-процессов
    • Формирование и согласование требований к BI-системе
    • Подключение к источника данных и их консолидация
    • Построение модели данных и разработка отчётности
    • Обучение ваших сотрудников (бизнес-аналитиков и разработчиков)
    • Профессиональная технологическая поддержка вашей компании в будущем

    Примеры решений на Power BI


    Продажи, розничная торговля, оптовая торговля

    • Более глубокое понимание клиентов
    • Анализ цен
    • Результативность магазинов
    • Оценка запасов
    • Анализ каналов продажи



    
    Top