рекомендации

вторник, 20 апреля 2021 г.

Руководство по Tableau для начинающих

Взгляните на визуализацию ниже, созданную известным шведским статистиком Хансом Рослингом. Он собрал данные о мировом развитии примерно за 200 лет и изложил их очень просто:


Это отличный пример визуализации данных, которая вместо того, чтобы сосредотачиваться на числах, сосредотачивается на рассказе их истории. Вы можете найти интерактивную версию этого наглядного пособия здесь.

В настоящее время доступно несколько программных продуктов, которые помогают в создании такой простой визуализации, и инструмент, который мы собираемся рассмотреть в этой статье, это Tableau.

Пример Dashboard в Tableau

Что вы можете увидеть на картинке ниже?



Эта Dashboard, созданная в Tableau, визуализирует анализ продаж и прибыли супермаркета.

С первого взгляда вы можете увидеть:
  • Распределение продаж различных категорий относительно друг друга.
  • Их соответствующая маржа прибыли.
  • Подкатегории продаж продукции каждой категории.
  • И наконец, рост продаж категорий с годами.
Итак, в этой статье мы узнаем, как делать такие простые визуализации в Tableau, чтобы хорошо понимать наши данные.

1. Обзор Tableau

1.1 Что такое Tableau?

Tableau - это инструмент визуализации данных, который широко используется для бизнес-аналитики, но не ограничивается этим. Он помогает создавать интерактивные графики и диаграммы в виде информационных панелей и рабочих листов для получения бизнес-информации. И все это стало возможным с помощью таких простых действий, как перетаскивание!

Какие продукты предлагает Tableau?



1.2 Что нужно знать перед использованием Tableau?

Вам не нужно много знаний, чтобы использовать Tableau, но, тем не менее, предпочтительно иметь базовые знания обо всех типах графиков, таких как гистограмма, линейные диаграммы, гистограммы и т. д.

Наряду с этим, будет полезно, если вы обладаете некоторыми базовыми знаниями об управлении базами данных (типы данных, объединения, детализация и т. д.). Даже если вы этого не знаете, это не повод для беспокойства, поскольку я расскажу обо всех таких концепциях в этой и следующих статьях.

1.3 Установка:

Чтобы работать над Tableau, вам нужен Tableau, верно?

Из пяти вышеупомянутых продуктов Tableau Desktop, Public и Online предлагают визуальное создание данных.

Tableau Desktop

Он доступен в следующих трех форматах:
  • Бесплатная пробная версия на 14 дней.
  • Если вы студент или преподаватель, вы получаете бесплатный доступ к рабочему столу на целый год.
  • Купить Tableau.
Tableau Public

Tableau Public полностью бесплатен и не требует какой-либо лицензии. Но есть ограничение: все ваши данные и книги доступны всем пользователям Tableau.

Tableau Online

Tableau Online - лучший вариант для вас, если вы хотите создавать свои рабочие книги в облаке и иметь к ним доступ из любого места.

2. Начало работы

Теперь, когда у вас установлен и настроен подходящий продукт, я почти уверен, что ваши руки должны дрожать от предвкушения, чтобы наконец начать визуализацию с использованием Tableau! Что ж, не будем заставлять вас ждать, запускайте программу.

2.1 Подключение к данным


Вы должны увидеть экран, подобный показанному выше. Сюда вы импортируете свои данные. Как видно, есть несколько форматов, в которых могут быть ваши данные. Это может быть обычный файл, такой как Excel, CSV, или вы также можете напрямую загружать данные с серверов данных.

Вы можете видеть, что Tableau предлагает несколько примеров рабочих книг с заранее нарисованными диаграммами, графиками и другими визуальными элементами. Я бы посоветовал пройти через это позже для дальнейшего изучения.

Лучший способ научиться - делать все своими руками. Начнем с файла Data, который можно найти здесь. Это данные американского супермаркета, который обдумывает свое расширение. Он хочет знать перспективные регионы страны, и, следовательно, нуждается в вашей помощи.

Первое, что вам, очевидно, нужно сделать, это импортировать данные в Tableau. Так что быстро выполните следующие шаги:

1. Поскольку данные находятся в файле Excel, щелкните Excel и выберите файл Sample - Superstore.xls, чтобы получить:


2. Вы можете видеть три листа на экране, но здесь мы будем иметь дело только с Orders, так что перетащите их сюда, на Drag sheet:


Ой, импортированные данные для первых нескольких строк выглядят немного иначе. Не волнуйтесь, решение еще впереди.

Интерпретатор данных

3. Вы видите опцию Use Data Interpreter? Щелкните по ней, чтобы получить следующий чистый вид:


Все эти беспорядочные данные волшебным образом исчезли!

Если вы откроете файл данных Excel, вы увидите в нем некоторые метаданные, то есть информацию о данных:


Tableau импортирует весь файл данных как есть, но, ожидая таких расхождений, явно предоставляет решение в виде интерпретатора данных. Если вы хотите просмотреть точные внесенные изменения, нажмите «Review the results» и выберите вкладку «Orders» в открывшемся листе Excel.

Как будет показано, он просто удалил ошибочные данные.

2.2 Визуализация данных

Как только вы импортировали набор данных, рядом с вкладкой «Data Source» в нижней части экрана вы сразу же должны были увидеть «Go to Worksheet». Рабочий лист - это то место, где вы создаете все свои графики, поэтому щелкните эту вкладку, чтобы перейти к следующему экрану:


Не пугайтесь различных элементов, которые вы видите здесь, мы рассмотрим их все один за другим.

Начнем с Dimensions и Measures:


Перейдем на Shelves:



Визуализация в Tableau возможна путем перетаскивания Measures и Measures на эти разные Shelves.
  • Rows и Columns: представляют оси x и y ваших графиков/диаграмм.
  • Filter: фильтры помогут вам просмотреть нужную версию ваших данных. Например, вместо того, чтобы видеть объединенные продажи всех категорий, вы можете посмотреть на конкретную категорию, такую как просто Furniture.
  • Pages: страницы работают по тому же принципу, что и фильтры, с той разницей, что вы действительно можете видеть изменения при переключении между значениями Paged. Помните ту диаграмму Рослинга? Вы можете легко создать свою собственную с помощью Pages.
  • Marks: свойство Marks используется для управления типами меток ваших данных. Вы можете выбрать представление данных с помощью различных форм, размеров или текста.
И, наконец, Show Me, мозг Tableau!


Когда вы перетаскиваете поля в область визуализации, Tableau создает для вас графики по умолчанию, как мы вскоре увидим, но вы можете изменить их, обратившись к опции «Show Me».

Примечание. Не каждый график можно построить с помощью любой комбинации Dimensions или Measures. У каждого графика есть свои условия для количества и типов полей, которые можно использовать, которые мы обсудим далее.

2.3 Различные графики и диаграммы

Пока мы в значительной степени охватили необходимые теоретические знания. Давайте, наконец, начнем с визуализаций.

Лично я предпочитаю начинать с мелкой стороны бассейна, медленно плывя к более глубокой стороне. Поэтому я предлагаю начать с обзора статистики продаж и прибыли супермаркетов. Сюда входят чистые продажи, чистая прибыль и рост по двум показателям, и это лишь некоторые из них. Вот суть того, что мы будем делать:


Судя по тому, что можно наблюдать, чистые продажи растут, но прибыль растет медленно. Мы также можем довольно четко видеть пиковые месяцы продаж, которые могут быть объяснены разными причинами. Мы сможем узнать больше, только изучив больше.

Прежде чем мы начнем, я хотел бы порекомендовать вам одну вещь, а именно: вы называете свои рабочие листы так, как это делается у меня. Поскольку я буду ссылаться на них по ходу статьи, вам будет легче следить за ними.

Давайте начнем с простейшей визуализации, а именно с отображения чисел чистой статистики. Tableau, будучи столь же умным, автоматически вычисляет такие значения в разделах «Measure Names» и «Measure Values». Выполните следующие действия, чтобы создать Text Table:
  1. Перетащите Measure Names из Dimensions в центральную пустую область, чтобы увидеть Text Table.
  2. Measure Names будут автоматически отображаться в строках, поэтому перетащите их из строк в столбцы.
  3. Поскольку нам на самом деле не нужны такие показатели, как Row ID, Discount и т. д., Вы можете перетащить их из-под панели Marks, чтобы получить что-то вроде этого:

Примечание. Пусть Вас не смущает разный цвет полей. Просто запомните одну маленькую уловку: синий означает дискретный, а зеленый - непрерывный.

Итак, у нас есть значения чистых продаж и прибыли, давайте углубимся немного дальше, получив значения продаж и прибыли по годам. Давайте сделаем еще одну, но более подробную текстовую таблицу:
  1. Перетащите Order Date из Dimensions и Sales из Measures в Rows.
  2. Щелкните правой кнопкой мышиSales Pill и выберите Discrete вместо Continuous, поскольку нам нужны явные значения, а не гистограммы.
  3. Наконец, перетащите «Profit» в столбец «abc», чтобы получить:

Сделайте то же самое для Monthly Sales и Profit Values, но на этот раз измените формат Order Date с года на месяц, щелкнув правой кнопкой мыши Order Date в Rows и выбрав «Month», чтобы получить что-то вроде этого:


Мы только что рассмотрели числовую часть Dashboard, но это не главное. Это Line Charts. Давайте быстро научимся их делать:

1. Чтобы создать диаграмму продаж и роста прибыли, перетащите Order Date на Columns, Sales на Rows, а затем Profit на сформированную ось продаж, чтобы вы увидели знак равенства, чтобы получить следующее:


2. Повторите то же самое, чтобы найти месяцы пиковых продаж и прибыли, но снова измените формат Order Date с года на месяц, и получите:


Если вы нажмете «Show Me», вы увидите различные типы линейных диаграмм, которые вы можете создать, а если вы наведете курсор на каждую из них, вы также увидите их требования к Dimension и Measure. Если вы когда-нибудь потеряетесь в диаграммах, я рекомендую обратиться к Show Me.

С помощью предыдущих визуализаций мы получили краткий обзор супермаркета. Давайте теперь копнем немного глубже. Следующее, что я могу исследовать, это демографические данные о продажах и прибыли. Какие штаты имеют самый высокий доход от продаж, какие из них приносят максимальную прибыль:


Прежде чем обсуждать выводы, давайте сначала создадим круговую диаграмму региональных продаж:
  1. Перетащите Regions на Rows и Sales на Columns.
  2. Перейдите в Show Me и выберите круговую диаграмму.
  3. И, наконец, перетащите Sales на Label на панели Marks, чтобы получить:

Из визуального представления совершенно очевидно, что в игре продаж лидируют два противоположных конца, Восток и Запад. Давайте рассмотрим это немного глубже.

Примечание: всякий раз, когда у вас есть географические данные, всегда рекомендуется нанести их на карту и посмотреть их на карте, чтобы лучше понять их.

Итак, теперь мы собираемся составить карту распределения продаж:
  1. Так как мы хотим проанализировать штаты, перетащите States в пустую область, чтобы вы автоматически увидели карту с маленькими кружками. Следуйте этому шагу, перетащив далее «Profits». Вы заметите, что размер этих кругов меняется, чтобы представлять различные значения прибыли. Это называется Symbol Map. Но мы собираемся преобразовать это в заливку, перейдя в Show Me и выбрав Filled Map.
  2. Снова перетащите Profits, но на этот раз на Label на панели Marks, чтобы просмотреть сопоставленные значения прибыли, например:


Калифорния и Нью-Йорк имеют наибольшие продажи из западных и восточных регионов, но, к сожалению, есть и другие штаты, такие как Техас и Колорадо, которые даже после хороших продаж имеют отрицательную прибыль! Это, конечно, плохие новости для Superstore. Вы можете увидеть хороший анализ и для других штатов.

И, наконец, вот шаги для построения точечной диаграммы продаж и анализа прибыли:
  1. Перетащите Sales на Rows, а Profit на Columns. Вы увидите один крошечный кружок, который на самом деле представляет значения общих продаж и прибыли.
  2. Чтобы получить больше информации, перетащите States на созданный график, чтобы эти кружки/пузыри разбегались, представляя отдельные штаты.
  3. Для того, чтобы лучше понять центральную тенденцию данных, мы также добавили ось Median в качестве опорной линии. Это можно легко сделать, щелкнув правой кнопкой мыши по Sales / Profit Axis – > Adding Reference Line и выбрав "Median" вместо среднего значения по умолчанию.
  4. Наконец, для большей ясности перетащите States еще раз, но на этот раз на Label на панели Marks, и получите:

Выводы из карты становятся более заметными благодаря следующим выводам графика рассеяния:
  • Штаты в правом верхнем углу с высокими продажами и высокой прибылью означают хороший бизнес для организации.
  • Штаты с положительными продажами и прибылью, но рядом с двумя соответствующими осями - это те штаты, в которых есть некоторые возможности для улучшения.
  • В то же время штаты, относящиеся ко 2-й или 3-й четверти, не приносят большого дохода.
Одна из замечательных особенностей Tableau заключается в том, что он позволяет взаимодействовать с визуальными элементами. Взгляните на пример:




Когда мы щелкнули по Central Region, он выделился и показал центральные штаты США, а также их соответствующие продажи и разброс прибыли. Здесь мы использовали саму диаграмму как фильтр, который является функцией Dashboard. Мы узнаем, как его сделать, позже.

Есть один довольно важный анализ, которого нам еще предстоит коснуться, статистика продаж. Высокие продажи можно легко объяснить высокой стоимостью продаваемой продукции. Кроме того, когда вы подумываете о расширении, вам также нужно знать распределение продаж продуктов:


Здесь мы визуализировали не только продажи, но и прибыль.

Довольно удивительно видеть категории с высокими продажами, приносящими отрицательную прибыль, такие как «Technology» в ноябре 2015 г. или «Furniture» в октябре 2016 г., и это следует из первой диаграммы, которая также называется Highlight Table. Как следует из названия, она подчеркивает относительную долю значений показателей в наших данных. Итак, давайте узнаем, как ее сделать:
  1. Перетащите Category и Order Date (Year) в Rows.
  2. Перетащите Order Date (Month) в Columns, а Sales - в пустые поля «abc».
  3. Выберите «Highlight Table» в «Show Me» и перетащите «Order Date (Year)» обратно в «Rows» на тот случай, если она была перетасована.
  4. Наконец, перетащите Profits поверх Color на панели Marks, чтобы получить:


Product Sub Category Sales - это гистограмма, которую также довольно легко сделать:
  1. Просто перетащите Sub – Category в Rows
  2. Перетащите Profit в Columns.
  3. Перейдите в Show Me и выберите Horizontal Bars
  4. Для некоторых настроек перетащите Sales на Colour на панели Marks, чтобы получить эту окончательную визуализацию:

Из приведенного выше графика мы получаем хорошее представление о чистых продажах и прибыли для различных продуктов. Обратите внимание, что даже несмотря на то, что продажи столов довольно высоки, это единственный продукт с наименьшей прибылью.

Теперь, как и раньше, рассмотрим взаимодействие с визуализацией:


Теперь мы можем просматривать продажи и прибыль продуктов каждой категории на низком уровне детализации по году и месяцу!

3. Прочие функции

Поздравляю! Вы рассмотрели один из важных аспектов Tableau! Но это еще не конец вашего обучения. Tableau также предлагает некоторые расширенные функции, некоторые из которых мы рассмотрим далее:

3.1 Фильтры

До сих пор мы создавали только простые диаграммы, которые фактически предоставляют совокупные данные, которые объединяют данные за время существования супермаркета. Чтобы посмотреть продажи за определенный год, месяц, для определенного продукта или просто просмотреть отдельные аспекты данных, лучше всего подойдут фильтры.

Давайте вернемся к первому в истории графику пиковых продаж и месячных прибылей, который мы создали:



Визуализация здесь представляет собой совокупность данных за все 4 года для всех регионов, штатов, категорий и подкатегорий.

Шаги по превращению любого измерения в фильтр одинаковы. Давайте сначала поэкспериментируем с датой заказа (в формате "год"):

1. Перетащите Dimension на полку Filters, чтобы увидеть следующее всплывающее окно. Здесь мы будем выбирать Years:


2. Выберите значения, которые вы хотите включить в свой фильтр:


3. Щелкните правой кнопкой мыши созданный фильтр и выберите Show Filter:


4. Вы также можете изменить формат вашего фильтра, например, хотите ли вы выпадающий список, ползунок, список с одним значением и т. д.:


5. Если вы чувствуете, что некоторые из ваших фильтров можно применить и к другим листам, то вместо того, чтобы повторять эти шаги, вы можете просто применить фильтр ко всем другим соответствующим листам:



3.2 Drill Down и Drill Up

К настоящему времени вы, должно быть, получили некоторое представление о том, как строятся наши данные. У нас есть Category в качестве основного поля, разделенного на подкатегории, которые далее различаются по различным идентификаторам продуктов и их соответствующим названиям продуктов.

Эта концепция разделения наших данных для достижения абсолютной глубины называется Drilling Down:


Точно так же вы можете перейти от даты заказа к идентификатору заказа, от даты отгрузки к режиму отгрузки. Это также называется построением иерархии данных.

Давайте сначала рассмотрим ProductDrillDown, который на самом деле представляет собой гистограмму:
  1. Во-первых, вам нужно сгруппировать нужные Dimensions в единую иерархию. Итак, перетащите Sub – Category из Dimensions на верхнюю часть Category в самих Dimensions и измените имя иерархии на Product.
  2. Теперь перетащите Product ID и Product Name на эту Product Hierarchy.
  3. Сделайте то же самое для Order Hierarchy, чтобы получить:


4. Чтобы окончательно отобразить данные, перетащите Product Hierarchy в Rows и Sales в Columns, и получите:


Это была простая гистограмма, но если вы наведете курсор на ось Category, вы увидите маленький знак плюса. Нажмите на него, чтобы получить подробную версию ваших данных. Сделайте то же самое для другой сгенерированной оси, чтобы достичь абсолютной глубины.

Tree Analysis of Product Sales - это древовидная карта, которая является отличным способом представления развернутых данных, и ее довольно легко сделать:

5. После drill down, начиная с шага 4, просто перейдите к Show Me и выберите диаграмму TreeMap, чтобы получить следующее:


Пока вы проанализировали текущий сценарий, но для расширения нашего анализа давайте попробуем проанализировать и будущее.

С помощью следующей Dashboard вы можете не только видеть тенденции продаж по месяцам, но и прогнозировать их по годам. И они рассказывают совершенно разные истории:


Хотя продажи супермаркета растут в течение нескольких месяцев в году, будущее в целом выглядит немного мрачным. Продажи, кажется, станут постоянными в течение следующих 3 лет, но, к счастью для Superstore, прибыль неуклонно растет. А теперь обратимся к вышесказанному.

3.3 Линия тренда

Вернитесь к графику пиковых продаж и месячной прибыли и выполните следующие действия, чтобы построить линию тренда:

1. Перейдите в Show Me и выберите диаграмму Dual Combination:


2. Чтобы получить линию тренда, перейдите в раздел «Analytics» и просто перетащите линию тренда на график, чтобы получить:



3.4 Прогнозирование

Для прогнозирования рассмотрим график роста продаж и прибыли. Конструкция аналогична линиям тренда, но с небольшими изменениями. Шаги следующие:
  1. Перетащите Forecast на график.
  2. Вы также можете изменить временные рамки прогноза, щелкнув правой кнопкой мыши Forecast Area и выбрав Forecast Options, после чего вы можете внести свои настройки:


3.5 Кластеры

Вернемся к составленной нами диаграмме продаж и анализа прибыли. Помните подробный вывод, который мы сделали из этого? Сейчас мы просто сделаем его более заметным, используя кластеры.

Чтобы их сделать:
  1. Зайдите в Analytics и выберите Clusters.
  2. Вы можете отформатировать формирование кластера по своему желанию. Здесь мы выполняем кластеризацию на основе суммы продаж и прибыли, выбирая количество кластеров равным 4:

3. Чтобы просмотреть информацию о кластере, щелкните правой кнопкой мыши Clusters на панели Marks и выберите «Describe Clusters», чтобы отобразить это всплывающее окно:



4. Dashboard

Я уверен, что к настоящему времени вы, должно быть, получили довольно хорошее представление о том, что такое Dashboard, и много раз видели ее на протяжении всей этой статьи.

Если нет, тогда Dashboard - это просто средство объединения рабочих листов вместе, чтобы они передавали какое-то сообщение. Без лишних слов, давайте перейдем к делу!

Рассмотрим диаграмму карты распределения продаж по штатам и подкатегориям продуктов.

Что, если вы хотите узнать различную маржу продаж каждого продукта в разных штатах? Мы заметили, что Техас был одним из штатов с самой низкой прибылью. Посмотрев на следующую Dashboard, вы увидите, что причина в том, что он не приносит прибыли по большинству продуктов:



Теперь рассмотрим распределение продаж подкатегорий по штатам:


Вышеизложенное прекрасно показывает распределение Appliances по стране, где Калифорния, кажется, вносит основной вклад в прибыль.

Сделать такую Dashboard на самом деле довольно просто. Посмотрим, как именно:

1. На этот раз вместо создания нового рабочего листа мы собираемся создать новую Dashboard. Щелкните значок в виде окна рядом со значком «New Worksheet» на нижней панели, чтобы получить следующее:



2. Видите несколько рабочих листов, которые мы сделали ранее, слева? Все, что нам нужно сделать, чтобы создать Dashboard, перетащить эти листы из панели в пустую область «Drop sheets here».

3. Таким образом, чтобы создать ранее отображенную Dashboard, просто перетащите State Sales Distribution и Product Sub Category Sales. Dashboard автоматически освободит место для них обоих.

Примечание. Даже после создания Dashboard вы все равно можете редактировать свои рабочие листы, и изменения будут отражены здесь.

Если вы кликните «States» или «Products» после создания своей первой Dashboard, вы не заметите никаких изменений. Потому что для таких визуальных эффектов мы сначала должны преобразовать сами диаграммы в фильтры.

4. Просто щелкните маленькую стрелку вниз на каждой диаграмме, которую вы хотите преобразовать в фильтр, и выберите «Use as Filter»:



Примечание. При создании панелей Dashboard предпочтительно использовать диаграммы в качестве фильтров, а не загромождать представление кастомными фильтрами.

5. Story: объединяем все воедино

Точно так же, как панели Dashboard были способом объединения рабочих листов, Story - это то место, где вы объединяете все панели Dashboard, а при необходимости также отдельные таблицы, чтобы передать, как следует из названия, Story.

1. Как и раньше, вы просто перетаскиваете свои рабочие листы и Dashboard на пустое место:



Итак, давайте объединим все те панели Dashboard, которые мы сделали, в то, что, возможно, могло бы стать достойной презентацией для новичка. Обязательно добавьте заголовок ко всем вашим панелям, чтобы четко передать ваше сообщение:



Если вы когда-либо сталкивались с Tableau Stories в интернете, с теми, с которыми вы могли бы взаимодействовать, а не просто просматривать, это стало возможным благодаря публикации ваших рабочих книг на сервере Tableau.

Если у вас есть одна настройка, то все, что вам нужно сделать после создания своих Stories, это перейти в Server -> Publish Workbook и ввести имя сервера:


6. Заключение

То, что мы рассмотрели до сих пор, в значительной степени является основами Tableau. У него есть и другие возможности, о которых я расскажу в своих следующих статьях.

Как говорят: «с практикой приходит совершенство», поэтому необходимо как можно больше экспериментировать с Tableau.

Ниже приведен образец Dashboard, которую я рекомендую попробовать каждому из вас. Вы не только сможете проверить уже полученные навыки, но и, надеюсь, приобретете еще больше. Используемый набор данных такой же, как тот, с которым мы работали до сих пор:



Комментариев нет:

Отправить комментарий