вторник, 3 мая 2016 г.

Основы ggplot2

Графическая грамматика ggplot2

Перевод. Оригинал здесь.
ggplot2 представляет собой реализацию концепции графической грамматики, поэтому и называется gg plot. Базовая идея заключается в грамматике компоновки графических компонентов в статистических графиках. Управляя напрямую этой компоновкой, вы сможете создавать большие наборы тщательно выполненных графиков с помощью достаточно небольшого набора команд. Как сказал Wickham, автор ggplot2: "хорошая грамматика позволяет нам разобраться в компоновке сложных графиков и выявить неожиданные связи между, казалось бы, совершенно разными графическими компонентами".

Хорошим примером неожиданных связей могут быть круговые диаграммы, которые на самом деле являются просто гистограммами...

pie <- ggplot(mtcars, aes(x = factor(1), fill = factor(cyl))) +
       geom_bar(width = 1, position = "fill", color = "black")
pie


...в полярных координатах.

pie + coord_polar(theta = "y")

Базовые концепции ggplot2

Есть несколько основных концепций, которые необходимо знать для использования ggplot2. Во-первых, мы конструируем графики из слоев. Каждый компонент графика, начиная от данных, которые мы хотим визуализировать, координатных осей, и заканчивая статистическими показателями выборки, надписями и т.д. В процессе работы мы итеративно добавляем слой за слоем, пока не получим требуемый результат.

Далее, графические свойства, которые кодируют данные, определяют внешний вид графика. К ним относятся такие параметры, как:
- координата x;
- координата y;
- размер элементов;
- форма элементов;
- цвет элементов.

Графические элементы, использующиеся для построения графиков, представляют собой геометрические фигуры, например:
- точки;
- линии;
- отрезки линий;
- прямоугольники;
- текст.

Некоторые из них имеют собственные настройки внешнего вида. Например, точки - форму и размер, линии - тип и толщину и т.д.

Также вы можете захотеть вывести поверх графика или вместо него статистические показатели, в их числе могут быть сглаживание, регрессия, среднее и медианные значения с доверительными интервалами и т.д.

Внешний вид, геометрия и статистика составляют самые важные слои графика, но для тонкой настройки графика вы можете добавить множество других вещей. Наиболее важная среди них - масштабирование, которое может включать логарифмическую шкалу для осей, настройку формы точек или типа линий и т.д.

Продолжение следует...

Комментариев нет:

Отправить комментарий