рекомендации

четверг, 29 апреля 2021 г.

Сохранение данных в форматах R: RDS и RDATA

Запись данных в форматах файлов txt, csv или Excel - лучшее решение, если вы хотите открыть эти файлы с помощью другого программного обеспечения для анализа, такого как Excel. Однако это решение не сохраняет структуры данных, такие как типы данных столбцов (числовые, символьные или факторы). Для этого данные должны быть записаны в формате R.

Сохранение данных в форматах данных R может значительно уменьшить размер больших файлов за счет сжатия.

Сохранение одного объекта в файл

Можно использовать функцию saveRDS() для записи одного объекта R в заданный файл (в формате rds). Восстановить объект можно с помощью функции readRDS().

Обратите внимание, что объект можно восстановить под другим именем.

Упрощенный синтаксис для сохранения и восстановления выглядит следующим образом:

# Save an object to a file saveRDS(object, file = "my_data.rds") # Restore the object readRDS(file = "my_data.rds")

object: объект R для сохранения;
file: имя файла, в котором объект R сохраняется или из которого он считывается.

В коде R ниже мы сохраним набор данных mtcars и восстановим его под другим именем:

# Save a single object to a file saveRDS(mtcars, "mtcars.rds") # Restore it under a different name my_data <- readRDS("mtcars.rds")

Сохранение нескольких объектов в файл

Функцию save() можно использовать для сохранения одного или нескольких объектов R в заданный файл (в форматах файлов .RData или .rda). Данные можно прочитать из файла с помощью функции load().

Обратите внимание, что если вы сохраните данные с помощью save(), их нельзя будет восстановить под другим именем. Автоматически используются исходные имена объектов.

# Saving on object in RData format save(data1, file = "data.RData") # Save multiple objects save(data1, data2, file = "data.RData") # To load the data again load("data.RData")

Сохранение всего рабочего пространства

Если у вас продолжительные рабочие сеансы, рекомендуется сохранить снимок рабочего пространства.

Это можно сделать в любой момент с помощью функции save.image().

save.image()

Эта команда сохраняет ваше рабочее пространство в файле с именем .RData по умолчанию. Это гарантирует, что вы не потеряете всю свою работу, например, в случае перезагрузки системы.

Когда вы закрываете R/RStudio, он спрашивает, хотите ли вы сохранить рабочее пространство. Если вы ответите «да», при следующем запуске R это рабочее пространство будет загружено. Этот сохраненный файл также будет называться .RData.

Также можно указать имя файла для сохранения рабочего пространства:

save.image(file = "my_work_space.RData")

Чтобы восстановить рабочее пространство, введите:

load("my_work_space.RData")

Резюме

Сохранение и восстановление единственного объекта R: saveRDS(object, file), my_data <- readRDS(file)

Сохранение и восстановление нескольких объектов R: save(data1, data2, file = “my_data.RData”), load(“my_data.RData”)

Сохранение и восстановление рабочей области: save.image(file = “my_work_space.RData”), load(“my_work_space.RData”)

Комментариев нет:

Отправить комментарий