Мировой банк предоставляет доступ к огромному количеству индикаторов World Development с помощью API. Пакет WDI для R предоставляет возможность поиска и скачивания данных WDI.
Установка
WDI публикуется в CRAN, поэтому его можно установить с помощью команды:
install.packages('WDI')
Поиск данных
Поиск данных по ключевым словам производится с помощью функции WDIsearch. Например, мы ищем данные по ВВП (Gross Domestic Product):
WDIsearch('gdp')
Результат:
> WDIsearch('gdp')[1:10,]
indicator name
[1,] "BG.GSR.NFSV.GD.ZS" "Trade in services (% of GDP)"
[2,] "BM.KLT.DINV.GD.ZS" "Foreign direct investment, net outflows (% of GDP)"
[3,] "BN.CAB.XOKA.GD.ZS" "Current account balance (% of GDP)"
[4,] "BN.CUR.GDPM.ZS" "Current account balance excluding net official capital grants (% of GDP)"
[5,] "BN.GSR.FCTY.CD.ZS" "Net income (% of GDP)"
[6,] "BN.KLT.DINV.CD.ZS" "Foreign direct investment (% of GDP)"
[7,] "BN.KLT.PRVT.GD.ZS" "Private capital flows, total (% of GDP)"
[8,] "BN.TRF.CURR.CD.ZS" "Net current transfers (% of GDP)"
[9,] "BNCABFUNDCD_" "Current Account Balance, %GDP"
[10,] "BX.KLT.DINV.WD.GD.ZS" "Foreign direct investment, net inflows (% of GDP)"
WDIsearch использует grep и игнорирует регистр, поэтому вы можете здесь также использовать регулярные выражения. Например, вы ищете ВВП на душу населения в фиксированном долларовом эквиваленте:
WDIsearch('gdp.*capita.*constant')
indicator name
[1,] "GDPPCKD" "GDP per Capita, constant US$, millions"
[2,] "NY.GDP.PCAP.KD" "GDP per capita (constant 2000 US$)"
[3,] "NY.GDP.PCAP.KN" "GDP per capita (constant LCU)"
[4,] "NY.GDP.PCAP.PP.KD" "GDP per capita, PPP (constant 2005 international $)"
Скачивание данных и их использование
Скачайте нужный вам набор данных:
dat = WDI(indicator='NY.GDP.PCAP.KD', country=c('MX','CA','US'), start=1960, end=2012)
Посмотрите данные:
head(dat)
iso2c country NY.GDP.PCAP.KD year1 CA Canada 9374.883 19602 CA Canada 9479.824 19613 CA Canada 9967.366 19624 CA Canada 10290.362 19635 CA Canada 10774.653 19646 CA Canada 11283.606 1965
Постройте график:
library(ggplot2)
ggplot(dat, aes(year, NY.GDP.PCAP.KD, color=country)) + geom_line() +
xlab('Year') + ylab('GDP per capita')
Замечание: вы можете использовать опцию country='all' для скачивания данных по всем доступным странам. Также вы можете использовать вектор из строк индикаторов для скачивания нескольких индикаторов сразу.
Обновление списка серий данных
Для ускорения поиска WDI создает локальный список всех доступных наборов данных WDI, который регулярно обновляется, но если вы хотите обновить его вручную, воспользуйтесь функцией cache:
new_cache = WDIcache()
WDIsearch('gdp', cache=new_cache)
Комментариев нет:
Отправить комментарий