суббота, 22 августа 2015 г.

Индикаторы Мирового Банка для R

Мировой банк предоставляет доступ к огромному количеству индикаторов World Development с помощью API. Пакет WDI для R предоставляет возможность поиска и скачивания данных WDI.

Установка

WDI публикуется в CRAN, поэтому его можно установить с помощью команды:

install.packages('WDI')

Поиск данных

Поиск данных по ключевым словам производится с помощью функции  WDIsearch. Например, мы ищем данные по ВВП (Gross Domestic Product):

WDIsearch('gdp')


Результат:

> WDIsearch('gdp')[1:10,]
      indicator              name                                                                      
 [1,] "BG.GSR.NFSV.GD.ZS"    "Trade in services (% of GDP)"                                            
 [2,] "BM.KLT.DINV.GD.ZS"    "Foreign direct investment, net outflows (% of GDP)"                      
 [3,] "BN.CAB.XOKA.GD.ZS"    "Current account balance (% of GDP)"                                      
 [4,] "BN.CUR.GDPM.ZS"       "Current account balance excluding net official capital grants (% of GDP)"
 [5,] "BN.GSR.FCTY.CD.ZS"    "Net income (% of GDP)"                                                   
 [6,] "BN.KLT.DINV.CD.ZS"    "Foreign direct investment (% of GDP)"                                    
 [7,] "BN.KLT.PRVT.GD.ZS"    "Private capital flows, total (% of GDP)"                                 
 [8,] "BN.TRF.CURR.CD.ZS"    "Net current transfers (% of GDP)"                                        
 [9,] "BNCABFUNDCD_"         "Current Account Balance, %GDP"                                           
[10,] "BX.KLT.DINV.WD.GD.ZS" "Foreign direct investment, net inflows (% of GDP)" 

WDIsearch использует grep и игнорирует регистр, поэтому вы можете здесь также использовать регулярные выражения. Например, вы ищете ВВП на душу населения в фиксированном долларовом эквиваленте:

WDIsearch('gdp.*capita.*constant')
     indicator           name                                                 
[1,] "GDPPCKD"           "GDP per Capita, constant US$, millions"             
[2,] "NY.GDP.PCAP.KD"    "GDP per capita (constant 2000 US$)"                 
[3,] "NY.GDP.PCAP.KN"    "GDP per capita (constant LCU)"                      
[4,] "NY.GDP.PCAP.PP.KD" "GDP per capita, PPP (constant 2005 international $)"

Скачивание данных и их использование

Скачайте нужный вам набор данных:

dat = WDI(indicator='NY.GDP.PCAP.KD', country=c('MX','CA','US'), start=1960, end=2012)

Посмотрите данные:

head(dat)
  iso2c country NY.GDP.PCAP.KD year1    CA  Canada       9374.883 19602    CA  Canada       9479.824 19613    CA  Canada       9967.366 19624    CA  Canada      10290.362 19635    CA  Canada      10774.653 19646    CA  Canada      11283.606 1965

Постройте график:

library(ggplot2)
ggplot(dat, aes(year, NY.GDP.PCAP.KD, color=country)) + geom_line() + 
    xlab('Year') + ylab('GDP per capita')

GDP per capita in North America

Замечание: вы можете использовать опцию country='all' для скачивания данных по всем доступным странам. Также вы можете использовать вектор из строк индикаторов для скачивания нескольких индикаторов сразу. 

Обновление списка серий данных

Для ускорения поиска WDI создает локальный список всех доступных наборов данных WDI, который регулярно обновляется, но если вы хотите обновить его вручную, воспользуйтесь функцией cache:

new_cache = WDIcache()
WDIsearch('gdp', cache=new_cache)

Комментариев нет:

Отправить комментарий