Google Drive Veri Çekme İşlemi


Merhaba R severler ,

Bugün sizlerle internet ortamında oluşturulan bir excel dosyasındaki veriyi R prograrıma nasıl çekebileceğimizi göstereceğim. Aslında bu iş için “googlesheets” paketi bulunmakta ve Google drive içerisinde bulunan excel dosyalarını kolaylıkla çekmemizi sağlamaktadır. Fakat önceki deneyimlerimden şunu söyleyebilirim ki bu paketin daha geliştirilmesi gerekli çünkü girilen kullanıcı ID’lerini tanıyor olsa da program içerisinde sürekli oturum açma hatası vermektedir. Bu nedenle veri çekme işleminde şimdilik kullanacağımız paketin adı “RCurl” paketidir. Peki bu paket ne işimize yarıyor? Bu paket http yada ftp üzerinden veri çekmektedir. Yani elinizdeki bir veriyi internet ortamına taşıdıysanız bu paket aracılığıyla nereye giderseniz gidin veriyi kullanabilir ve analizini yapabilirsiniz. Biz veri depolama sitesi olarak Google drive kullanacağız. Google drive içerisinde veri seti oluşturmak için aşağıdaki adımları takip ediniz.

1)      Google Hesabı Alınız.

2)      https://www.google.com.tr/intl/tr/drive/ adresine gidiniz ve orada aldığınız hesapla oturum açınız

3)      Sol üst köşede bulunan “yeni” butonundan “Google E-Tablolar” seçiniz ve veri setinizi oluşturunuz.

Yeni bir excel sayfası karşınıza çıkacaktır. - Bu arada şunu da belirmem gerekir ki eğer dünya üzerinde internet ağı yeterince hızlı olursa Office programlarından ziyade işletim sistemleri bile tamamen online olarak kullanılmaya başlanacak. Google bunun en güzel örneklerinden biridir. – karşımıza çıkan excel sayfasına ait adres çubuğuna baktığınızda size karışık bir link verecektir.

https://docs.google.com/spreadsheets/d/1ZgkuylvnFnQQR9UT1PVag9fmBsjZYYXrW4/edit#gid=0

Yukarıdaki örnek link veri çekme işlemi yapılırken kullanılacaktır. Karışık şekilde görünen ve kalın yazı tipi ile görülen kısım Google’ın size verdiği bir çeşit anahtardır. R programı içerisinde de bu linkten faydalanacağız.

Veri tablomuzu oluşturduğumuz farz ederek devam ediyorum. Şimdi de “RCurl” paketimizi indirelim ve kullanıma açalım.

install.packages("RCurl")

library("RCurl")

bu arada R studio ve R için yeni güncellemeler mevcut. R programı son versiyonu 3.3 ile devam etmektedir. R studio için ise güncelleme yapmanızı önemle tavsiye ederim çünkü kodlama kısmında .NET’e benzer gelişim sağlanmış ve program yazmak daha da kolaylaştırılmıştır.

Paketleri indirdikten sonra kullanacağımız komutlara gelelim. İlk önce veri setine ait Url’yi programa tanıtalım

fileUrl <- "https://docs.google.com/spreadsheets/d/[ID]/export?format=csv"

Yukarıda gördüğünüz ID kısmı daha önce belirttiğim karmaşık düzende Google tarafından sağlanan anahtardır. Kendinize ait olan anatarı buraya giriniz. Google drive içerisine ulaştık fakat R programı henüz bu veriyi ne şekilde çekmesi gerektiğini bilmiyor. Hemen tanıtalım.

fileCSV <- getURL(fileUrl,.opts=list(ssl.verifypeer=FALSE))

getURL komutuyla ilgili dosyaya ulaştık. En son dosyayı okutarak program içerisine dahil ediyoruz.

fileCSVDF <-  read.csv(textConnection(fileCSV))

böylelikle Google drive içerisindeki bir veriyi R programına taşımış olduk. Çekilen veriyi kontrol etmek için aşağıdaki komut kullanılabilir.

View(fileCSVDF)

head(fileCSVDF)

                country                continent            year       lifeExp                    pop                        gdpPercap

1             Algeria                  Africa                   1952      43.077                  9279525               2449.008

2             Algeria                 Africa                    1957      45.685                  10270856             3013.976

3             Algeria                 Africa                    1962      48.303                  11000948              2550.817

4             Algeria                  Africa                   1967      51.407                  12760499             3246.992

5             Algeria                 Africa                    1972      54.518                  14760787             4182.664

6             Algeria                 Africa                   1977      58.014                  17152804             4910.417

Konu ile ilgili soru ve önerileriniz için sağ alt köşedeki chat penceresini kullanabilir ya da https://www.facebook.com/rcoding adresinden bize yazabilirsiniz.

KAYNAK

https://cran.r-project.org/web/packages/RCurl/RCurl.pdf

Yazar Kimdir?

Sıtkı Cansu, 19 Ekim 1985 yilinda Konya-Beyşehir'de dogmustur.İlk, orta ve liseyi Beyşehir'de bitirmis olup Konya-Ereğli Selçuk MYO Bilgisayar programcılığı ve Mugla Sıtkı Koçman Üniversitesi İstatistik bölümünden mezun olmustur. Çesitli yerlerde web tasarımcı ve veri tabani yöneticisi olarak çalışan yazar, son üç senedir ingilizce öğretmenliği yapmaktadir. Şu anda yüksek lisansını tamamlamak üzere Mugla Üniversitesinde öğrenim görmektedir.