GGPlot2


Ggpolt2 paketi R için bir grafik uygulama aracıdır. Şu anda R 3.1 ve daha yüksek versiyonları için çalışmaktadır. Çok fazla detaylandırmadan basit şekilde “ggplot2” paketini işleyeceğiz. Öncelikle yapmamız gereken şey elbetteki paketi indirmek olacaktır ve sonrasında paketi kullanacağımız için “library” komutuyla paketi açıyoruz.

> install.packages("ggplot2")

> library("ggplot2", lib.loc="~/R/win-library/3.1")

 

Elimizde herhangi bir veri yok diye endişe etmeyin R paketlerinin çoğunda sizin için hazırlanmış verisetleri bulunmaktadır. Gglot paketinde ise “mtcars” isimli bir veri setimiz bulunuyor. Bu paket şu bilgileri içermektedir.

                     mpg cyl  disp  hp drat    wt  qsec vs am gear carb
Mazda RX4           21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
Mazda RX4 Wag       21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
Datsun 710          22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1

 

Elimizdeki veri seti araç markalarına göre bazı özellikleri göstermektedir. Veri setinin içeriği hakkında çok fazla konuşmaya gerek yok sanırım. Sadece ggplot’a ait özellikleri inceleyeceğiz. Öncelikle ggplota ait komut yapısını ele alalım.

qplot(x, y, data=, color=, shape=, size=, alpha=, geom=, method=, formula=, facets=, xlim=, ylim= xlab=, ylab=, main=, sub=)

ÖRNEK – I

gayet basit ve anlaşılır bir yapısı var. Örneklerle beraber argüman yapısına bir bakalım

mtcars$gear <- factor(mtcars$gear,levels=c(3,4,5),
+                       labels=c("3gears","4gears","5gears")) 

 

Yukarıdaki komut yapısı mtcars isimli verisetinden “gear” isimli sütunu ele alıyor ve grafiğe ait seviyeleri “3,4,5” şeklinde ayarlıyor. Etiket olarak ne yazacağınız size bağlı. “label” komutuyla etiket tanımlaması yapılıyor

mtcars$am <- factor(mtcars$am,levels=c(0,1),
+                     labels=c("Automatic","Manual"))
> mtcars$cyl <- factor(mtcars$cyl,levels=c(4,6,8),
+                      labels=c("4cyl","6cyl","8cyl")) 

 

Benzer şekilde ilgili veritabanından “am” ve “cyl” sütununa ait veriler bir faktör olarak çekiliyor.

> qplot(mpg, data=mtcars, geom="density", fill=gear, alpha=I(.5), 
+       main="Distribution of Gas Milage", xlab="Miles Per Gallon", 
+       ylab="Density")

 

Şimdi grafiği çizmek için ana komuta gelelim. Gplot komutu ile neler yapabiliyoruz bir bakalım. “mpg” “Miles Per Gallon” yani her mil için harcanan galon miktarını göstermektedir. Bizdeki kilometre başına yakılan yakıt gibi düşünebiliriz. “geom” argümanı ise grafik tipini belirler. Bu argüman için  "point", "smooth", "boxplot", "line", "histogram", "density", "bar", and "jitter" seçenekleri mevcuttur. “fill” argümanı grafiğin içerisini hangi sütun veriyle dolduracağımızı gösterir. “alpha” argümanı x eksenindeki değerlerin kaçarlı artacağını, “main” oluşturulan grafiğin başlığını, “xlab” x ekseni için açıklama, “ylab” ise y ekseni için açıklamayı göstermektedir. Artık RStudio içerisinde komutları deneyebilirsiniz.

ÖRNEK – II

Eğer ikiden fazla değeri tek grafik üzerinde karşılaştırmak istersek scatterplot grafiği aşadaki şekilde çizdirebiliriz.

qplot(hp, mpg, data=mtcars, shape=am, color=am,  facets=gear~cyl, size=I(3),  xlab="Horsepower", ylab="Miles per Gallon")

argümanlara bakalım; öncelikle kullanılacak veri sütunları belirleniyor. “hp” “HorsePower” yani beygir gücü, “mpg” örnek I ‘de açıklandığı gibidir. “data” kullanılacak veri setini belirleniyor ve “facet” argümanı ile karşılaştırılacak veri formülize ediliyor.

Aynı verilerin boxplot ve jitter grafik olarak çizimi aşağıdaki gibidir.

qplot(gear, mpg, data=mtcars, geom=c("boxplot", "jitter"),  fill=gear, main="Mileage by Gear Number",   xlab="", ylab="Miles per Gallon")

çizdirilebilecek diğer grafik komutları. Bu komutları denediğinize pişman olmayacaksınız çünkü çoğu programda elde edemediğiniz grafikleri R programında görebilirsiniz.

> qplot(mpg, disp, data = mtcars, facets = cyl ~ .)

> qplot(mtcars$mpg, fill = mtcars$cyl, binwidth = 2)

Soru ve önerileriniz için Facebook ve Hotmail üzerinden benimle irtibata geçebilirsiniz.

KAYNAK

http://www.statmethods.net/advgraphs/ggplot2.html

https://www.r-bloggers.com/using-the-ggplot2-library-in-r/

https://cran.r-project.org/web/packages/ggplot2/ggplot2.pdf

 

Yazar Kimdir?

Sıtkı Cansu, 19 Ekim 1985 yilinda Konya-Beyşehir'de dogmustur.İlk, orta ve liseyi Beyşehir'de bitirmis olup Konya-Ereğli Selçuk MYO Bilgisayar programcılığı ve Mugla Sıtkı Koçman Üniversitesi İstatistik bölümünden mezun olmustur. Çesitli yerlerde web tasarımcı ve veri tabani yöneticisi olarak çalışan yazar, son üç senedir ingilizce öğretmenliği yapmaktadir. Şu anda yüksek lisansını tamamlamak üzere Mugla Üniversitesinde öğrenim görmektedir.