Jupyter Notebook ile R Programlama - R Kernel Kurulumu
By Güngör Budak
- 3 minutes read - 511 wordsDaha önceki bir yazımda [Jupyter’in kurulumundan ve Jupyter Notebook]({% post_url 2018-03-31-jupyter-python-nedir-nasil-kurulur %})’tan bahsetmiştim. Jupyter’in kurulumu Jupyter Notebook’a Python kernelini direkt kuruyor ve Python ile programlamayı mümkün kılıyor ancak biyoenformatikte sıkça kullanılacak bir diğer programlama dili olan R programlama için ilgili kerneli ekstra kurmak gerekiyor. Bu yazımda bu kernelin kurulumundan bahsedeceğim.
Öncelikle [Jupyter kurulumu]({% post_url 2018-03-31-jupyter-python-nedir-nasil-kurulur %}) ve R kurulumu yapılmış olması gerekiyor.
Daha sonra Terminal’den aşağıdaki komutu kullanarak bir R oturumu başlatın:
Gungors-MacBook-Pro:~ gungor$ R
R version 3.4.3 (2017-11-30) -- "Kite-Eating Tree"
Copyright (C) 2017 The R Foundation for Statistical Computing
Platform: x86_64-apple-darwin17.3.0 (64-bit)
R is free software and comes with ABSOLUTELY NO WARRANTY.
You are welcome to redistribute it under certain conditions.
Type 'license()' or 'licence()' for distribution details.
Natural language support but running in an English locale
R is a collaborative project with many contributors.
Type 'contributors()' for more information and
'citation()' on how to cite R or R packages in publications.
Type 'demo()' for some demos, 'help()' for on-line help, or
'help.start()' for an HTML browser interface to help.
Type 'q()' to quit R.
>
Aşağıda gösterildiği gibi gerekli R paketlerini kurun:
1> install.packages(c('repr', 'IRdisplay', 'evaluate', 'crayon', 'pbdZMQ', 'devtools', 'uuid', 'digest'))
devtools
kullanarak IRkernel’i GitHub kaynağından kurun:
1> devtools::install_github('IRkernel/IRkernel')
Ve son olarak da R kerneli tanımlayın:
1> IRkernel::installspec()
Bu ir
koduyla, R
adında bir kerneli Jupyter’e ekleyecek. Bunları değiştirmek için tanımlarken aşağıdaki gibi ayarlamalar yapabilirsiniz (örneğin özel bir versiyon için):
1> IRkernel::installspec(name = 'ir34', displayname = 'R 3.4')
Jupyter Notebook’u başlattığınızda New
butonundan R 3.4
kernelini seçerek Jupyter Notebook üzerinde R programlamaya başlayabilirsiniz.
Küçük bir analiz ile bir test yapabiliriz. Bu analizi korelasyon grafiği çıkarma üzerine bir makale den aldım. Makalede de görülebileceği gibi aşağıdaki kodları sırası ile çalıştırıyor olacağım.
1# corrplot paketini kur
2install.packages("corrplot")
3
4# corrplot paketini yükle
5library("corrplot")
6
7# araçlar verisinin ilk satırlarını gör
8head(mtcars)
9
10# korelasyon analizi yap ve sonucun ilk satırlarını gör
11M <- cor(mtcars)
12head(round(M, 2))
13
14# korelasyon grafiği çizdir
15corrplot(M, method="color")
Öncelikle Desktop
‘ta yeni bir klasör açalım ve Terminal’den bu klasöre gidelim (bu komutlar Linux tabanlı işletim sistemleri / macOS için geçerlidir, Windows için de benzer işlemler farklı komutlarla yapılmalıdır):
1Gungors-MacBook-Pro:~ gungor$ cd ~/Desktop/
2Gungors-MacBook-Pro:Desktop gungor$ mkdir playground
3Gungors-MacBook-Pro:Desktop gungor$ cd playground/
4Gungors-MacBook-Pro:playground gungor$
Jupyter Notebook’u başlatalım (bu komut tarayıcınızda yukarıdaki resimdekine benzer yeni bir sekme başlatacak):
1Gungors-MacBook-Pro:playground gungor$ jupyter notebook
Açılan sayfada New
menüsünden R 3.4
notebook’unu seçip (yukarıdaki resimde göründüğü gibi) yeni bir notebook açalım.
Bu notebook’ta istediğimiz R komutunu/kodunu çalıştırabiliriz; yeni R paketleri kurabilir, mevcut R paketlerini yükleyebilir, analizler yapıp grafikler oluşturabiliriz.
Jupyter Notebook’ta gri arkaplanlı hücrelerde Markdown ile stillenebilir yazılar ve kodlar bulunabilir. Bir hücrenin tipi hücre seçildikten sonra üst menüdeki Cell
sonrasında Cell Type
menüsünden ayarlanabilir.
Hücreler doldurulduktan sonra üst menünün altındaki menüde bulunan play simgeli buton ile çalıştırılabilir, gene bu menüdeki +
simgesi ile yeni hücre oluşturulabilir. Bir hücre çalıştırılırken sol tarafındaki In [ ]:
kısmı, In [*]:
olarak gösterilecek ve bittiğinde de sırasına göre bir numara ile gösterilecektir, örneğin In [1]:
. Çalıştırıldıktan sonra hemen altında varsa çıktısı görünecektir.
Tüm hücreler çalıştırıldığında ise aşağıdaki gibi bir korelasyon grafiği bu veri için gösterilecektir.