Gerek R programlama dilinin tarihsel olarak gelişimini incelediğimiz yazımız, gerekse güncel gözlemler ile R’ın piyasadaki yüksek kullanım oranına baktığımız yazımız R’ın artan şekilde tercih edilmekte olduğuna işaret ediyor. Bu durumun iki nedeni programın yapısal özelliklerinden bağımsız. Birincisi, açık yazılım olması dolayısıyla ücretsiz ve kolay ulaşılabilir olması. Bu R’a başlamayı oldukça pratik bir hale, bir iki dakikalık bir indirme süresine, üstelik ücretsiz olarak indirgiyor. İkincisi, yaygın kullanımın kendisi R’a başlamak için önemli…

Düzenli bir zaman aralığında ölçülen herhangi bir metrik, bir zaman serisi oluşturmaktadır. Zaman serilerinin analizi, endüstriyel ihtiyaç ve özellikle talep, satış, arz ile ilgisi nedeniyle önemlidir. Bir zaman serisini sistematik olarak anlamak, analiz etmek, modellemek ve tahmin etmek için bileşenlerine bölünmelidir. Bu yazı, zaman serisi analizine yeni başlayanlar için bir giriş niteliğindedir ve aşağıdaki temel soruları yanıtlar: Bir zaman serisinin bileşenleri nelerdir? Zaman serilerinde durağanlık (stationary) kavramı Zaman serileri parçalara (decompose)…

R programının, sektördeki payı ve gelişiminin incelenmesi önemlidir. Piyasada programlama dilleri ve platformları olarak onlarca farklı alternatif varken rekabet birçok farklı alana göre burada daha yoğundur. Ancak, son yıllarda belirginleşen genel resim R ve Phyton ın dünya genelindeki kullanıcıların büyük çoğunluğunun tercih ettiği iki platform olmasıdır. Bu noktada 3 figür öne çıkıyor. Birincisi, gerek bu iki platform arasındaki rekabet ve geçişler, gerekse yakın dönemdeki sektör payları değerlendirildiğinde açık bir şekilde liderlik…

R, S yazılım dilinin bir diyalekti olarak 1991 yılında Ross Ihaka ve Robert Gentleman tarafından Yeni Zelanda’da oluşturulmuştur. 1995 yılında ise R ın ücretsiz bir yazılım olarak sunulması için gerekli uygulamalara geçilmiştir. 1996’da iki mail listesi oluşturulmuştur. R-help genel sorular için, R-devel ise daha sofistike kullanıcıların yazılım geliştirme üzerine soruları için düzenlenmiştir. Günümüzde R-packages, R-packages-devel ve başka spesifik listeler de mevcuttur. R’ın sunulması itibariyle genel özelliklerine bakacak olursak sintaksının S dili…

Bu yazımızda, Kaggle.com içerisindeki mantar sınıflandırma “mushroom classification” problemi için lojistik regresyon ile analiz yapacağız. Mantarların yenilebilir mi yoksa ölümcül zehirli mi olduklarının modelini oluşturacağız. Gerekli Kütüphaneler ve Tanımlamalar Kullanacağımız tüm kütüphaneler ile ilgili detaylar şu şekildedir: – dplyr, magrittr: Data manipülasyon – caTools: Datayı traning/test setlerine ayırma – rPSI: Population stability index (PSI) – RWeka: Gain ratio – caret: Confusion matrix – pROC: ROC curve – car: Variance inflation factor…

Bu yazımızda, Poloniex kripto para borsasında işlem yapmak için oluşturulan PoloniexR kütüphanesini kullanarak kripto paralar ile teknik analiz incelemeleri yapacağız. Tanımlamalar Öncelikle sistemimizde gerekli kütüphaneler eksik ise kurulumu yapılmalıdır. Bu yazımızda ilk kez CRAN haricinde Github’dan bir kütüphane kullanacağız. Bunun için sistemimizde devtools kütüphanesinin yüklü olması gereklidir. Github üzerinden kütüphane yüklemeleri, devtools kütüphanesi içerisindeki install_github fonksiyonu ile “kullanıcıadi/kütüphaneadi” biçiminde yapılmaktadır. install.packages(“devtools”) devtools::install_github(“VermeirJellen/PoloniexR”) install.packages(c(“quantmod”)) Ana kütüphaneleri aktif hale getirelim. library(PoloniexR) library(quantmod) Genellikle…

Bu yazımızda tarihsel şartlı volatilite modellemesini inceleyeceğiz. Bunun için S&P500 indeksinin tarihsel günlük logaritmik getirileri bulunacak ve GARCH(1,1) modellemesi yapılacaktır ve model sınamaları kontrol edilecektir. Tanımlamalar Öncelikle sistemimizde gerekli kütüphaneler eksik ise kurulumu yapılmalıdır. install.packages(c(“quantmod”,”PerformanceAnalytics”,”FinTS”,”magrittr”,”zoo”,”rugarch”)) Ana kütüphaneleri aktif hale getirelim. library(PerformanceAnalytics) library(magrittr) library(rugarch) Yahoo Finance, finansal enstrümanlara ait genellikle açılış (Open), en yüksek (High), en düşük (Low), kapanış (Close), hacim (Volume) ve düzeltilmiş kapanış (Adjusted) değişkenlerini saklar. GARCH(1,1) modellemesini düzeltilmiş kapanış…

Bu yazımızda hem dplyr kütüphanesi içerisindeki fonksiyonları incelemeye hem de oldukça kullanışlı olan zaman serisi yapıları (xts) ile çalışmaya başlayacağız. dplyr kütüphanesinin nasıl kullanılacağını merak ediyorsanız bir önceki yazımızı inceleyebilirsiniz. Yahoo Finance ve Google Finance bir çok finansal enstrümanın tarihsel fiyat verilerini alabileceğimiz kaynaklardır. quantmod kütüphanesi ile bu sitelerden tarihsel fiyat verilerine erişebilmekteyiz. Bu incelememizde Yahoo Finance’dan Starbucks ve Microsoft hisse senetlerinin 01.01.2015 – 31.12.2017 tarih aralığında günlük fiyatlarını alıp tek…

İstatistik, ekonometri ve uygulamalı matematikteki bir çok teoride, kullanılan dataların normal olduğu varsayımı bulunmaktadır. Bu nedenle analizi yapılacak dataların normal dağılım sergileyip sergilemediklerinin tespiti önemlidir. Dataların olasılık dağılımlarının normal dağılım olmadığının tespiti için genellikle Jarque-Bera, Anderson-Darling, Kolmogorov-Smirnov, Shapiro-Wilk, Pearson chi-square, ve Cramer-von Mises istatistiksel testleri kullanılmaktadır. Analizleri yapabilmek için hem normal dağılma hem de uniform dağılıma göre iki sentetik data oluşturalım. set.seed(2018) x <- rnorm(1000, mean=2.5, sd=1) y <- runif(1000, min=0,…

dplyr Kütüphanesi İlk yazımızda R’da data (veri) manipülasyonu için dplyr paketini (library) kullanmayı inceleyeceğiz ve kodlarımızda pipeline %>% da kullanmaya başlayacağız. dplyr 5 ana fiilden oluşmaktadır. – filter – select – mutate – arrange – summarise İlk olarak dplyr paketinin kurulumunu yapalım. install.packages(“dplyr”) Ardından kütüphaneyi aktif hale getirelim. library(dplyr) Analizleri yapmak için mtcars datasetini dikkate alalım. mtcars dataseti 1974 yılı Motor Trend US dergisine göre 32 aracın çeşitli kriterlere göre özelliklerini…