Bu yazımızda belirlediğimiz regresyon modellerini veri setine dinamik olarak uygulayarak, R ile istatistiksel programlama bakış açısıyla regresyon analizi yapacağız. Oluşturulan modellerin özet sonuçlarını ve bilgi kriterlerini tek bir tabloda göreceğiz. Analizin kolay ve anlaşılabilir olabilmesi için yalnızca lineer regresyon modeli ile çalışılmıştır. Ancak bu kod bloğu ve mantığı, farklı modeller için de rahatlıkla uyarlanabilir. Gerekli Kütüphaneler ve Tanımlamalar tidyverse: Birbiriyle uyumlu çalışan dplyr, tidyr, tibble gibi paketleri tek bir çatı altında…

Bu yazımızda tidyquant kütüphanesini kullanarak kantitatif veri analizi yapacağız. tidyquant kütüphanesi ile tanışmadan önce, kantitatif finansal analiz fonksiyonlarını kullanmak için ts veya xts yapılarıyla zaman serileri oluşturma yoluna gidiyorduk. tidyquant paketi ile birlikte xts, zoo, quantmod, TTR, ve PerformanceAnalytics paketlerinin fonksiyonları kullanarak veri seti yapısı ve tidyverse mantığında analizler yapabiliyoruz. Bu entegrasyonu sağlamak için iki temel fonksiyon ile çalışıyoruz: tq_transmute(): girdiden farklı periyodiklikte düzenli veri seti döner. tq_mutate(): var olan düzenli…

Daha önceki yazılarımızda, dplyr paketi ile veri manipülasyonundan ve paket içindeki mutate fonksiyonundan bahsetmiştik. Bu yazımızda ise veri setinin çeşilti sütunlarını tek seferde dönüştürebildiğimiz mutate_all(), mutate_if() ve mutate_at() fonksiyonları üzerinde duracağız. mutate_all(): tüm sütunlarda dönüşüm mutate_at(): dplyr::select mantığında seçilen sütunlarda dönüşüm mutate_if(): ilgili koşul altında TRUE dönen sütunlarda dönüşüm Öncelikle dply paketinin kurulumunu yapıp (kurulu değilse) ardından paketi aktif hale getirelim. install.packages(“dplyr”) library(dplyr) Fonksiyon örneklerine geçmeden önce üzerinde çalışacağımız örnek bir…

Gerek R programlama dilinin tarihsel olarak gelişimini incelediğimiz yazımız, gerekse güncel gözlemler ile R’ın piyasadaki yüksek kullanım oranına baktığımız yazımız R’ın artan şekilde tercih edilmekte olduğuna işaret ediyor. Bu durumun iki nedeni programın yapısal özelliklerinden bağımsız. Birincisi, açık yazılım olması dolayısıyla ücretsiz ve kolay ulaşılabilir olması. Bu R’a başlamayı oldukça pratik bir hale, bir iki dakikalık bir indirme süresine, üstelik ücretsiz olarak indirgiyor. İkincisi, yaygın kullanımın kendisi R’a başlamak için önemli…

Düzenli bir zaman aralığında ölçülen herhangi bir metrik, bir zaman serisi oluşturmaktadır. Zaman serilerinin analizi, endüstriyel ihtiyaç ve özellikle talep, satış, arz ile ilgisi nedeniyle önemlidir. Bir zaman serisini sistematik olarak anlamak, analiz etmek, modellemek ve tahmin etmek için bileşenlerine bölünmelidir. Bu yazı, zaman serisi analizine yeni başlayanlar için bir giriş niteliğindedir ve aşağıdaki temel soruları yanıtlar: Bir zaman serisinin bileşenleri nelerdir? Zaman serilerinde durağanlık (stationary) kavramı Zaman serileri parçalara (decompose)…

R programının, sektördeki payı ve gelişiminin incelenmesi önemlidir. Piyasada programlama dilleri ve platformları olarak onlarca farklı alternatif varken rekabet birçok farklı alana göre burada daha yoğundur. Ancak, son yıllarda belirginleşen genel resim R ve Phyton ın dünya genelindeki kullanıcıların büyük çoğunluğunun tercih ettiği iki platform olmasıdır. Bu noktada 3 figür öne çıkıyor. Birincisi, gerek bu iki platform arasındaki rekabet ve geçişler, gerekse yakın dönemdeki sektör payları değerlendirildiğinde açık bir şekilde liderlik…

R, S yazılım dilinin bir diyalekti olarak 1991 yılında Ross Ihaka ve Robert Gentleman tarafından Yeni Zelanda’da oluşturulmuştur. 1995 yılında ise R ın ücretsiz bir yazılım olarak sunulması için gerekli uygulamalara geçilmiştir. 1996’da iki mail listesi oluşturulmuştur. R-help genel sorular için, R-devel ise daha sofistike kullanıcıların yazılım geliştirme üzerine soruları için düzenlenmiştir. Günümüzde R-packages, R-packages-devel ve başka spesifik listeler de mevcuttur. R’ın sunulması itibariyle genel özelliklerine bakacak olursak sintaksının S dili…

Bu yazımızda, Kaggle.com içerisindeki mantar sınıflandırma “mushroom classification” problemi için lojistik regresyon ile analiz yapacağız. Mantarların yenilebilir mi yoksa ölümcül zehirli mi olduklarının modelini oluşturacağız. Gerekli Kütüphaneler ve Tanımlamalar Kullanacağımız tüm kütüphaneler ile ilgili detaylar şu şekildedir: – dplyr, magrittr: Data manipülasyon – caTools: Datayı traning/test setlerine ayırma – rPSI: Population stability index (PSI) – RWeka: Gain ratio – caret: Confusion matrix – pROC: ROC curve – car: Variance inflation factor…

Bu yazımızda, Poloniex kripto para borsasında işlem yapmak için oluşturulan PoloniexR kütüphanesini kullanarak kripto paralar ile teknik analiz incelemeleri yapacağız. Tanımlamalar Öncelikle sistemimizde gerekli kütüphaneler eksik ise kurulumu yapılmalıdır. Bu yazımızda ilk kez CRAN haricinde Github’dan bir kütüphane kullanacağız. Bunun için sistemimizde devtools kütüphanesinin yüklü olması gereklidir. Github üzerinden kütüphane yüklemeleri, devtools kütüphanesi içerisindeki install_github fonksiyonu ile “kullanıcıadi/kütüphaneadi” biçiminde yapılmaktadır. install.packages(“devtools”) devtools::install_github(“VermeirJellen/PoloniexR”) install.packages(c(“quantmod”)) Ana kütüphaneleri aktif hale getirelim. library(PoloniexR) library(quantmod) Genellikle…

Bu yazımızda tarihsel şartlı volatilite modellemesini inceleyeceğiz. Bunun için S&P500 indeksinin tarihsel günlük logaritmik getirileri bulunacak ve GARCH(1,1) modellemesi yapılacaktır ve model sınamaları kontrol edilecektir. Tanımlamalar Öncelikle sistemimizde gerekli kütüphaneler eksik ise kurulumu yapılmalıdır. install.packages(c(“quantmod”,”PerformanceAnalytics”,”FinTS”,”magrittr”,”zoo”,”rugarch”)) Ana kütüphaneleri aktif hale getirelim. library(PerformanceAnalytics) library(magrittr) library(rugarch) Yahoo Finance, finansal enstrümanlara ait genellikle açılış (Open), en yüksek (High), en düşük (Low), kapanış (Close), hacim (Volume) ve düzeltilmiş kapanış (Adjusted) değişkenlerini saklar. GARCH(1,1) modellemesini düzeltilmiş kapanış…