R’ın Sektör Payı ve Gelişimi

R programının, sektördeki payı ve gelişiminin incelenmesi önemlidir. Piyasada programlama dilleri ve platformları olarak onlarca farklı alternatif varken rekabet birçok farklı alana göre burada daha yoğundur. Ancak, son yıllarda belirginleşen genel resim R ve Phyton ın dünya genelindeki kullanıcıların büyük çoğunluğunun tercih ettiği iki platform olmasıdır. Bu noktada 3 figür öne çıkıyor. Birincisi, gerek bu iki platform arasındaki rekabet ve geçişler, gerekse yakın dönemdeki sektör payları değerlendirildiğinde açık bir şekilde liderlik sağlayan taraf olmamıştır. İkincisi, yine son yıllarda düzenli olarak, bu iki platformun dışında kalan kullanıcıların giderek azaldığı gerçeğidir. Üçüncüsü ise her iki platformu aynı anda kullananların payındaki artıştır.

www.KDnuggets.com dan alınan aşağıdaki figür bu üç durumu özetler niteliktedir. Bine yakın kullanıcının katılımı ile gerçekleşen oylama sonucu geride bıraktığımız iki yıl içinde veri analizi ve makine öğrenmesi alanlarında R ve Phyton ın kullanım oranları sırasıyla %42 ile %34 (2016) ve 36% ile 41% (2017) olarak görünmüştür. Her iki platformu da kullananların payı 2016’da %8.5 ten 2017’de %12 ye çıkarken bu iki platform dışında bir platform kullananların payı %16 dan %11 e gerilemiştir. Bu sonuçlar daha fazla kişinin üçüncü bir platformdan bu iki platformdan birine geçtiğini ve halihazırda bu platformlardan birini kullananların bir kısmının diğer platformu da kullanmaya başladığını göstermektedir.

Aynı sitenin daha kapsamlı bir katılım ile (2900 katılımcı) düzenlediği 18. geleneksel anketine göre 2017 yılında R ve Pyhton hemen hemen aynı kullanım payları ile ilk iki sırada yer alırken onları SQL takip ediyor. Son üç yılın dağılımını gösteren aşağıdaki figür R ve Phyton ın ayrı ayrı katılımcıların yarıdan fazlası tarafından kullanıldıkları bir noktaya geldiklerini ortaya koyuyor.

O’Reilly nin düzenlediği en güncel (2016) ‘veri bilimi maaş anketi’ de aynı doğrultuda sonuçlar vermektedir. SQL programı sonrası en çok kullanılan iki program olarak R ve Pyhton öne çıkmakta, veri bilimi, mühendislik ve veri analizi ile ilgili diğer işlerde çalışan, 45 ülkeden 983 katılımcının %57’si R, %54’ü Pyhton programını kullandığını belirtmiştir. Aynı ankete göre R kullanıcılarının belirttiği güncel yıllık maaşlar yaklaşık 50 bin $ ile 120 bin $ arasında değişmektedir.

Veri bilimi ve analizi alanında işe alım firması Burtch Works’ın 1000’den fazla katılımcı ile gerçekleştirdiği tek soruluk (hangisini tercih edersiniz?) anketinin sonuçları da aşağıdaki figür ile özetleniyor ve benzer rakamlar ortaya koyuyor.

Rexer Analytics’in 2007 yılından beri gerçekleştirdiği anketlerden son açıklananı 2015 itibariyle 72 ülkeden 1220 veri analizi profesyonelinin tercihlerini gösteriyor. R’ın açık bir şekilde en çok kullanılan platform olduğunu ortaya koyan sonuçlara göre kullanıcıların %36 sı kullandıkları ana platformun R olduğunu belirtirken, %76 R ın kullandıkları platformlardan biri olduğunu rapor ediyorlar. R kullanıcılarının 2015 te %76 olan payı 2007 yılındaki ankette %23 olarak belirlenmiş.

R ın akademik hayatta da kendine fazlaca yer bulduğunu görüyoruz. R4stats.com da yapılan incelemeyi yansıtan aşağıdaki figür 2016 yılı boyunca ilgili en az 750 akamedik makale yazılmış programların makale sayılarını götermekte. SPSS’in ardından ikinci sırada yer alan R 2016 yılında yaklaşık 40 bin makale ile ilintilenmiş.

Aynı web sitesinden alınan bir başka inceleme tamamlayıcı nitelikte. 1995 – 2016 yılları arası Google Scholar da aranma sayılarının analizi R ın belirgin şekilde ön plana çıktığını göstermekte. R4stats.com dan alınan aşağıdaki ilk figür genel durumu gösterirken ikincisi karşılaştırma için görsel kolaylık sağlamak amacıyla ve önceki yıllardaki yüksek seviyeleri sebebiyle SPSS i komple, SAS ı da son iki yıl gözlemleri hariç çıkardıktan sonra çizdirilmiş. İlk figür SPSS ve SAS ın yaklaşık 10 yıl önce akademik aramalarda kendi zirvelerini gördüğü, sonrasında bu eksende güçlerini kaybettiklerini gösteriyor. Diğer yandan özellikle ikinci figür R ın akademik ortamda aranma durumunun yıllar içerisinde hızla artarak ilk sıraya doğru çıktığını ortaya koymakta.

Özetle, gerek veri analizi uzmanlarına ulaşan anketlerin işaret ettiği şekilde, gerek bunu destekleyen şekilde akademik çevrede kendine bulduğu yer ile, gerekse yıllar içinde düzenli artan grafiği ile R birçok platform arasında öne çıkmaktadır. Bu, veri bilimi ile uğraşan kişilerin değerlendirmesi faydalı olabilecek bir durumdur.

Kaynaklar
http://r4stats.com/articles/popularity/
https://www.oreilly.com