Count data takes only integer values and it is the type of data that commonly used in econometric researches. The aim of this study is determining factors that effects health care demand in Turkey by using Turkish Statistical Institute's 2012 Health Survey data. Number of doctor visits variable which is taken into acount as an indicator of demand is a count data. It will be investigated that whether number of doctor visits which is one of the independent variables is endogenous or not. Instrumental Variable Method, Generalized Method of Moments and Zero Inflated Negative Binomial Model will be handled and political assessments will be made.
Finans uygulamalarının önemli bir çalışma alanını oluşturan finansal zaman serisi tahminlemesi son yıllarda makine öğrenmesi (Machine Learning, ML) yöntemlerinin gelişimi ile finans ve akademi çevrelerinin daha fazla önem atfettiği bir konu olmuştur. Bu çalışmanın amacı, finansal zaman serisi gelecek değerinin tahmininde ML yöntemlerinin karşılaştırmalı olarak bir incelemesini sunmaktır. Çalışmada gelişmiş ve gelişmekte olan iki borsa endeksi ve İstanbul borsasının yüksek hacimli iki hisse senedinin son 5 yıllık kapanış verileri kullanılmıştır. Endeks tahmininde sıklıkla kullanılmış ve başarılı bulunan Destek Vektör Regresyonu (Suport Vector Regression, SVR) ve literatürde zaman serisi tahmininde izine az rastladığımız topluluk (ensemble) makine öğrenmesi yöntemleri olan Rassal Orman (Random Forest, RF) ve Extrem Gradyan Arttırma (eXtreme Gradient Boosting, XGB) yöntemleri tercih edilmiştir. Çalışmanın bulgularına göre, MAE, MAPE ve RMSE kriterleri göz önünde bulundurulduğunda en iyi tahmin yöntemi SVR olarak tespit edilmiştir.
Öz Günümüzde birçok araştırmacı regresyon analizinde hata teriminin dağılışının Gausyan (Normal) olduğunu varsaymakta ve regresyon parametrelerinin tahminini yaparken için En Küçük Kareler (EKK) yöntemini kullanmaktadır. Ancak uygulamada normal dağılış varsayımı kabul edilse bile artıklar genellikle normal dağılıştan farklı bir dağılış göstermektedirler. Özellikle veri setinde bulunan sapan gözlemler veya sapan gözlem olduğundan şüphelenilen gözlemler, verilerin normallik varsayımını bozmakta ve EKK yöntemi ile yapılan parametre tahminleri hatalı (sapmalı) olmaktadır. Araştırmacılar böyle durumların üstesinden gelebilmek için son yıllarda sıklıkla kullanılan dayanıklı (robust) yöntemleri kullanmaktadırlar. Bu yöntemlerin arasında en çok kullanılan M-tahminciler (En Yüksek Olabilirlik tipi) gelmektedir. M-tahminleme yöntemi, En Çok Olabilirlik (MLE) yönteminin genelleştirilmiş bir versiyonudur ve EKK yöntemi de bir M-tahminci olarak bilinmektedir. M-tahminleme yöntemi, eldeki veri setine uygun bir amaç fonksiyonunu minimize ederek parametre tahminlerini iteratif olarak elde etmektedir. Bu çalışmada farklı senaryolar ele alınarak EKK yöntemi, Huber M-tahminleme yöntemi ve Tukey Bisquare M-tahminleme yöntemi karşılaştırılmıştır. Ayrıca bu yöntemlerin amaç, etki ve ağırlık fonksiyonları incelenmiştir. Regresyon parametreleri tahminlenirken İteratif Olarak Tekrar Ağırlıklandırılan En Küçük Kareler (IRWLS) yöntemi kullanılmıştır. IRWLS yönteminde bir başlangıç çözümü uygun bir tahminleme yöntemiyle seçilir (Örn: EKK) ve M-tahminleme yöntemlerinin ağırlık fonksiyonları kullanılarak Ağırlıklı EKK yöntemiyle iteratif olarak parametre tahminleri elde edilir. Elde edilen parametre tahminleri Ortalama Karesel Hata (MSE), Sapma ve R 2 kriterleri açısından karşılaştırılmıştır. Eğer veri seti normal ise en kullanışlı yöntem EKK iken veri setinde kirlenme (contaminated) veya sapan gözlem olduğunda EKK yönteminin etkinliğini kaybettiği görülmüştür. Özellikle açıklanan değişken Y yönünde sapan gözlem olduğunda Huber ve Tukey M-tahminleme yöntemleri EKK'ya göre daha iyi sonuçlar vermektedir.
Credit scores are critical for financial sector investors and government officials, so it is important to develop reliable, transparent and appropriate tools for obtaining ratings. This study aims to predict company credit scores with machine learning and modern statistical methods, both in sectoral and aggregated data. Analyses are made on 1881 companies operating in three different sectors that applied for loans from Turkey’s largest public bank. The results of the experiment are compared in terms of classification accuracy, sensitivity, specificity, precision and Mathews correlation coefficient. When the credit ratings are estimated on a sectoral basis, it is observed that the classification rate considerably changes. Considering the analysis results, it is seen that logistic regression analysis, support vector machines, random forest and XGBoost have better performance than decision tree and k-nearest neighbour for all data sets.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2025 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.