@article{ author = {Chèze, Nathalie and Poggi, Jean-Michel}, title = {Outlier Detection by Boosting Regression Trees}, abstract ={A procedure for detecting outliers in regression problems is proposed. It is based on information provided by boosting regression trees. The key idea is to select the most frequently resampled observation along the boosting iterations and reiterate after removing it. The selection criterion is based on Tchebychev’s inequality applied to the maximum over the boosting iterations of the average number of appearances in bootstrap samples. So the procedure is noise distribution free. It allows to select outliers as particularly hard to predict observations. A lot of well-known bench data sets are considered and a comparative study against two well-known competitors allows to show the value of the method.}, Keywords = {Boosting, CART, outlier, regression.}, volume = {3}, Number = {1}, pages = {1-22}, publisher = {Statistical Research and Training Center - Statistical Centre of Iran}, title_fa = {شناسایی نقاط دورافتاده با استفاده از تقویت درخت‌های رگرسیونی}, abstract_fa ={در این مقاله روشی برای شناسایی نقاط دورافتاده در مسائل رگرسیونی پیشنهاد شده است. این روش بر اساس اطلاعاتی است که با تقویت درخت‌های رگرسیونی به دست می‌آید. ایده‌ی اصلی این است که مشاهده‌ای را که بیش از همه در بازنمونه‌گیری‌های روش تقویت (boosting) ظاهر می‌شود، انتخاب و حذف کنیم و سپس این کار را تکرار کنیم. معیار این انتخاب، بر اساس نابرابری چبیشوف است که در مورد ماکسیمم تعداد تکرارهای تقویت در متوسط تعداد ظهور در نمونه‌های خودگردان‌ساز (bootstrap) به کار گرفته می‌شود. از این رو، این روش، بستگی به توزیع نوفه ندارد. این روش، امکان انتخاب نقاط دورافتاده را که پیش‌بینی مشاهدات آن‌ها بسیار سخت است، فراهم می‌سازد. برای نشان دادن ارزش این روش، مجموعه‌داده‌های مشهور زیادی در نظر گرفته شده‌اند و مقایسه‌ای بین روش پیشنهادی و دو روش رایج صورت گرفته است.}, keywords_fa = {تقویت, CART, نقاط دورافتاده, رگرسیون.}, doi = {10.18869/acadpub.jsri.3.1.1}, url = {http://jsri.srtc.ac.ir/article-1-163-en.html}, eprint = {http://jsri.srtc.ac.ir/article-1-163-en.pdf}, journal = {Journal of Statistical Research of Iran JSRI}, issn = {2538-5771}, eissn = {2538-5763}, year = {2006} } @article{ author = {Dargahi-Noubary, R.}, title = {Some Statistical Methods for Prediction of Athletic Records}, abstract ={Prediction of the sports records has received a great deal of attention from researchers in different disciplines. This article reviews some of the methods developed by statisticians and offers few improvements. Specific methods discussed include trend analysis, tail modeling, and methods based on certain results of the theory of records for independent and identically distributed attempts. To make the latter theory applicable, and to account for factors affecting the records, adjustments are made to the data in the form of increase in participation or attempts. Models utilized for this purpose include geometric increase, logistic increase, and increase as a non-homogenous Poisson process. A method for prediction of ultimate record is also included together with demonstrating examples using data for men’s long jump and 400 meter run.}, Keywords = {Sport records, prediction, trend analysis, tail modeling, theory of records, Poisson processes. }, volume = {3}, Number = {1}, pages = {23-46}, publisher = {Statistical Research and Training Center - Statistical Centre of Iran}, title_fa = {روش‌هایی برای پیش‌بینی رکوردهای ورزشی}, abstract_fa ={پیش‌بینی رکوردهای ورزشی، توجه فراوانی را از سوی پژوهشگران در شاخه‌های مختلف علوم، معطوف به خود کرده است. این مقاله بعضی از روش‌های معرفی‌شده توسط آمارشناسان را مورد بررسی قرار می‌دهد و برخی اصلاحات را پیشنهاد می‌کند. روش‌های مشخصی که مورد بحث قرار گرفته‌اند، عبارت‌اند از تحلیل روند، مدل‌بندی دم‌ها، و روش‌های مبتنی بر برخی نتایج خاص در نظریه‌ی رکوردها برای رکوردگیری‌های متعدد، مستقل و هم‌توزیع. برای کاربردی کردن نظریه‌ی اخیر، و برای در نظر داشتن عوامل مؤثر بر رکوردها، تعدیل در داده‌ها به‌شکل افزایش تعداد شرکت‌کنندگان یا دفعات رکوردگیری انجام می‌گیرد. مدل‌های مورد استفاده برای این منظور، شامل افزایش هندسی، افزایش لوژستیک، و افزایش در قالب یک فرایند پواسون غیر همگن‌اند. روشی برای پیش‌بینی رکورد نهایی، همراه با مثال‌هایی با استفاده از داده‌هایی از پرش طول و دوِ ۴۰۰ متر مردان نیز ارائه شده است.}, keywords_fa = {رکوردهای ورزشی, پیش‌بینی, تحلیل روند, مدل‌بندی دم‌ها, نظریه‌ی رکوردها, فرایندهای پواسون.}, doi = {10.18869/acadpub.jsri.3.1.23}, url = {http://jsri.srtc.ac.ir/article-1-160-en.html}, eprint = {http://jsri.srtc.ac.ir/article-1-160-en.pdf}, journal = {Journal of Statistical Research of Iran JSRI}, issn = {2538-5771}, eissn = {2538-5763}, year = {2006} } @article{ author = {Sharafi, Maryam and Behboodian, jav}, title = {A New Skew-normal Density}, abstract ={We present a new skew-normal distribution, denoted by NSN($lambada$). We first derive the density and moment generating function of NSN($lambada$). The properties of SN($lambada$), the known skew-normal distribution of Azzalini, and NSN($lambada$) are compared with each other. Finally, a numerical example for testing about the parameter $lambada$ in NSN($lambada$) is given.}, Keywords = {Skew-normal distribution, a new skew-normal distribution, moment generating function, skewness, kurtosis, testing hypothesis.}, volume = {3}, Number = {1}, pages = {47-61}, publisher = {Statistical Research and Training Center - Statistical Centre of Iran}, title_fa = {یک چگالی چوله‌نرمال جدید}, abstract_fa ={ در این مقاله یک توزیع چوله‌نرمال جدید را معرفی می‌کنیم، که آن را با NSN($lambada$) نشان می‌دهیم. نخست تابع مولد گشتاورها و تابع چگالی NSN($lambada$) را به دست می‌آوریم. خواص ($lambada$)SN، توزیع چوله‌نرمال شناخته‌شده‌ی آتسالینی (Azzalini)، و NSN($lambada$) را با یکدیگر مقایسه می‌کنیم. در پایان، یک مثال عددی برای آزمون کردن پارامتر $lambada$ در NSN($lambada$) ارائه می‌کنیم.}, keywords_fa = { توزیع چوله‌نرمال, تابع مولد گشتاورها, چولگی, کشیدگی, آزمون فرض.}, doi = {10.18869/acadpub.jsri.3.1.47}, url = {http://jsri.srtc.ac.ir/article-1-159-en.html}, eprint = {http://jsri.srtc.ac.ir/article-1-159-en.pdf}, journal = {Journal of Statistical Research of Iran JSRI}, issn = {2538-5771}, eissn = {2538-5763}, year = {2006} } @article{ author = {Mohammadpour, Adel and Mohammad-Djafari, Ali and P.Nolané, Joh}, title = {A Randomness Test for Stable Data}, abstract ={In this paper, we propose a new method for checking randomness of non-Gaussian stable data based on a characterization result. This method is more sensitive with respect to non-random data compared to the well-known non-parametric randomness tests.}, Keywords = {Stable distributions, randomness tests (test for i.i.d.), characterization.}, volume = {3}, Number = {1}, pages = {63-74}, publisher = {Statistical Research and Training Center - Statistical Centre of Iran}, title_fa = {آزمونی برای بررسی تصادفی بودن داده‌های پایدار}, abstract_fa ={در این مقاله روش جدیدی برای آزمون تصادفی بودن داده‌های پایدارِ غیر گاوسی بر مبنای یک نتیجه‌ی مشخص‌سازی پیشنهاد می‌کنیم. این روش، نسبت به داده‌های غیر تصادفی، حساس‌تر از آزمون‌های ناپارامتری شناخته‌شده برای تصادفی بودن است.}, keywords_fa = { توزیع‌های پایدار, آزمون‌هایی برای تصادفی بودن, مشخص‌سازی.}, doi = {10.18869/acadpub.jsri.3.1.63}, url = {http://jsri.srtc.ac.ir/article-1-162-en.html}, eprint = {http://jsri.srtc.ac.ir/article-1-162-en.pdf}, journal = {Journal of Statistical Research of Iran JSRI}, issn = {2538-5771}, eissn = {2538-5763}, year = {2006} } @article{ author = {Vahidi-Asl, Elaheh and Ganjali, Mojtab}, title = {A Comparative Review of Selection Models in Longitudinal Continuous Response Data with Dropout}, abstract ={Missing values occur in studies of various disciplines such as social sciences, medicine, and economics. The missing mechanism in these studies should be investigated more carefully. In this article, some models, proposed in the literature on longitudinal data with dropout are reviewed and compared. In an applied example it is shown that the selection model of Hausman and Wise (1979, Econometrica 47, pp. 455-473) and the shared parameter model of Follmann and Wu (1995, Biometrics 51, pp. 151-168), two of the most used models for longitudinal data with dropout in economics and medical researches, respectively, cannot sufficiently consider the relation between response variables and missing mechanism. In this paper, the Follmann and Wu’s (1995) dropout model is also generalized by adding a previous time outcome component to the model. Having modified this model, in the case of longitudinal data with two time periods, a general form of this model is obtained, which is able to consider all relations between response and missing mechanism. This is proven in an implicit way. A test for missing at random in the generalized Hechman model (Crouchley and Ganjali, 2002, Stat. Model. 2, pp. 39-62) is also introduced where one has to use $delta$-method to find the variance of the test statistic.}, Keywords = {Longitudinal data, continuous response, missing values, selection bias, dropout, random effect model.}, volume = {3}, Number = {1}, pages = {75-90}, publisher = {Statistical Research and Training Center - Statistical Centre of Iran}, title_fa = {یک بازبینی مقایسه‌ایِ مدل‌های انتخاب در داده‌های با پاسخ طولی پیوسته همراه با انصراف}, abstract_fa ={مقادیر گم‌شده، در پژوهش‌های مربوط به بسیاری از شاخه‌های علمی، مانند علوم اجتماعی، پزشکی، و اقتصاد، رخ می‌دهند. مکانیسم گم شدن در این پژوهش‌ها باید با دقت بیش‌تری مورد بررسی قرار گیرد. در این مقاله، برخی از مدل‌هایی که در نوشتگان آماری در خصوص داده‌های طولی با الگوی انصراف پیشنهاد شده‌اند، مورد بازبینی و مقایسه قرار گرفته‌اند. در یک مثال عملی نشان داده شده است که دو مورد از پرکاربردترین مدل‌ها در زمینه‌ی پژوهش‌های اقتصادی و پزشکی برای داده‌های طولی با الگوی انصراف، مدل انتخاب هاسمن و وایز (Hausman and Wise, 1979, Econometrica 47, pp. 455-473) و مدل با پارامتر مشترک فولمن و وو (Follman and Wu, 1995, Biometrics 51, pp. 151-168) نمی‌توانند به‌خوبی رابطه‌ی بین متغیرهای پاسخ و مکانیسم گم شدن را در نظر گیرند. در این مقاله، مدل انصراف فولمن و وو با افزودن پاسخ زمان پیشین، تعمیم داده شده است. با اصلاح این مدل، در داده‌های طولی با دو دوره‌ی زمانی، شکل کلّی از این مدل به دست آمده، که قادر است همه‌ی روابط بین پاسخ و مکانسیم گم شدن را در نظر گیرد. این امر به‌روش جبری ثابت شده است. روشی نیز برای آزمون فرض گم شدن تصادفی در مدل تعمیم‌یافته‌ی هکمن (Crouchley and Ganjali, 2002, Stat. Model. 2, pp. 39-62) پیشنهاد شده است که در آن با کمک روش دلتا، واریانس آماره‌ی آزمون محاسبه می‌شود.}, keywords_fa = {داده‌های طولی, پاسخ پیوسته, مقادیر گم‌شده, اریبی انتخاب, انصراف, مدل اثر تصادفی.}, doi = {10.18869/acadpub.jsri.3.1.75}, url = {http://jsri.srtc.ac.ir/article-1-161-en.html}, eprint = {http://jsri.srtc.ac.ir/article-1-161-en.pdf}, journal = {Journal of Statistical Research of Iran JSRI}, issn = {2538-5771}, eissn = {2538-5763}, year = {2006} } @article{ author = {Habibullah, Mohamed and Ahsanullah, Mohamm}, title = {On Classification of Bivariate Distributions Based on Mutual Information}, abstract ={Among all measures of independence between random variables, mutual information is the only one that is based on information theory. Mutual information takes into account of all kinds of dependencies between variables, i.e., both the linear and non-linear dependencies. In this paper we have classified some well-known bivariate distributions into two classes of distributions based on their mutual information. The distributions within each class have the same mutual information. These distributions have been used extensively as survival distributions of two component systems in reliability theory.}, Keywords = {Mutual information, entropy, survival distribution, bivariate di}, volume = {3}, Number = {1}, pages = {91-101}, publisher = {Statistical Research and Training Center - Statistical Centre of Iran}, title_fa = {رده‌بندی توزیع‌های دو متغیره بر مبنای اطلاع متقابل}, abstract_fa ={ در میان همه‌ی معیارهای استقلال مابین متغیرهای تصادفی، اطلاع متقابل، یگانه موردِ مبتنی بر نظریه‌ی اطلاع است. نظریه‌ی اطلاع، همه‌ی انواع وابستگی بین متغیرها، اعم از وابستگی‌های خطی و غیرخطی را در نظر می‌گیرد. ما در این مقاله، بعضی از توزیع‌های دو متغیره‌ی مشهور را بر مبنای اطلاع متقابل‌شان، در دو رده از توزیع‌ها تقسیم‌بندی کرده‌ایم. توزیع‌های هر رده دارای اطلاع متقابل یکسان هستند. این توزیع‌ها به‌طور گسترده‌ای به‌عنوان توزیع‌های بقا در دستگاه‌های دو مؤلفه‌ای در نظریه‌ی قابلیت اعتماد به کار رفته‌اند.}, keywords_fa = {اطلاع متقابل, آنتروپی, توزیع بقا, توزیع‌های دوگانه.}, doi = {10.18869/acadpub.jsri.3.1.91}, url = {http://jsri.srtc.ac.ir/article-1-158-en.html}, eprint = {http://jsri.srtc.ac.ir/article-1-158-en.pdf}, journal = {Journal of Statistical Research of Iran JSRI}, issn = {2538-5771}, eissn = {2538-5763}, year = {2006} }