<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Journal of Statistical Research of Iran</title>
<title_fa>مجله‌ی پژوهش‌های آماری ایران</title_fa>
<short_title>JSRI</short_title>
<subject>Basic Sciences</subject>
<web_url>http://jsri.srtc.ac.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2538-5771</journal_id_issn>
<journal_id_issn_online>2538-5763</journal_id_issn_online>
<journal_id_pii>8</journal_id_pii>
<journal_id_doi>10.52547/jsri</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid>14</journal_id_sid>
<journal_id_nlai>8888</journal_id_nlai>
<journal_id_science>13</journal_id_science>
<language>en</language>
<pubdate>
	<type>jalali</type>
	<year>1385</year>
	<month>6</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2006</year>
	<month>9</month>
	<day>1</day>
</pubdate>
<volume>3</volume>
<number>1</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>en</language>
	<article_id_doi></article_id_doi>
	<title_fa>شناسایی نقاط دورافتاده با استفاده از تقویت درخت‌های رگرسیونی</title_fa>
	<title>Outlier Detection by Boosting Regression Trees</title>
	<subject_fa>عمومى</subject_fa>
	<subject>General</subject>
	<content_type_fa>پژوهشي</content_type_fa>
	<content_type>Research</content_type>
	<abstract_fa>&lt;p dir=&quot;RTL&quot;&gt;در این مقاله روشی برای شناسایی نقاط دورافتاده در مسائل رگرسیونی پیشنهاد شده است. این روش بر اساس اطلاعاتی است که با تقویت درخت&#8204;های رگرسیونی به دست می&#8204;آید. ایده&#8204;ی اصلی این است که مشاهده&#8204;ای را که بیش از همه در بازنمونه&#8204;گیری&#8204;های روش تقویت &lt;span dir=&quot;LTR&quot;&gt;(boosting)&lt;/span&gt; ظاهر می&#8204;شود، انتخاب و حذف کنیم و سپس این کار را تکرار کنیم. معیار این انتخاب، بر اساس نابرابری چبیشوف است که در مورد ماکسیمم تعداد تکرارهای تقویت در متوسط تعداد ظهور در نمونه&#8204;های خودگردان&#8204;ساز &lt;span dir=&quot;LTR&quot;&gt;(bootstrap)&lt;/span&gt; به کار گرفته می&#8204;شود. از این رو، این روش، بستگی به توزیع نوفه ندارد. این روش، امکان انتخاب نقاط دورافتاده را که پیش&#8204;بینی مشاهدات آن&#8204;ها بسیار سخت است، فراهم می&#8204;سازد. برای نشان دادن ارزش این روش، مجموعه&#8204;داده&#8204;های مشهور زیادی در نظر گرفته شده&#8204;اند و مقایسه&#8204;ای بین روش پیشنهادی و دو روش رایج صورت گرفته است.&lt;/p&gt;

&lt;p dir=&quot;RTL&quot;&gt;&lt;/p&gt;
</abstract_fa>
	<abstract>&lt;p align=&quot;center&quot; dir=&quot;LTR&quot;&gt;&lt;/p&gt;

&lt;p align=&quot;center&quot; dir=&quot;LTR&quot;&gt;&lt;/p&gt;

&lt;p style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;line-height: 1.6em;&quot;&gt;A procedure for detecting outliers in regression problems is proposed. It is based on information provided by boosting regression trees. The key idea is to select the most frequently resampled observation along the boosting iterations and reiterate after removing it. The selection criterion is based on Tchebychev&amp;rsquo;s inequality applied to the maximum over the boosting iterations of the average number of appearances in bootstrap samples. So the procedure is noise distribution free. It allows to select outliers as particularly hard to predict observations. A lot of well-known bench data sets are considered and a comparative study against two well-known competitors allows to show the value of the method.&lt;/span&gt;&lt;/p&gt;

&lt;p style=&quot;text-align: justify;&quot;&gt;&lt;/p&gt;

&lt;p style=&quot;text-align: justify;&quot;&gt;&lt;/p&gt;

&lt;p dir=&quot;LTR&quot;&gt;&lt;/p&gt;

&lt;div&gt;
&lt;p dir=&quot;LTR&quot;&gt;&lt;/p&gt;
&lt;/div&gt;

&lt;p dir=&quot;RTL&quot;&gt;&lt;/p&gt;
</abstract>
	<keyword_fa>تقویت, CART, نقاط دورافتاده, رگرسیون.</keyword_fa>
	<keyword>Boosting, CART,  outlier, regression.</keyword>
	<start_page>1</start_page>
	<end_page>22</end_page>
	<web_url>http://jsri.srtc.ac.ir/browse.php?a_code=A-10-1-133&amp;slc_lang=en&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Nathalie</first_name>
	<middle_name></middle_name>
	<last_name> Chèze </last_name>
	<suffix></suffix>
	<first_name_fa>ناتالی</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>شِز</last_name_fa>
	<suffix_fa></suffix_fa>
	<email></email>
	<code>1003194753284600512</code>
	<orcid>1003194753284600512</orcid>
	<coreauthor>No</coreauthor>
	<affiliation></affiliation>
	<affiliation_fa></affiliation_fa>
	 </author>


	<author>
	<first_name>Jean-Michel </first_name>
	<middle_name></middle_name>
	<last_name>Poggi</last_name>
	<suffix></suffix>
	<first_name_fa>ژان میشل</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>پوژی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>Jean-Michel.Poggi@math.u-psud.fr</email>
	<code>1003194753284600513</code>
	<orcid>1003194753284600513</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation></affiliation>
	<affiliation_fa></affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
