<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Iranian South Medical Journal</title>
<title_fa>مجله طب جنوب</title_fa>
<short_title>Iran South Med J</short_title>
<subject>Medical Sciences</subject>
<web_url>http://ismj.bpums.ac.ir</web_url>
<journal_hbi_system_id>57</journal_hbi_system_id>
<journal_hbi_system_user>journal57</journal_hbi_system_user>
<journal_id_issn>1735-4374</journal_id_issn>
<journal_id_issn_online>1735-6954</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi>10.61882/ismj</journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid></journal_id_sid>
<journal_id_nlai></journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1400</year>
	<month>8</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2021</year>
	<month>11</month>
	<day>1</day>
</pubdate>
<volume>24</volume>
<number>5</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>مقایسه روش‌های مدل‌بندی پاسخ ترتیبی از قبیل درخت تصمیم، انباشت تصادفی ترتیبی و رگرسیون نسبت پیوسته جریمه شده در داده‌های با ابعاد بالا</title_fa>
	<title>Comparison of Ordinal Response Modeling Methods like Decision Trees, Ordinal Forest and L1 Penalized Continuation Ratio Regression in High Dimensional Data</title>
	<subject_fa>عمومى</subject_fa>
	<subject>General</subject>
	<content_type_fa>پژوهشي</content_type_fa>
	<content_type>Original</content_type>
	<abstract_fa>&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;strong&gt;&lt;u&gt;&lt;span style=&quot;font-family:B Lotus;&quot;&gt;&lt;span style=&quot;font-size:11.0pt;&quot;&gt;زمینه:&lt;/span&gt;&lt;/span&gt;&lt;/u&gt;&lt;/strong&gt; &lt;strong&gt;&lt;span style=&quot;font-family:B Lotus;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;در بسیاری از تحقیقات در حوزه&#8204;های پزشکی و بهداشتی متغیر پاسخ ماهیت ترتیبی دارد. روش&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;&amp;shy;&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:B Lotus;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;های مرسوم مبتنی بر فرض استقلال میان متغیرهای پیشگو و همچنین زیاد بودن تعداد نمونه&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;&amp;shy;&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:B Lotus;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;ها&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:B Lotus;&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt; (&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt;n&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:B Lotus;&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt;)&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:B Lotus;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt; در مقایسه با تعداد کووریت&amp;shy;ها &lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:B Lotus;&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt;(&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt;p&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:B Lotus;&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt;)&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:B Lotus;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt; هستند. لذا برای داده&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;&amp;shy;&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:B Lotus;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;های ژنتیکی با ابعاد بالا که در آن&#8204;ها &lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt;p&gt;n&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:B Lotus;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt; می&amp;shy;باشد، استفاده از مدل&amp;shy;های مرسوم امکان&#8204;پذیر نیست. در پژوهش حاضر از روش&amp;shy;های رگرسیون نسبت پیوسته جریمه شده، درخت تصمیم و انباشت ترتیبی برای پیش&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-family:B Lotus;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;&amp;lrm;&lt;/span&gt;&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:B Lotus;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;بینی پاسخ&amp;shy;های ترتیبی استفاده خواهد شد. &lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;br&gt;
&lt;strong&gt;&lt;u&gt;&lt;span style=&quot;font-family:B Lotus;&quot;&gt;&lt;span style=&quot;font-size:11.0pt;&quot;&gt;مواد و روش&#8204;ها:&lt;/span&gt;&lt;/span&gt;&lt;/u&gt;&lt;/strong&gt; &lt;strong&gt;&lt;span style=&quot;font-family:B Lotus;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;در مطالعه حاضر از سه دیتاست استفاده شد. مجموعه داده &lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt;B-cell&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:B Lotus;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt; حاوی اطلاعات 12625 ژن در 128 بیمار که پاسخ در چهار سطح ترتیبی قرار داشت، داده &lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-size:9.0pt;&quot;&gt;HCC&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:B Lotus;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt; مرتبط با سرطان کبد شامل 1469 ژن در 56 بیمار که پاسخ در سه سطح ترتیبی قرار داشت و همچنین داده قلب شامل اطلاعات پنج متغیر در 294 بیمار تحت آنژیوگرافی که پاسخ در 5 سطح قرار داشت. عملکرد روش&amp;shy;های مدنظر با استفاده از مجموعه داده یکسان آموزش و آزمون براساس شاخص&#8204;هایی از قبیل دقت، گاما و کاپا مورد مقایسه قرار گرفت.&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;br&gt;
&lt;strong&gt;&lt;u&gt;&lt;span style=&quot;font-family:B Lotus;&quot;&gt;&lt;span style=&quot;font-size:11.0pt;&quot;&gt;یافته&#8204;ها:&lt;/span&gt;&lt;/span&gt;&lt;/u&gt;&lt;/strong&gt; &lt;strong&gt;&lt;span style=&quot;font-family:B Lotus;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;در دو مجموعه داده با ابعاد بالا مدل انباشت ترتیبی از توانایی پیش&#8204;بینی بالاتری برخوردار بود. در حالی که برای مجموعه داده با ابعاد پایین مدل رگرسیون نسبت پیوسته جریمه شده عملکرد پیش&#8204;بینی بهتری داشت.&lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;br&gt;
&lt;strong&gt;&lt;u&gt;&lt;span style=&quot;font-family:B Lotus;&quot;&gt;&lt;span style=&quot;font-size:11.0pt;&quot;&gt;نتیجه&#8204;گیری:&lt;/span&gt;&lt;/span&gt;&lt;/u&gt;&lt;/strong&gt;&lt;strong&gt;&lt;span style=&quot;font-family:B Lotus;&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt; انتخاب بهترین مدل پیش&#8204;بینی از بین مدل&#8204;های بکار رفته بستگی به مجموعه داده مورد استفاده دارد و برای هر مجموعه داده بایستی روش&#8204;های مختلف را مورد بررسی قرار داد تا به بهترین مدل دست یافت. &lt;/span&gt;&lt;/span&gt;&lt;/strong&gt;&lt;/div&gt;</abstract_fa>
	<abstract>&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;strong&gt;&lt;u&gt;Background&lt;/u&gt;&lt;/strong&gt;: Response variables in most medical and health-related research have an ordinal nature.&amp;nbsp;Conventional modeling methods assume predictor variables to be independent, and consider a large number of samples (n) compared to the number of covariates (p). Therefore, it is not possible to use conventional models for high dimensional genetic data in which p &gt; n. The present study compared the predictive&amp;nbsp;performance of decision trees, ordinal forest, and L1 penalized continuation ratio regression&lt;span dir=&quot;RTL&quot;&gt;.&lt;/span&gt;&lt;br&gt;
&lt;strong&gt;&lt;u&gt;Materials and Methods&lt;/u&gt;&lt;/strong&gt;&lt;strong&gt;:&lt;/strong&gt; In the present study, three data sets were used. The B-cell data contained 12,625 gene expression data related to 128 patients with four ordinal levels of response variables. The HCC data related to liver cancer included 1469 genes of 56 patients with three ordinal levels of response variables. The Heart data contained information of five variables in 294 patients undergoing angiography with five ordinal levels of response variables. The performance of the methods was compared based on the same training and test datasets using indicators such as accuracy, gamma, and kappa.&lt;br&gt;
&lt;strong&gt;&lt;u&gt;Results:&lt;/u&gt;&lt;/strong&gt; For two high-dimensional data sets, the ordinal forest model had a higher predictive ability while for the low-dimensional data set, the L1 penalized continuation ratio model had a better predictive performance&lt;span dir=&quot;RTL&quot;&gt;.&lt;/span&gt;&lt;br&gt;
&lt;strong&gt;&lt;u&gt;Conclusion&lt;/u&gt;&lt;/strong&gt;&lt;strong&gt;:&lt;/strong&gt; The selection of the best prediction model depends on the data set, and for each data, different methods should be considered to achieve the best model.&lt;/div&gt;</abstract>
	<keyword_fa>پاسخ ترتیبی, روش رگرسیون نسبت پیوسته جریمه شده, روش انباشت ترتیبی, داده‌های بیان ژن</keyword_fa>
	<keyword>Ordinal response, Ordinal Forest, L1 Penalized Continuation Ratio Regression, High dimensional data</keyword>
	<start_page>454</start_page>
	<end_page>468</end_page>
	<web_url>http://ismj.bpums.ac.ir/browse.php?a_code=A-10-1-156&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Zahra</first_name>
	<middle_name></middle_name>
	<last_name>Torkashvand </last_name>
	<suffix></suffix>
	<first_name_fa>زهرا</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>ترکاشوند</last_name_fa>
	<suffix_fa></suffix_fa>
	<email></email>
	<code>5700319475328460013300</code>
	<orcid>5700319475328460013300</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Department of Biostatistics, School of Public Health, Hamadan University of Medical Sciences, Hamadan, Iran</affiliation>
	<affiliation_fa>گروه آمار زیستی، دانشکده بهداشت، دانشگاه علوم پزشکی همدان، همدان، ایران</affiliation_fa>
	 </author>


	<author>
	<first_name>Hossein</first_name>
	<middle_name></middle_name>
	<last_name>Mahjub </last_name>
	<suffix></suffix>
	<first_name_fa>حسین</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>محجوب</last_name_fa>
	<suffix_fa></suffix_fa>
	<email></email>
	<code>5700319475328460013301</code>
	<orcid>5700319475328460013301</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Department of Biostatistics, School of Public Health, Hamadan University of Medical Sciences, Hamadan, Iran&lt;br&gt; Research Center for Health Sciences, Hamadan University of Medical Sciences, Hamadan, Iran</affiliation>
	<affiliation_fa>گروه آمار زیستی، دانشکده بهداشت، دانشگاه علوم پزشکی همدان، همدان، ایران&lt;br&gt;مرکز تحقیقات علوم بهداشتی، دانشکده بهداشت، دانشگاه علوم پزشکی همدان، همدان، ایران</affiliation_fa>
	 </author>


	<author>
	<first_name>Ali Reza</first_name>
	<middle_name></middle_name>
	<last_name>Soltanian </last_name>
	<suffix></suffix>
	<first_name_fa>علیرضا</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>سلطانیان</last_name_fa>
	<suffix_fa></suffix_fa>
	<email></email>
	<code>5700319475328460013302</code>
	<orcid>5700319475328460013302</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>Department of Biostatistics, School of Public Health, Hamadan University of Medical Sciences, Hamadan, Iran&lt;br&gt;Modeling of Noncommunicable Diseases Research Center, Hamadan University of Medical Sciences,  Hamadan, Iran</affiliation>
	<affiliation_fa>گروه آمار زیستی، دانشکده بهداشت، دانشگاه علوم پزشکی همدان، همدان، ایران&lt;br&gt;مرکز تحقیقات مدلسازی بیماری‌های غیرواگیر، دانشکده بهداشت، دانشگاه علوم پزشکی همدان، همدان، ایران</affiliation_fa>
	 </author>


	<author>
	<first_name>Maryam</first_name>
	<middle_name></middle_name>
	<last_name>Farhadian </last_name>
	<suffix></suffix>
	<first_name_fa>مریم</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>فرهادیان</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>maryam_farhadian80@yahoo.com</email>
	<code>5700319475328460013303</code>
	<orcid>5700319475328460013303</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Department of Biostatistics, School of Public Health, Hamadan University of Medical Sciences, Hamadan, Iran&lt;br&gt; Research Center for Health Sciences, Hamadan University of Medical Sciences, Hamadan, Iran</affiliation>
	<affiliation_fa>گروه آمار زیستی، دانشکده بهداشت، دانشگاه علوم پزشکی همدان، همدان، ایران&lt;br&gt;مرکز تحقیقات علوم بهداشتی، دانشکده بهداشت، دانشگاه علوم پزشکی همدان، همدان، ایران</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
