رگرسیون چندک
رگرسیون چندک یکی از روشهای تحلیل رگرسیون است که در آن بر خلاف رگرسیون خطی که هدف تخمین میانگین متغیر وابسته است یک یا چند چندکِ متغیر وابسته محاسبه میشود است. رگرسیون چندک معمولاً با دادههای پرت بهتر از رگرسیون معمولی کار میکند و پیشفرضهای کمتری دارد منجمله اینکه توزیع شرطی متغیر وابسته ضرورتاً لازم نیست توزیعی طبیعی باشد. همچنین رگرسیون چندک در مسائلی به کار میرود که هدف بدست آوردن توزیع مشروط متغیر وابسته باشد نه فقط یک آماره از آن مانند میانگین؛ چه که با استفاده از چندکهای یک توزیع میتوان کل توزیع را تقریب زد.
رابطه ریاضی
اگر
میتوان نشانداد که:
که در اینجا
حال اگر چندکِ متغیر وابسته را با ترکیبی خطی از متغیرهای مستقل تخمین بزنیم آنگاه هدف مسئله رگرسیون خطی پیدا کردن ضرایبی خواهد بود که دادههای وابسته را به چندکشان نزدیک کند:
این مسئله بهینهسازی با کمک برنامهریزی خطی حل میشود. اگر
کاربرد
رگرسیون چندک در علوم بومشناسی کاربرد فراوانی دارد. معمولاً به علت پیچیدگی و تعداد زیاد عوامل تأثیرگذار در یک رویداد طبیعی، توزیعهای شرطی متغیرهای وابسته اغلب واریانس بالا و غیر همسانی دارند که باعث میشود رابطه بین متغیرهای مستقل و میانگین توزیع شرطی ضعیف شود؛ تقریب کل توزیع شرطی با استفاده از تخمین خطی چندکهای توزیع شرطی حاوی اطلاعات بیشتری برای پژوهشگران این رشتهاست و این تقریب از طریق رگرسیون چندک به دست میآید.
جستارهای وابسته
یادداشتها
- ↑ quantile regression
منابع
- ↑ Koenker, Roger (2005). Quantile Regression. Cambridge University Press. ISBN 978-0-521-60827-5.
- ↑ Koenker, Roger (2005). Quantile Regression. Cambridge University Press. ISBN 978-0-521-60827-5.
- ↑ Cade, Brian S.; Noon, Barry R. (2003). "A gentle introduction to quantile regression for ecologists" (PDF). Frontiers in Ecology and the Environment. 1 (8): 412–420. doi:10.2307/3868138. JSTOR 3868138. Archived from the original (PDF) on 7 January 2019. Retrieved 17 August 2019.