مدل خطی تعمیمیافته
مدل خطی تعمیمیافته (به انگلیسی: Generalized Linear Model) تعمیم رگرسیون خطی است برای دادههایی که توزیع نرمال ندارند. به عنوان مثال، پیشبینی تعداد خرابی، که کمیتی گسستهاست، یا زمان انتظار، که کمیتی مثبتاست، را میتوان به کمک مدل خطی تعمیمیافته انجام داد. این مدل ها توسط John Nelder و Robert Wedderburn با هدف ساخت یک روش واحد برای مدل های آماری متفاوت مانند رگرسیون خطی، رگرسیون لجستیک، رگرسیون پواسون ارائه شد. این روش ها از MLE برای تخمین پارامتر هایشان استفاده میکنند. ایده کلی این روش این است که به جای فرض بر روی توابع مختلف در رگرسیون های ذکر شده ما با دانستن توزیع داده ها (صرفا شکل توزیع و نه متغیر های آن) که عموما یک فرض منطقی که از مسئله به دست میآید، تخمین خود برای مدل را به دست می آوریم.
این مدل از سه جزء تشکیلیافتهاست:
الف) توزیعی برای متغیر پاسخ
بیشپراکندگی برای مدلسازی واریانسهای بالا و پایین بهکار میرود.
ب) پیشبینی خطی براساس متغیر کنترل
ج) تابع پیوند
مثال
میخواهیم ثابت کنیم که با ۳ فرض بالا و با دانستن توزیع منطقی یک سری داده میتوان روابط رگرسیون لجستیک را بدون فرض خاصی بر روی تابع سیگموید بدست آورد. مسئله رگرسیون لجستیک یک طبقه بندی دو کلاسه (باینری) است. ما به دنبال
در نتیجه با فرض مدل خطی تعمیم یافته ، این که تابع پیش بینی رگرسیون لجستیک، همان تابع سیگموید است را ثابت کردیم. نکته قابل ذکر این است که ما فرضی بر روی تابع فرض خود یا
توابع پیوند
همانطور که در مثال بالا و در تعریف مدل های تعمیم یافته خطی گفته شد، برای به دست آوردن رابطه بین پارامتر
توزیع | دامنه توزیع | نام تابع پیوند | تابع پیوند, | تابع میانگین |
---|---|---|---|---|
نرمال | حقیقی: | همانی | ||
نمایی | حقیقی: | منفی معکوس | ||
گاما | ||||
گاوسی معکوس | حقیقی: | مجذور معکوس | ||
پوآسون | صحیح: | لگاریتم | ||
برنولی | صحیح: | لاجیت | ||
باینومیال | صحیح: | |||
چندجمله ای | K بردار از اعداد صحیح: |
محدب بودن مدل های خطی تعمیم یافته
مدل های خطی تعمیم یافته ویژگی هایی دارند که استفاده از آن ها را بسیار راحت می کند. امید ریاضی و واریانس Y از روابط زیر پیروی می کند که a پارامتر توزیع خانواده نمایی است.
با استفاده از این دو رابطه می توان ثابت کرد که این مدل ها محدب هستند. اثبات این قضیه به صورت زیر است.
جستارهای وابسته
منابع
- ↑ Dobson, Annette J.; Barnett, Adrian (2008). An Introduction to Generalized Linear Models (به انگلیسی). Chapman & Hall. p. ۴۳-۵۴.
- ↑ cs229.stanford.edu/lectures-spring2022/main_notes.pdf
- ↑ "Logistic regression". Wikipedia (به انگلیسی). 2023-01-13.
- ↑ "Generalized linear model". Wikipedia (به انگلیسی). 2022-10-26.
- ↑ Nelder, J. A.; Wedderburn, R. W. M. (1972). "Generalized Linear Models". Journal of the Royal Statistical Society. Series A (General). 135 (3): 370. doi:10.2307/2344614.