رگرسیون لجستیک
تاریخ : 2014/11/19 نویسنده : h.gh دیدگاه : 0

untitled

در مباحث مرتبط با مدل های رگرسیونی، زمانی که متغیر پاسخ دو حالتی باشد، استفاده از روش های معمول رگرسیون خطی با مشکلالاتی مواجه خواهد بود.

  • ممکن است مقادیر پیش بینی شده، بی معنی بوده، در عمل تفسیر پذیر نباشند.
  • امکان قیاس مقادیر پیش بینی با یکدیگر وجود ندارد.
  • پذیره های اولیه رگرسیون خطی (مانند همسانی واریانس مانده ها، نرمال نبودن مقادیر مانده ها و …) برقرار نیست.
    در چنین شرایطی، استفاده از رگرسیون لجستیک (دو حالتی یا چندحالتی) پیشنهاد می شود.

رگرسیون لجستیک،یک مدل آماری رگرسیون خطی است که متغیر وابسته ما می تواند دو سطحی یا چند سطحی باشد. این مدل را می توان به عنوان مدل خطی تعمیم یافته ای که از تابع لجیت به عنوان تابع پیوند استفاده می کند و خطایش از توزیع چند جمله ای پیروی می کند، به حساب آورد.

مزایای استفاده از رگرسیون لجستیک

استفاده از رگرسیون لجستیک به ویژه زمانی که با پایگاه داده های بسیار بزرگ مواجه  هستیم.
در وضعیت هایی که متغیرهای مستقل از یک قاعده منظم و کلی پیروی نکرده و مفروضات مدل های عمومی را نقض می کنند، بسیار مفید خواهد بود.

معایب استفاده از رگرسیون لجستیک

با تمام این انعطاف پذیری، استفاده از رگرسیون لجستیک با یک مشکل اساسی مواجه
است:

  • برای دست یابی به نتایج استوار و پایا و معنی دار به حجم داده هایی بیش از آنچه در رگرسیون خطی معمولی یا تحلیل تشخیصمواجه هستیم، نیاز است.
  • معمولاً در رگرسیون خطی معمولی یا تحلیل تشخیص، ۲۰ مشاهده به ازای هر متغیر مستقل کفایت می کند، اما در رگرسیون لجستیک حداقل ۵۰ مشاهده به ازای هر متغیر مستقل نیاز است.
  • متغیر پاسخ در یک مدل رگرسیون لجستیک به صورت رسته ای دو حالتی است. در حالی که در تکنیک های رگرسیون خطی، متغیر پاسخ یک پیوستار بی کران را شامل می شود (متغیر پیوسته در دامنه (∞+,∞-)).

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *