image
تاریخ : 2016/02/06 نویسنده : h.gh دیدگاه : 0

یکی از مشکلاتی که اکثر محققین در هنگام تحلیل داده ها دارند، نحوه برخورد با مقادیر گمشده است. مقدار گمشده زمانی ایجاد می شود که پاسخگو از دادن پاسخ به یک سوال خودداری کرده و یا سوالی در مورد آن پاسخگو مصداق ندارد( سوال شرطی یا صافی) این مشکل مربوط به زمان تحلیل این مقادیر گمشده است، به خصوص زمانیکه تعداد این مقادیر در حد قابل توجهی باشد، بطوریکه حتی نتایج را تحت الشعاع قرار داده و مخدوش سازد.

نرم افزار Spss برای برخورد با مقادیر گمشده در هنگام تحلیل داده ها، ۵ روش برآورد را پیش روی ما قرار داده که ما می توانیم مقادیر گمشده را با استفاده از یکی از این ۵ روش با مقدار جدید جایگزین کنیم. این ۵ روش برآورد عبارت می باشند از :

  • میانگین مقادیر سری : در این روش ، می توانیم مقادیر گمشده را با میانگین کل مقادیر متغیر مورد نظر جایگزین کنیم. این روش ، متداول ترین روش برای برآورد مقادیر گمشده است.
  • میانگین مقادیر مجاور هم : در این روش ، می توانیم مقادیر گمشده را با نیانگین مقادیر معتبر نزدیک به آن جایگزین کنیم. پهنه این مقادیر نزدیک نیز می تواند برابر با مقادیر معتبر بالا و پایین مقدار گمشده در هر خانه باشد.
  • میانه مقادیر مجاور هم : این روش نیز همانند روش قبلی است، با این تفاوت که در این روش ، به جای میانگین مقادیر نزدیک به هم، میانه آن ها جایگزین مقادیر گمشده می شود.
  • درون افزایی خطی : در این روش، از درون افزایی خطی استفاده می شود. برای این درون افزایی، از آخرین مقدار معتبر قبل از مقدار گمشده و اولین مقدار معتبر بعد از مقدار گمشده استفاده می شود.بنابراین یکی از اشکالات این روش آن است که چنان چه اولین یا آخرین پاسخگو دارای مقدار گمشده باشد، مقدار آن جایگزین نمی شود.
  • روند خطی بر روی نقاط : در این روش، بر روی مقادیر داده های متغیر یک رگرسیون خطی بر اساس یک مقدار شاخص و معیار از مقیاس ۱ تا n انجام می شود و سپس، مقادیر گمشده با مقادیر پیش بینی شده خود جایگزین می شوند.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *