اشتباهات متداول آماری (۲)
تاریخ : 2014/11/17 نویسنده : h.gh دیدگاه : 0

1

۴٫ همبستگی های گمراه کننده

 

  •  همبستگی جعلی

در یک پژوهش، محققی همبستگی بین“B و “عیار چغندرهای کرت “A “عیار چغندر های کرت را محاسبه و اعلان کرده است !
از بذر ب استفاده کرده است. تنها وجه تشابه (ارتباط) دو کرت در B از بذر الف و برای کرت A برای کرت این است که هر یک دارای ۳۶ بوته است.
مثال دیگر محاسبه همبستگی بین“سن پزشکان مرد” و “سن پزشکان زن” در یک بیمارستان است ! چنین همبستگی هایی نه تنها قابل محاسبه نیستند، بلکه غیر منطقی بوده و قابل تعریف نیز نمی باشند.
برای تعریف (و محاسبه) همبستگی دو متغیر، لازم است آن دو متغیر روی واحدهای یک مجموعه (نمونه) تعریف شده باشند.
مثل همبستگی بین وزن و عیار چغندرهای یک کرت. (واحد = چغندر) یا مثل  همبستگی بین سن پزشکان یک بیمارستان با سن همسرانشان. (واحد = خانواد)

  •  استنباط علیت معکوس از همبستگی

آیا از این که”رتبه گروه های آمار دانشگاه ها با رتبه دانشگاه ها همبستگی قابل توجهی دارد“،می توان نتیجه گرفت که کیفیت یک دانشگاه به کیفیت گروه آمار آن بستگی دارد؟یا این که درست برعکس است و واقعیت این است که دانشگاه های خوب گروه های آمار با کیفیت
دارند؟
متاسفانه آمار هیچ راهی برای پاسخ دادن به این سوال ندارد.
مثلا زمانی که دو متغیر تقدم وتاخر زمانی داشته باشند تشخیص علت و معلول ساده است.

  • همبستگی صوری

بسیار پیش می آید که همبستگی نسبتاً بالالایی بین دو متغیر مشاهده می شود، در حالی که هیچ یک بر دیگری تاثیر ندارد، بلکه پای متغیر سومی در کار است. برای مثال همبستگی بالایی بین جویدن آدامس و ارتکاب خلاف های رانندگی مشاهده می شود، در صورتی که هیچ یک علت یا معلول دیگری نیست، بلکه بی قراری و عصبی مزاج بودن فرد علتی برای هردو محسوب می شود و با هر دو همبستگی واقعی دارد.

 

۵٫ بروز اشتباه در اثر ادغام داده ها (تعارض سیمپسون)
در اواسط جنگ جهانی دوم، کارمندی در وزارت دفاع آمریکا متوجه شد که سهم زنان در تک تک صنایع آمریکا، نسبت به قبل از جنگ، افزایش یافته است، در حالی که سهم زنان در کل صنایع آمریکا، نسبت به قبل از جنگ، کاهش یافته است !
مثال عددی زیر امکان بروز تعارض هایی از این دست را ثابت می کند:
دارای سرگرمی   بدون سرگرمی
الکترونیک           الکترونیک
قبول در خرداد             ۱۲۰                ۱۸۶
تجدید                        ۴۲                  ۷۱
جمع                        ۱۶۲                ۲۵۷
درصد قبولی               ۷۴%              ۷۲%
گرچه تفاوت درصد قبولی در دو گروه معنی دار نیست، ولی ارقام فوق با تصور قبلی ما در مورد اثر منفیِِ داشتن سرگرمی های الکترونیک در خانه بر موفقیت تحصیلی مغایرت دارد.

دکتر ناصررضا ارقامی-چهل و چهارمین کنفرانس ریاضی کشور

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *