
همبستگی در برابر علیت: درک تفاوت ها
همبستگی در مقابل علیت در آمار یک تمایز اساسی است. و بدون شک شنیدهاید که همبستگی به معنای علیت نیست. چرا اینطور است، تفاوتهای بین آنها چیست و چرا اهمیت دارند؟ اینها موضوعات این مطلب سایت هستند.
تعاریف همبستگی در مقابل علیت
ابتدا تعاریف همبستگی در مقابل علیت را مقایسه میکنیم.
همبستگی چیست؟
همبستگی به این معنی است که با تغییر یک متغیر، متغیر دیگر در جهت خاصی تمایل به تغییر دارد. به عبارت دیگر، دو متغیر با هم حرکت میکنند. همبستگیهای مثبت و منفی وجود دارند.
- همبستگی مثبت: X افزایش مییابد و Y تمایل به افزایش دارد.
- همبستگی منفی: X افزایش مییابد و Y تمایل به کاهش دارد.
به عنوان مثال، با افزایش قد افراد، وزن آنها تمایل به افزایش دارد و همبستگی مثبت زیر را ایجاد میکند. یا با افزایش غیبت از مدرسه، نمرات تمایل به کاهش دارند. این یک همبستگی منفی است.
علیت چیست؟
علیت نشان میدهد که تغییرات در یک متغیر باعث ایجاد تغییرات در متغیر دیگر میشود. به عنوان مثال، افزایش دوز یک دارو باعث کاهش شدت علائم میشود.
رابطه بین همبستگی در مقابل علیت
در نگاه اول، این تعاریف قطعاً سازگار به نظر میرسند، به همین دلیل است که اغلب اشتباه فهمیده میشوند. رابطه بین همبستگی در مقابل علیت چیست؟
همبستگی به معنای علیت نیست، اما علیت نشان میدهد که همبستگی وجود دارد. نمودار ون رابطه بین این دو را نشان میدهد.
درک اینکه چرا علیت به همبستگی اشاره دارد، شهودی است. اگر افزایش دوز دارو علائم را کاهش دهد، همبستگی منفی بین آن متغیرها پیدا خواهید کرد. علیت، همبستگی را ایجاد میکند.
متأسفانه، درک اینکه چگونه میتوانید همبستگی را مشاهده کنید اما در مورد علیت مطمئن نباشید، نسبتا مشکل است. بیایید به این موضوع بپردازیم.
چرا همبستگی به علیت اشاره نمیکند؟
فرض کنید همبستگی مثبتی بین X و Y پیدا میکنید. چگونه ممکن است علی نباشد؟ از این گذشته، وقتی X بالا میرود، Y نیز بالا میرود. به نظر میرسد علت و معلول است، اما ممکن است اینطور نباشد. آمارشناسان به ارتباط غیرعلّی بین متغیرها، همبستگی کاذب میگویند.
آنها به دلایل متعددی وجود دارند. وجود همه آنها دلیل این است که نمیتوانید مطمئن باشید که همبستگی نشاندهنده علیت است. فقط زیرمجموعهای از همبستگیها نشاندهنده یک رابطه علی هستند. از این رو اهمیت درک همبستگی در مقابل علیت آشکار میشود.
بیایید سه توضیح بالقوه برای همبستگیهای کاذب یا جعلی را بررسی کنیم.
مسئله متغیر سوم
یک متغیر سوم میتواند یک رابطه کاذب بین دو متغیر ایجاد کند. این به الگوی همبستگی بین دو متغیری که در نظر دارید و یک متغیر سوم بستگی دارد.
آیا میدانستید که بین فروش بستنی و حملات کوسه همبستگی مثبت وجود دارد؟
خب، فروش بستنی باعث افزایش حملات کوسه نمیشود. پس چه اتفاقی میافتد؟
معلوم شد که دمای بیرون با فروش بستنی و فرصتهای حمله کوسه همبستگی مثبت دارد (زیرا افراد بیشتری به ساحل میروند). بنابراین، وقتی دما افزایش مییابد، هم فروش و هم حملات به طور همزمان افزایش مییابند و یک همبستگی کاذب بین آنها ایجاد میشود. در این سناریو، ما دما را یک متغیر پنهان یا یک متغیر مخدوشکننده مینامیم.
جهت علیت
گاهی اوقات ممکن است دو متغیر رابطه علی داشته باشند، اما مشخص نیست کدام متغیر علت و کدام معلول است.
محققان بین تعداد ساعاتی که دانشآموزان در رسانههای اجتماعی میگذرانند و نمرات تحصیلی آنها همبستگی پیدا میکنند.
سناریوی ۱: ممکن است صرف زمان بیشتر در رسانههای اجتماعی حواس دانشآموزان را از مطالعاتشان پرت کند و منجر به نمرات پایینتر شود.
سناریوی ۲: برعکس، دانشآموزانی که در مطالعات خود مشکل دارند، ممکن است برای فرار از واقعیت به رسانههای اجتماعی روی آورند، به این معنی که نمرات پایینتر منجر به افزایش استفاده از رسانههای اجتماعی میشود.
در این شرایط، مشخص نیست که آیا استفاده از رسانههای اجتماعی باعث نمرات پایینتر میشود یا برعکس.
شانس محض
شانس تصادفی در دادههای نمونه میتواند یک رابطه ظاهری بین متغیرها ایجاد کند. اگر نمونههای تصادفی کافی جمعآوری کنید، تصادفی بودن گاهی اوقات باعث ایجاد همبستگی میشود که در واقع هیچ همبستگی وجود ندارد. ما در پستی در مورد لایروبی دادهها در مورد این پدیده خواهیم نوشت. ما نشان خواهیم داد که چگونه دادههای کاملاً تصادفی تولید شده که نباید هیچ همبستگی داشته باشند، میتوانند هنگام بررسی دادههای کافی، آنها را ایجاد کنند.
نمودار زیر چیزی را نشان میدهد که به نظر میرسد یک همبستگی منفی است، اما ما از نرمافزار کامپیوتری استفاده کرده ایم که به طور تصادفی متغیرهای زیادی را تولید میکند و سپس به طور سیستماتیک دادهها را بررسی کرده و همبستگیها را پیدا میکند.
به همین دلایل، ممکن است در دادههای خود همبستگی ببینید، در حالی که هیچ علت و معلولی وجود ندارد. یا حداقل ممکن است در مورد آن مطمئن نباشید.
چرا ایجاد همبستگی در مقابل علیت مهم است؟
همبستگی فقط نشان میدهد که دو متغیر با هم حرکت میکنند، اما به ما نمیگوید که آیا یکی باعث تغییر در دیگری میشود یا خیر. تکیه صرف بر همبستگی میتواند منجر به نتیجهگیریهای نادرست و اقدامات بیاثر یا حتی مضر شود. ایجاد علیت تضمین میکند که ما علت اصلی یک مسئله را هدف قرار میدهیم، نه فقط یک علامت مرتبط.
به عنوان مثال، مطالعهای که در مجله علوم زبان منتشر شد، بین افرادی که از کلمات تابو (کلمات رکیک) استفاده میکنند و سطوح بالاتر هوش کلامی همبستگی پیدا کرد. با این حال، ضروری است که با ظرافت به چنین یافتههایی نزدیک شویم. این همبستگی نشان نمیدهد که فحش دادن هوش را افزایش میدهد. در عوض، ممکن است نشان دهد افرادی که واژگان غنیتری دارند، شامل کلمات استاندارد و تابو، گنجینه زبانی گستردهتری برای بیان خود دارند. سوء تفاهم در مورد این همبستگی میتواند منجر به این باور اشتباه شود که افزایش استفاده از کلمات رکیک، هوش را افزایش میدهد، که این مطالعه چنین چیزی را نشان نمیدهد.
از طرف دیگر، فرض کنید که شما ناآگاهانه یک همبستگی کاذب بین ویتامینها و بهبود نتایج سلامتی پیدا میکنید. باور به اینکه ویتامینها باعث این بهبودها میشوند، در حالی که این صرفاً یک همبستگی است، منجر به تصمیمگیری ضعیف میشود. از این گذشته، اگر ویتامینها باعث بهبود سلامتی نشوند، مصرف بیشتر ویتامینها علیرغم این همبستگی، نتایج بهتری به همراه نخواهد داشت.
دانشمندان دریافتهاند افرادی که مرتباً ویتامین مصرف میکنند، عادات و شرایط سلامتی از پیش موجود زیادی دارند که با مصرفکنندگان غیرویتامین متفاوت است. این تفاوتها احتمالاً علل بهبود نتایج سلامتی هستند، نه خود ویتامینها. برای مشاهده لیست طولانی تفاوتها در مثال، پستهای من در مورد مطالعات مشاهدهای را بخوانید.
این مثالها بر اهمیت حیاتی تمایز بین همبستگی در مقابل علیت در تصمیمگیری تأکید میکنند.
چگونه روابط علی در مقابل همبستگی را شناسایی کنیم؟
ایجاد همبستگی در مقابل علیت اغلب اشتباه درک میشود. اگرچه همبستگی میتواند نکاتی در مورد روابط بالقوه بین متغیرها ارائه دهد، اما ثابت نمیکند که یک متغیر باعث تغییر متغیر دیگر میشود. این موضوع کاملاً متفاوت است. آنها ممکن است اصلاً از نظر علّی مرتبط نباشند. متأسفانه، همبستگیهای کاذب اغلب رخ میدهند و هیچ آزمون آماری برای تشخیص آنها وجود ندارد!
بنابراین، چگونه بین همبستگی و علیت تمایز قائل میشوید؟
برای اثبات واقعی علیت، محققان به آزمایشهای طراحیشده ویژه – آزمایشهای تصادفی کنترلشده (RCTs) – نیاز دارند. RCTها شرکتکنندگان را به طور تصادفی به یک گروه درمان یا گروه کنترل اختصاص میدهند. این انتساب تصادفی به اطمینان از یکسان بودن شروع همه گروهها به جز درمان کمک میکند. اگر نتایج در پایان متفاوت باشند، تحلیلگران میتوانند آنها را با اطمینان بالا به درمان نسبت دهند. درباره آزمایشهای تصادفی کنترلشده و انتساب تصادفی در آزمایشها بیشتر بدانید.
برعکس، مطالعات همبستگی برای یافتن سریع و ارزان روابط در مطالعات اولیه مناسب هستند، اما برای اثبات علیت مناسب نیستند.
سر آستین برادفورد هیل مجموعهای از نه معیار را برای کمک به تعیین اینکه آیا یک رابطه واقعاً علّی است یا صرفاً همبستگی، پیشنهاد کرد. این معیارها تمرینی در تفکر انتقادی هستند. آنها با برجسته کردن ویژگیهای حیاتی مورد بررسی و نحوه بهکارگیری دانش موضوعی خود، شما را به تفکر در مورد علیت ترغیب میکنند. هدف، برآورده کردن هرچه بیشتر معیارها است. اگرچه هیچ معیار واحدی کافی نیست، اما معمولاً برآورده کردن همه آنها غیرممکن است. برای درک عمیقتر، پست ما در مورد علیت در آمار: معیارهای هیل را بخوانید.
صرف نظر از روش مورد استفاده، بسیار مهم است که با احتیاط به سوال همبستگی در مقابل علیت نزدیک شوید و اطمینان حاصل کنید که نتیجهگیریهای خود را بر اساس شواهد محکم، روششناسی صحیح و تفکر انتقادی بنا میکنید.
پاسخگوی سوالات و نظرات شما هستیم