
علیت در آمار: معیارهای هیل
علیت چیست؟
علیت نشان میدهد که یک رویداد بر یک نتیجه تأثیر میگذارد. آیا رژیمهای غذایی چرب باعث مشکلات قلبی میشوند؟ اگر برای یک آزمون مطالعه میکنید، آیا باعث میشود نمره بالاتری بگیرید؟
در آمار، علیت کمی پیچیده است. همانطور که بدون شک شنیدهاید، همبستگی لزوماً به معنای علیت نیست. ارتباط یا همبستگی بین متغیرها به سادگی نشان میدهد که مقادیر با هم متفاوت هستند. لزوماً نشان نمیدهد که تغییرات در یک متغیر باعث تغییر در متغیر دیگر میشود. اثبات علیت میتواند دشوار باشد.
اگر همبستگی علیت را اثبات نکند، از چه آزمون آماری برای ارزیابی علیت استفاده میکنید؟ این یک سوال چالشبرانگیز است زیرا هیچ تحلیل آماری نمیتواند این تعیین را انجام دهد. در این پست، در مورد اینکه چرا میخواهید علیت را تعیین کنید و چگونه این کار را انجام دهید، بیاموزید.
روابط و همبستگی در مقابل علیت
اصطلاح این است که «همبستگی به معنای علیت نیست». در نتیجه، ممکن است فکر کنید که این عبارت در مورد مواردی مانند ضریب همبستگی پیرسون صدق میکند. و در مورد آن آماره نیز صدق میکند. با این حال، ما واقعاً در مورد روابط بین متغیرها در یک زمینه وسیعتر صحبت میکنیم. ضریب همبستگی پیرسون برای دو متغیر پیوسته است. با این حال، یک رابطه میتواند شامل انواع مختلفی از متغیرها مانند متغیرهای دستهبندی، شمارشی، دادههای دودویی و غیره باشد.
برای مثال، در یک آزمایش پزشکی، ممکن است یک متغیر دستهبندی داشته باشید که مشخص میکند افراد به کدام گروه درمانی تعلق دارند – گروه کنترل، گروه دارونما و چندین گروه درمانی مختلف. اگر پیامد سلامت یک متغیر پیوسته باشد، میتوانید تفاوت بین میانگینهای گروه را ارزیابی کنید. اگر میانگینها بر اساس گروه متفاوت باشند، میتوانید بگویید که میانگین پیامدهای سلامت به گروه درمانی بستگی دارد. بین نوع درمان و پیامد سلامت، همبستگی یا رابطهای وجود دارد. یا شاید گروههای درمانی داشته باشیم و پیامد دوتایی باشد، مثلاً آلوده و غیرآلوده. در این صورت، نسبتهای گروهی افراد آلوده/غیرآلوده را بین گروهها مقایسه میکنیم تا مشخص شود که آیا درمان با میزان عفونت همبستگی دارد یا خیر.
چرا تعیین علیت مهم است؟
عکسی از دومینوهایی که در حال افتادن هستند برای نشان دادن علیت. تفاوت مهم بین همبستگی و علیت چیست؟ به عنوان مثال، اگر مشاهده کنید که با افزایش یک متغیر، متغیر دیگر نیز تمایل به افزایش دارد – آیا این به اندازه کافی خوب نیست؟ به هر حال، شما رابطه را کمّی کردهاید و چیزی در مورد نحوه رفتار آنها با هم آموختهاید.
اگر فقط رویدادها را پیشبینی میکنید، سعی در درک دلیل وقوع آنها ندارید و نمیخواهید نتایج را تغییر دهید، همبستگی میتواند کاملاً خوب باشد. به عنوان مثال، فروش بستنی با حملات کوسه همبستگی دارد. اگر فقط نیاز به پیشبینی تعداد حملات کوسه دارید، فروش بستنی میتواند معیار خوبی برای اندازهگیری باشد، حتی اگر باعث حملات کوسه نشود.
با این حال، اگر میخواهید تعداد حملات را کاهش دهید، باید چیزی پیدا کنید که واقعاً باعث تغییر در حملات شود. تا آنجا میدانیم، کوسهها بستنی دوست ندارند!
مواقع زیادی وجود دارد که میخواهید بر نتیجه تأثیر بگذارید. به عنوان مثال، ممکن است بخواهید موارد زیر را انجام دهید:
- بهبود سلامت با استفاده از دارو، ورزش یا واکسیناسیون آنفولانزا.
- کاهش خطر پیامدهای نامطلوب، مانند رویههایی برای کاهش نقصهای تولید.
- بهبود پیامدها، مانند مطالعه برای یک آزمون.
برای اینکه تغییرات عمدی در یک متغیر بر متغیر پیامد تأثیر بگذارد، باید یک رابطه علّی بین متغیرها وجود داشته باشد. از این گذشته، اگر مطالعه باعث افزایش نمرات آزمون نشود، هیچ فایدهای برای مطالعه وجود ندارد. اگر دارو باعث بهبود سلامتی شما یا جلوگیری از بیماری نشود، دلیلی برای مصرف آن وجود ندارد.
قبل از اینکه بتوانید اظهار کنید که برخی اقدامات نتایج شما را بهبود میبخشد، باید مطمئن شوید که یک رابطه علّی بین متغیرهای شما وجود دارد.
متغیرهای مخدوشکننده و نقش آنها در علیت
چگونه ممکن است متغیرها با هم همبستگی داشته باشند اما رابطه علّی نداشته باشند؟ یک دلیل رایج، یک متغیر مخدوشکننده است که یک همبستگی کاذب ایجاد میکند. یک متغیر مخدوشکننده با هر دو متغیر مورد علاقه شما همبستگی دارد. ممکن است متغیر مخدوشکننده عامل علّی واقعی باشد! بیایید مثال بستنی و حمله کوسه را بررسی کنیم.
در این مثال، تعداد افراد حاضر در ساحل یک متغیر مخدوشکننده است. یک متغیر مخدوشکننده با هر دو متغیر مورد نظر – بستنی و حمله کوسه در مثال ما – همبستگی دارد.
در نمودار زیر، تصور کنید که با افزایش تعداد افراد، فروش بستنی نیز افزایش مییابد. به نوبه خود، افراد بیشتر در ساحل باعث افزایش حملات کوسه میشوند. ساختار همبستگی، یک همبستگی ظاهری یا جعلی بین فروش بستنی و حملات کوسه ایجاد میکند، اما این یک رابطه علی نیست.
عوامل مخدوشکننده دلایل رایجی برای ارتباط بین متغیرهایی هستند که از نظر علّی به هم مرتبط نیستند.
آزمونهای علیت و فرضیه
قبل از اینکه به تعیین علیت بودن یک رابطه بپردازیم، بیایید لحظهای در مورد اینکه چرا نتایج آزمون فرضیه با اهمیت آماری، علیت را نشان نمیدهند، فکر کنیم.
آزمونهای فرضیه، رویههای استنباطی هستند. آنها به شما امکان میدهند از نمونههای نسبتاً کوچک برای نتیجهگیری در مورد کل جمعیتها استفاده کنید. برای موضوع علیت، باید بفهمیم که اهمیت آماری به چه معناست.
وقتی رابطهای را در دادههای نمونه مشاهده میکنید، چه ضریب همبستگی، چه تفاوت بین میانگینهای گروه یا ضریب رگرسیون، آزمونهای فرضیه به شما کمک میکنند تا تعیین کنید که آیا نمونه شما شواهد کافی برای نتیجهگیری در مورد وجود رابطه در جمعیت را ارائه میدهد یا خیر. میتوانید آن را در نمونه خود مشاهده کنید، اما باید بدانید که آیا در جمعیت وجود دارد یا خیر. ممکن است خطای نمونهگیری تصادفی (یعنی شانس) باعث ایجاد «رابطه» در نمونه شما شده باشد.
اهمیت آماری نشان میدهد که شما شواهد کافی برای نتیجهگیری دارید که رابطهای که در نمونه مشاهده میکنید، در جمعیت نیز وجود دارد.
نکته همین جاست. اصلاً به علیت نمیپردازد.
پست مرتبط: درک مقادیر P و اهمیت آماری
معیارهای علیت هیل
تعیین وجود یک رابطه علیت، نیازمند دانش موضوعی عمیقتر و اطلاعات زمینهای بسیار بیشتری نسبت به آنچه میتوانید در یک آزمون فرضیه بگنجانید، است. در سال ۱۹۶۵، آستین هیل، یک متخصص آمار پزشکی، این سوال را در مقالهای مطرح کرد که به استاندارد تبدیل شده است. در حالی که او آن را در زمینه تحقیقات اپیدمیولوژیک معرفی کرد، میتوانید این ایدهها را در زمینههای دیگر نیز به کار ببرید.
هیل نه معیار را برای کمک به ایجاد ارتباطات علی توصیف میکند. هدف، برآورده کردن هرچه بیشتر معیارها است. هیچ معیار واحدی کافی نیست. با این حال، اغلب برآورده کردن همه معیارها غیرممکن است. این معیارها تمرینی در تفکر انتقادی هستند. آنها به شما نشان میدهند که چگونه در مورد تعیین علیت فکر کنید و ویژگیهای ضروری را که باید در نظر گرفته شوند، برجسته کنید.
مطالعات میتوانند گامهایی برای افزایش قدرت استدلال خود برای یک رابطه علی بردارند، که آمارشناسان آن را اعتبار داخلی مینامند. برای کسب اطلاعات بیشتر در مورد این، پست من در مورد اعتبار داخلی و خارجی را بخوانید.
قدرت
یک رابطه قوی و از نظر آماری معنادار، احتمال بیشتری دارد که علی باشد. ایده این است که روابط علی احتمالاً اهمیت آماری ایجاد میکنند. اگر نتایج معناداری داشته باشید، حداقل دلیلی دارید که باور کنید رابطه موجود در نمونه شما در جمعیت نیز وجود دارد – که چیز خوبی است. از این گذشته، اگر رابطه فقط در نمونه شما ظاهر شود، هیچ چیز معناداری ندارید! همبستگی هنوز به معنای علیت نیست، اما یک رابطه از نظر آماری معنادار نقطه شروع خوبی است.
با این حال، معیارهای بسیار بیشتری برای برآورده کردن وجود دارد! یک نکته مهم نیز برای این معیار وجود دارد. متغیرهای مخدوش کننده میتوانند همبستگیای را که در واقع وجود دارد، پنهان کنند. آنها همچنین میتوانند در جایی که علیت وجود ندارد، ظاهر همبستگی ایجاد کنند، همانطور که در مثال بستنی و حمله کوسه نشان داده شده است. یک رابطه قوی صرفاً یک اشاره است.
ثبات یا انسجام (consistency) و علیت
وقتی یک ارتباط واقعی و علی وجود دارد، نتیجه باید قابل تکرار باشد. سایر آزمایشگران در مکانهای دیگر باید بتوانند نتایج مشابهی را تولید کنند. این یک نتیجه قطعی و تمام شده نیست. تکرار، اطمینان ایجاد میکند که رابطه علی است. ترجیحاً، تلاشهای تکراپذیری از روشها، محققان و مکانهای دیگر استفاده میکنند.
ویژگی
اگر بتوانید سایر توضیحات را رد کنید، تشخیص اینکه یک رابطه علی است آسانتر است.. به طور کلیتر، مطالعهی ادبیات موضوع، بررسی سایر فرضیههای محتمل و امید به اینکه بتوانیم آنها را رد کنیم یا به نحوی دیگر کنترل کنیم، ضروری است. شما باید مطمئن شوید که آنچه مطالعه میکنید باعث تغییر مشاهده شده میشود، نه چیز دیگری که از آن بیاطلاع هستید.
لازم است توجه داشته باشید که نیازی نیست ثابت کنید که متغیر مد نظر شما تنها عاملی است که بر نتیجه تأثیر میگذارد. به عنوان مثال، سیگار کشیدن باعث سرطان ریه میشود، اما تنها چیزی نیست که باعث آن میشود. با این حال، شما باید آزمایشهایی انجام دهید که سایر عوامل مرتبط را در نظر بگیرند و بتوانید به طور خاص نوعی علیت را به متغیر مورد علاقه خود نسبت دهید.
زمانمندی و علیت
علل باید قبل از معلولها باشند. اطمینان حاصل کنید که آنچه شما علت میدانید قبل از معلول رخ میدهد. گاهی اوقات تعیین مسیر علیت میتواند چالش برانگیز باشد. هیل از مثال زیر استفاده میکند. ممکن است یک رژیم غذایی خاص منجر به یک بیماری شکمی شود. با این حال، این امکان نیز وجود دارد که این بیماری منجر به عادات غذایی خاصی شود.
آزمون علیت گرنجر (Granger Causality Test)، علیت بالقوه را با تعیین اینکه آیا مقادیر قبلی در یک سری زمانی، مقادیر بعدی را در سری زمانی دیگر پیشبینی میکنند، ارزیابی میکند. تحلیلگران میگویند که سری زمانی A گرنجر باعث سری زمانی B میشود، زمانی که آزمونهای آماری معنیدار نشان میدهند که مقادیر سری A، مقادیر آینده سری B را پیشبینی میکنند.
با وجود اینکه این آزمون «آزمون علیت» نامیده میشود، در واقع فقط یک آزمون پیشبینی است. از این گذشته، افزایش فروش کارتهای کریسمس، گرنجر باعث کریسمس میشود!
زمانمندی تنها یکی از جنبههای علیت است!
گرادیان زیستی
هیل یک زیستشناس بود، از این رو تمرکزش بر سوالات زیستی بود. او پیشنهاد میکند که برای یک رابطهی واقعاً علّی، باید نوعی رابطهی دوز-پاسخ وجود داشته باشد. اگر مقدار کمی مواجهه باعث کمی تغییر شود، مواجههی بیشتر باید باعث تغییر بیشتری شود. هیل از سیگار کشیدن و سرطان ریه به عنوان مثال استفاده میکند – مقادیر بیشتر سیگار کشیدن با خطر بیشتر سرطان ریه مرتبط است. میتوانید همین نوع تفکر را در زمینههای دیگر نیز به کار ببرید. آیا مطالعهی بیشتر منجر به نمرات حتی بالاتر میشود؟
با این حال، توجه داشته باشید که این رابطه ممکن است خطی باقی نماند. با افزایش دوز از یک آستانه، پاسخ میتواند کاهش یابد.
معقول بودن
اگر بتوانید مکانیسم معقولی پیدا کنید که ماهیت علی رابطه را توضیح دهد، از مفهوم رابطه علی پشتیبانی میکند. به عنوان مثال، زیستشناسان میدانند که چگونه آنتیبیوتیکها میکروبها را در سطح بیولوژیکی مهار میکنند. با این حال، هیل خاطرنشان میکند که باید مراقب باشید زیرا در هر لحظه محدودیتهایی برای دانش علمی وجود دارد. حتی اگر مکانیسم علی وجود داشته باشد، ممکن است در زمان مطالعه شناخته شده نباشد. در نتیجه، هیل میگوید، “ما نباید انتظار داشته باشیم” که یک مطالعه این الزام را برآورده کند.
انسجام (coherence) و علیت
احتمال اینکه یک رابطه علی باشد زمانی بیشتر است که با روابط علی مرتبط که عموماً به عنوان واقعیت شناخته شده و پذیرفته شدهاند، سازگار باشد. اگر نتایج شما کاملاً با واقعیتهای پذیرفته شده مغایرت داشته باشد، احتمال همبستگی بیشتر است. علیت را در چارچوب وسیعتر نظریه و دانش مرتبط ارزیابی کنید.
آزمایشها و علیت
آزمایشهای تصادفی بهترین راه برای شناسایی روابط علی هستند. آزمایشگران درمان (یا عوامل دخیل) را کنترل میکنند، آزمودنیها را به طور تصادفی اختصاص میدهند و به مدیریت سایر منابع تغییر کمک میکنند. هیل برآورده کردن این معیار را قویترین پشتوانه برای علیت مینامد. با این حال، همانطور که در مطلبی در مورد مطالعات مشاهدهای نوشتیم، آزمایشهای تصادفی همیشه امکانپذیر نیستند.
قیاس
اگر یک رابطه علی و معلولی پذیرفتهشده مشابه رابطهای در تحقیق شما وجود داشته باشد، از علیت برای مطالعه فعلی پشتیبانی میکند. هیل مینویسد: «با علم به اثرات تالیدومید و سرخجه، مطمئناً آمادهایم تا شواهد جزئیتر اما مشابه را با داروی دیگر یا بیماری ویروسی دیگری در دوران بارداری بپذیریم.»
تعیین اینکه آیا یک همبستگی نیز نشاندهنده علیت است، نیاز به بررسی زیادی دارد. طراحی صحیح آزمایشها و استفاده از رویههای آماری میتواند به شما در این تصمیم کمک کند. اما عوامل بسیار دیگری نیز باید در نظر گرفته شوند.
از تفکر انتقادی و تخصص خود در حوزه موضوعی برای فکر کردن به تصویر کلی استفاده کنید. اگر یک رابطه علی وجود داشته باشد، انتظار دارید نتایج ثابتی را ببینید که تکرار شدهاند، علل دیگر رد شدهاند، نتایج با نظریههای تثبیتشده و سایر یافتهها مطابقت دارند، یک مکانیسم قابل قبول وجود دارد و علت مقدم بر معلول است.
پاسخگوی سوالات و نظرات شما هستیم