با ما تماس بگیرید

0912 484 6329

ایمیل ما

editacdmy@gmail.com

علیت در آمار

علیت در آمار: معیارهای هیل

24 Views

علیت چیست؟

علیت نشان می‌دهد که یک رویداد بر یک نتیجه تأثیر می‌گذارد. آیا رژیم‌های غذایی چرب باعث مشکلات قلبی می‌شوند؟ اگر برای یک آزمون مطالعه می‌کنید، آیا باعث می‌شود نمره بالاتری بگیرید؟

در آمار، علیت کمی پیچیده است. همانطور که بدون شک شنیده‌اید، همبستگی لزوماً به معنای علیت نیست. ارتباط یا همبستگی بین متغیرها به سادگی نشان می‌دهد که مقادیر با هم متفاوت هستند. لزوماً نشان نمی‌دهد که تغییرات در یک متغیر باعث تغییر در متغیر دیگر می‌شود. اثبات علیت می‌تواند دشوار باشد.

اگر همبستگی علیت را اثبات نکند، از چه آزمون آماری برای ارزیابی علیت استفاده می‌کنید؟ این یک سوال چالش‌برانگیز است زیرا هیچ تحلیل آماری نمی‌تواند این تعیین را انجام دهد. در این پست، در مورد اینکه چرا می‌خواهید علیت را تعیین کنید و چگونه این کار را انجام دهید، بیاموزید.

روابط و همبستگی در مقابل علیت

اصطلاح این است که «همبستگی به معنای علیت نیست». در نتیجه، ممکن است فکر کنید که این عبارت در مورد مواردی مانند ضریب همبستگی پیرسون صدق می‌کند. و در مورد آن آماره نیز صدق می‌کند. با این حال، ما واقعاً در مورد روابط بین متغیرها در یک زمینه وسیع‌تر صحبت می‌کنیم. ضریب همبستگی پیرسون برای دو متغیر پیوسته است. با این حال، یک رابطه می‌تواند شامل انواع مختلفی از متغیرها مانند متغیرهای دسته‌بندی، شمارشی، داده‌های دودویی و غیره باشد.

برای مثال، در یک آزمایش پزشکی، ممکن است یک متغیر دسته‌بندی داشته باشید که مشخص می‌کند افراد به کدام گروه درمانی تعلق دارند – گروه کنترل، گروه دارونما و چندین گروه درمانی مختلف. اگر پیامد سلامت یک متغیر پیوسته باشد، می‌توانید تفاوت بین میانگین‌های گروه را ارزیابی کنید. اگر میانگین‌ها بر اساس گروه متفاوت باشند، می‌توانید بگویید که میانگین پیامدهای سلامت به گروه درمانی بستگی دارد. بین نوع درمان و پیامد سلامت، همبستگی یا رابطه‌ای وجود دارد. یا شاید گروه‌های درمانی داشته باشیم و پیامد دوتایی باشد، مثلاً آلوده و غیرآلوده. در این صورت، نسبت‌های گروهی افراد آلوده/غیرآلوده را بین گروه‌ها مقایسه می‌کنیم تا مشخص شود که آیا درمان با میزان عفونت همبستگی دارد یا خیر.

چرا تعیین علیت مهم است؟

عکسی از دومینوهایی که در حال افتادن هستند برای نشان دادن علیت. تفاوت مهم بین همبستگی و علیت چیست؟ به عنوان مثال، اگر مشاهده کنید که با افزایش یک متغیر، متغیر دیگر نیز تمایل به افزایش دارد – آیا این به اندازه کافی خوب نیست؟ به هر حال، شما رابطه را کمّی کرده‌اید و چیزی در مورد نحوه رفتار آنها با هم آموخته‌اید.

اثر دومینویی

اگر فقط رویدادها را پیش‌بینی می‌کنید، سعی در درک دلیل وقوع آنها ندارید و نمی‌خواهید نتایج را تغییر دهید، همبستگی می‌تواند کاملاً خوب باشد. به عنوان مثال، فروش بستنی با حملات کوسه همبستگی دارد. اگر فقط نیاز به پیش‌بینی تعداد حملات کوسه دارید، فروش بستنی می‌تواند معیار خوبی برای اندازه‌گیری باشد، حتی اگر باعث حملات کوسه نشود.

با این حال، اگر می‌خواهید تعداد حملات را کاهش دهید، باید چیزی پیدا کنید که واقعاً باعث تغییر در حملات شود. تا آنجا  می‌دانیم، کوسه‌ها بستنی دوست ندارند!

مواقع زیادی وجود دارد که می‌خواهید بر نتیجه تأثیر بگذارید. به عنوان مثال، ممکن است بخواهید موارد زیر را انجام دهید:

  • بهبود سلامت با استفاده از دارو، ورزش یا واکسیناسیون آنفولانزا.
  • کاهش خطر پیامدهای نامطلوب، مانند رویه‌هایی برای کاهش نقص‌های تولید.
  • بهبود پیامدها، مانند مطالعه برای یک آزمون.

برای اینکه تغییرات عمدی در یک متغیر بر متغیر پیامد تأثیر بگذارد، باید یک رابطه علّی بین متغیرها وجود داشته باشد. از این گذشته، اگر مطالعه باعث افزایش نمرات آزمون نشود، هیچ فایده‌ای برای مطالعه وجود ندارد. اگر دارو باعث بهبود سلامتی شما یا جلوگیری از بیماری نشود، دلیلی برای مصرف آن وجود ندارد.

قبل از اینکه بتوانید اظهار کنید که برخی اقدامات نتایج شما را بهبود می‌بخشد، باید مطمئن شوید که یک رابطه علّی بین متغیرهای شما وجود دارد.

متغیرهای مخدوش‌کننده و نقش آنها در علیت

چگونه ممکن است متغیرها با هم همبستگی داشته باشند اما رابطه علّی نداشته باشند؟ یک دلیل رایج، یک متغیر مخدوش‌کننده است که یک همبستگی کاذب ایجاد می‌کند. یک متغیر مخدوش‌کننده با هر دو متغیر مورد علاقه شما همبستگی دارد. ممکن است متغیر مخدوش‌کننده عامل علّی واقعی باشد! بیایید مثال بستنی و حمله کوسه را بررسی کنیم.

در این مثال، تعداد افراد حاضر در ساحل یک متغیر مخدوش‌کننده است. یک متغیر مخدوش‌کننده با هر دو متغیر مورد نظر – بستنی و حمله کوسه در مثال ما – همبستگی دارد.

در نمودار زیر، تصور کنید که با افزایش تعداد افراد، فروش بستنی نیز افزایش می‌یابد. به نوبه خود، افراد بیشتر در ساحل باعث افزایش حملات کوسه می‌شوند. ساختار همبستگی، یک همبستگی ظاهری یا جعلی بین فروش بستنی و حملات کوسه ایجاد می‌کند، اما این یک رابطه علی نیست.

علیت 1

عوامل مخدوش‌کننده دلایل رایجی برای ارتباط بین متغیرهایی هستند که از نظر علّی به هم مرتبط نیستند.

آزمون‌های علیت و فرضیه

قبل از اینکه به تعیین علیت بودن یک رابطه بپردازیم، بیایید لحظه‌ای در مورد اینکه چرا نتایج آزمون فرضیه با اهمیت آماری، علیت را نشان نمی‌دهند، فکر کنیم.

آزمون‌های فرضیه، رویه‌های استنباطی هستند. آن‌ها به شما امکان می‌دهند از نمونه‌های نسبتاً کوچک برای نتیجه‌گیری در مورد کل جمعیت‌ها استفاده کنید. برای موضوع علیت، باید بفهمیم که اهمیت آماری به چه معناست.

وقتی رابطه‌ای را در داده‌های نمونه مشاهده می‌کنید، چه ضریب همبستگی، چه تفاوت بین میانگین‌های گروه یا ضریب رگرسیون، آزمون‌های فرضیه به شما کمک می‌کنند تا تعیین کنید که آیا نمونه شما شواهد کافی برای نتیجه‌گیری در مورد وجود رابطه در جمعیت را ارائه می‌دهد یا خیر. می‌توانید آن را در نمونه خود مشاهده کنید، اما باید بدانید که آیا در جمعیت وجود دارد یا خیر. ممکن است خطای نمونه‌گیری تصادفی (یعنی شانس) باعث ایجاد «رابطه» در نمونه شما شده باشد.

اهمیت آماری نشان می‌دهد که شما شواهد کافی برای نتیجه‌گیری دارید که رابطه‌ای که در نمونه مشاهده می‌کنید، در جمعیت نیز وجود دارد.

نکته همین جاست. اصلاً به علیت نمی‌پردازد.

پست مرتبط: درک مقادیر P و اهمیت آماری

معیارهای علیت هیل

تعیین وجود یک رابطه علیت، نیازمند دانش موضوعی عمیق‌تر و اطلاعات زمینه‌ای بسیار بیشتری نسبت به آنچه می‌توانید در یک آزمون فرضیه بگنجانید، است. در سال ۱۹۶۵، آستین هیل، یک متخصص آمار پزشکی، این سوال را در مقاله‌ای مطرح کرد که به استاندارد تبدیل شده است. در حالی که او آن را در زمینه تحقیقات اپیدمیولوژیک معرفی کرد، می‌توانید این ایده‌ها را در زمینه‌های دیگر نیز به کار ببرید.

هیل نه معیار را برای کمک به ایجاد ارتباطات علی توصیف می‌کند. هدف، برآورده کردن هرچه بیشتر معیارها است. هیچ معیار واحدی کافی نیست. با این حال، اغلب برآورده کردن همه معیارها غیرممکن است. این معیارها تمرینی در تفکر انتقادی هستند. آنها به شما نشان می‌دهند که چگونه در مورد تعیین علیت فکر کنید و ویژگی‌های ضروری را که باید در نظر گرفته شوند، برجسته کنید.

مطالعات می‌توانند گام‌هایی برای افزایش قدرت استدلال خود برای یک رابطه علی بردارند، که آمارشناسان آن را اعتبار داخلی می‌نامند. برای کسب اطلاعات بیشتر در مورد این، پست من در مورد اعتبار داخلی و خارجی را بخوانید.

قدرت

یک رابطه قوی و از نظر آماری معنادار، احتمال بیشتری دارد که علی باشد. ایده این است که روابط علی احتمالاً اهمیت آماری ایجاد می‌کنند. اگر نتایج معناداری داشته باشید، حداقل دلیلی دارید که باور کنید رابطه موجود در نمونه شما در جمعیت نیز وجود دارد – که چیز خوبی است. از این گذشته، اگر رابطه فقط در نمونه شما ظاهر شود، هیچ چیز معناداری ندارید! همبستگی هنوز به معنای علیت نیست، اما یک رابطه از نظر آماری معنادار نقطه شروع خوبی است.

با این حال، معیارهای بسیار بیشتری برای برآورده کردن وجود دارد! یک نکته مهم نیز برای این معیار وجود دارد. متغیرهای مخدوش کننده می‌توانند همبستگی‌ای را که در واقع وجود دارد، پنهان کنند. آنها همچنین می‌توانند در جایی که علیت وجود ندارد، ظاهر همبستگی ایجاد کنند، همانطور که در مثال بستنی و حمله کوسه نشان داده شده است. یک رابطه قوی صرفاً یک اشاره است.

ثبات یا انسجام (consistency) و علیت

وقتی یک ارتباط واقعی و علی وجود دارد، نتیجه باید قابل تکرار باشد. سایر آزمایشگران در مکان‌های دیگر باید بتوانند نتایج مشابهی را تولید کنند. این یک نتیجه قطعی و تمام شده نیست. تکرار، اطمینان ایجاد می‌کند که رابطه علی است. ترجیحاً، تلاش‌های تکراپذیری از روش‌ها، محققان و مکان‌های دیگر استفاده می‌کنند.

ویژگی

اگر بتوانید سایر توضیحات را رد کنید، تشخیص اینکه یک رابطه علی است آسان‌تر است.. به طور کلی‌تر، مطالعه‌ی ادبیات موضوع، بررسی سایر فرضیه‌های محتمل و امید به اینکه بتوانیم آنها را رد کنیم یا به نحوی دیگر کنترل کنیم، ضروری است. شما باید مطمئن شوید که آنچه مطالعه می‌کنید باعث تغییر مشاهده شده می‌شود، نه چیز دیگری که از آن بی‌اطلاع هستید.

لازم است توجه داشته باشید که نیازی نیست ثابت کنید که متغیر مد نظر شما تنها عاملی است که بر نتیجه تأثیر می‌گذارد. به عنوان مثال، سیگار کشیدن باعث سرطان ریه می‌شود، اما تنها چیزی نیست که باعث آن می‌شود. با این حال، شما باید آزمایش‌هایی انجام دهید که سایر عوامل مرتبط را در نظر بگیرند و بتوانید به طور خاص نوعی علیت را به متغیر مورد علاقه خود نسبت دهید.

زمان‌مندی و علیت

علل باید قبل از معلول‌ها باشند. اطمینان حاصل کنید که آنچه شما علت می‌دانید قبل از معلول رخ می‌دهد. گاهی اوقات تعیین مسیر علیت می‌تواند چالش برانگیز باشد. هیل از مثال زیر استفاده می‌کند. ممکن است یک رژیم غذایی خاص منجر به یک بیماری شکمی شود. با این حال، این امکان نیز وجود دارد که این بیماری منجر به عادات غذایی خاصی شود.

آزمون علیت گرنجر (Granger Causality Test)، علیت بالقوه را با تعیین اینکه آیا مقادیر قبلی در یک سری زمانی، مقادیر بعدی را در سری زمانی دیگر پیش‌بینی می‌کنند، ارزیابی می‌کند. تحلیلگران می‌گویند که سری زمانی A گرنجر باعث سری زمانی B می‌شود، زمانی که آزمون‌های آماری معنی‌دار نشان می‌دهند که مقادیر سری A، مقادیر آینده سری B را پیش‌بینی می‌کنند.

با وجود اینکه این آزمون «آزمون علیت» نامیده می‌شود، در واقع فقط یک آزمون پیش‌بینی است. از این گذشته، افزایش فروش کارت‌های کریسمس، گرنجر باعث کریسمس می‌شود!

زمان‌مندی تنها یکی از جنبه‌های علیت است!

گرادیان زیستی

هیل یک زیست‌شناس بود، از این رو تمرکزش بر سوالات زیستی بود. او پیشنهاد می‌کند که برای یک رابطه‌ی واقعاً علّی، باید نوعی رابطه‌ی دوز-پاسخ وجود داشته باشد. اگر مقدار کمی مواجهه باعث کمی تغییر شود، مواجهه‌ی بیشتر باید باعث تغییر بیشتری شود. هیل از سیگار کشیدن و سرطان ریه به عنوان مثال استفاده می‌کند – مقادیر بیشتر سیگار کشیدن با خطر بیشتر سرطان ریه مرتبط است. می‌توانید همین نوع تفکر را در زمینه‌های دیگر نیز به کار ببرید. آیا مطالعه‌ی بیشتر منجر به نمرات حتی بالاتر می‌شود؟

با این حال، توجه داشته باشید که این رابطه ممکن است خطی باقی نماند. با افزایش دوز از یک آستانه، پاسخ می‌تواند کاهش یابد.

معقول بودن

اگر بتوانید مکانیسم معقولی پیدا کنید که ماهیت علی رابطه را توضیح دهد، از مفهوم رابطه علی پشتیبانی می‌کند. به عنوان مثال، زیست‌شناسان می‌دانند که چگونه آنتی‌بیوتیک‌ها میکروب‌ها را در سطح بیولوژیکی مهار می‌کنند. با این حال، هیل خاطرنشان می‌کند که باید مراقب باشید زیرا در هر لحظه محدودیت‌هایی برای دانش علمی وجود دارد. حتی اگر مکانیسم علی وجود داشته باشد، ممکن است در زمان مطالعه شناخته شده نباشد. در نتیجه، هیل می‌گوید، “ما نباید انتظار داشته باشیم” که یک مطالعه این الزام را برآورده کند.

انسجام (coherence) و علیت

احتمال اینکه یک رابطه علی باشد زمانی بیشتر است که با روابط علی مرتبط که عموماً به عنوان واقعیت شناخته شده و پذیرفته شده‌اند، سازگار باشد. اگر نتایج شما کاملاً با واقعیت‌های پذیرفته شده مغایرت داشته باشد، احتمال همبستگی بیشتر است. علیت را در چارچوب وسیع‌تر نظریه و دانش مرتبط ارزیابی کنید.

آزمایش‌ها و علیت

آزمایش‌های تصادفی بهترین راه برای شناسایی روابط علی هستند. آزمایشگران درمان (یا عوامل دخیل) را کنترل می‌کنند، آزمودنی‌ها را به طور تصادفی اختصاص می‌دهند و به مدیریت سایر منابع تغییر کمک می‌کنند. هیل برآورده کردن این معیار را قوی‌ترین پشتوانه برای علیت می‌نامد. با این حال، همانطور که در مطلبی در مورد مطالعات مشاهده‌ای نوشتیم، آزمایش‌های تصادفی همیشه امکان‌پذیر نیستند.

قیاس

اگر یک رابطه علی و معلولی پذیرفته‌شده مشابه رابطه‌ای در تحقیق شما وجود داشته باشد، از علیت برای مطالعه فعلی پشتیبانی می‌کند. هیل می‌نویسد: «با علم به اثرات تالیدومید و سرخجه، مطمئناً آماده‌ایم تا شواهد جزئی‌تر اما مشابه را با داروی دیگر یا بیماری ویروسی دیگری در دوران بارداری بپذیریم.»

تعیین اینکه آیا یک همبستگی نیز نشان‌دهنده علیت است، نیاز به بررسی زیادی دارد. طراحی صحیح آزمایش‌ها و استفاده از رویه‌های آماری می‌تواند به شما در این تصمیم کمک کند. اما عوامل بسیار دیگری نیز باید در نظر گرفته شوند.

از تفکر انتقادی و تخصص خود در حوزه موضوعی برای فکر کردن به تصویر کلی استفاده کنید. اگر یک رابطه علی وجود داشته باشد، انتظار دارید نتایج ثابتی را ببینید که تکرار شده‌اند، علل دیگر رد شده‌اند، نتایج با نظریه‌های تثبیت‌شده و سایر یافته‌ها مطابقت دارند، یک مکانیسم قابل قبول وجود دارد و علت مقدم بر معلول است.

مطالب مرتبط مفید

آکادمی ویرایش ایران

آکادمی ویرایش ایران از سال 1395 فعالیت حرفه ای خود را در زمینه ویرایش تخصصی مقالات علمی (ویرایش نیتیو)، ترجمه فارسی به انگلیسی حرفه ای مقالات برای ارسال به ژورنال های ISI و آموزش مقاله نویسی تخصصی و جامع آغاز کرد.

بدون نظر

پاسخگوی سوالات و نظرات شما هستیم

•   •   •   •   •   •   •   •   •   •   •   •   •   •   •   •   •   •   •   •   •   •   •   •   •   •   •   •   •   •   •  

نظرات شما