میانگین پیراسته (Trimmed Mean): تعریف و مثال
میانگین پیراسته یا اصلاحشده چیست؟
میانگین اصلاحشده یک معیار آماری است که میانگین یک مجموعه داده را پس از حذف درصد مشخصی از مقادیر شدید از هر دو انتهای توزیع محاسبه میکند. با حذف دادههای پرت، این آماره میتواند نمایش دقیقتری از مقادیر معمول یا مرکزی یک مجموعه داده ارائه دهد. معمولاً درصدی از مقادیر، مانند 10٪ یا 20٪ را حذف میکنید.
به عنوان مثال، میانگین اصلاحشده 10٪، 10٪ بالاترین مقادیر و 10٪ پایینترین مقادیر را حذف میکند. به عبارت دیگر، از 80٪ میانی استفاده میکند.
هنگام خلاصه کردن یک مجموعه داده، میانگین اغلب آماره مورد استفاده است. محاسبه آن ساده است و به ما ایدهای سریع از مقدار “میانگین” دادههایمان میدهد. با این حال، دادههای پرت میتوانند میانگین را به طور قابل توجهی تحریف کنند و باعث شوند مقدار معمول به اشتباه نمایش داده شود.
میانگین اصلاحشده به ما کمک میکند تا دادههای پرت را مهار کنیم و یک معیار قوی از گرایش مرکزی به دست آوریم. با حذف مقادیر حدی، این آماره میتواند مقادیر معمول مجموعه دادهها را بهتر نشان دهد.
یک مثال معروف از میانگین پیراسته یا اصلاحشده در اسکیت نمایشی المپیک رخ میدهد، جایی که مسئولین بالاترین و پایینترین امتیاز را حذف میکنند. این روش به محدود کردن اثرات داوری که دارای سوگیری است کمک میکند. آمارشناسان همچنین به حذف فقط حداقل و حداکثر مقادیر به عنوان میانگین اصلاحشده اشاره میکنند.
حذف ۲۵ درصد کمترین و ۲۵ درصد بیشترین مجموعه دادهها، میانگین بین چارکی – میانگین نیمه میانی مجموعه دادهها – را تولید میکند.
میانه یک شکل افراطی از میانگین اصلاحشده است زیرا بسته به اینکه مجموعه دادهها حاوی تعداد زوج یا فرد از مقادیر باشد، همه مقادیر به جز یک یا دو را حذف میکند.
در این پست، نحوه محاسبه میانگین پیرایش شده را می آموزید، مثالی را بررسی خواهیم کرد، و خواهید دید که چگونه تحلیلهای آماری را بهبود میبخشد.
راهنمای گام به گام محاسبه میانگین پیرایش شده
برای یافتن میانگین پیرایش شده، این مراحل را دنبال کنید:
مجموعه دادهها را مرتب کنید: دادهها را به ترتیب صعودی مرتب کنید تا پیرایش آسانتر شود.
درصد مقادیری که باید پیرایش شوند را تعیین کنید: درصد مقادیر حدی را که میخواهید از هر انتهای مجموعه دادهها حذف کنید، انتخاب کنید.
تعداد مشاهداتی را که باید پیرایش شوند محاسبه کنید: درصد را در تعداد کل مشاهدات ضرب کنید. نتیجه را به نزدیکترین عدد صحیح گرد کنید تا مشخص شود چند مشاهده باید از هر انتها کنار گذاشته شود.
مجموعه دادهها را پیرایش کنید: تعداد مشخص شده مشاهدات را از دو انتهای مجموعه دادههای مرتب شده حذف کنید.
میانگین پیرایش شده را محاسبه کنید: مقادیر را جمع کرده و بر تعداد مشاهدات باقی مانده تقسیم کنید.
اکسل یک فرمول داخلی برای میانگین پیرایش شده ارائه میدهد: TRIMMEAN. برای استفاده از این تابع، محدوده سلولهای حاوی دادههای خود و درصد مقادیری را که باید پیرایش شوند وارد کنید. با این حال، توجه داشته باشید که تعریف درصد پیرایش در اکسل با تعریف آماری استاندارد متفاوت است. درصد در تعریف استاندارد مربوط به مقدار دادههای حذف شده از هر طرف توزیع است. در مقابل، درصد در اکسل به کل مقدار حذف شده از هر دو طرف اشاره دارد.
به عنوان مثال، فرض کنید دادههای شما در سلولهای A1:A10 قرار دارند و میخواهید میانگین اصلاح شده 20٪ را محاسبه کنید. در اکسل، باید درصد را دو برابر کنید و به 40٪ برسانید تا بتواند 20٪ از هر طرف توزیع را حذف کند. فرمول به شرح زیر است:
=TRIMMEAN(A1:A10, 0.4)
مثال محاسبه میانگین پیرایش شده
فرض کنید مجموعه داده زیر شامل 10 مقدار را داریم:
2، 3، 4، 5، 7، 8، 9، 10، 12، 15
بیایید میانگین ۲۰٪ اصلاحشده را پیدا کنیم. از آنجا که ده مقدار وجود دارد، باید دو مقدار کوچکتر (۲ و ۳) و دو مقدار بزرگتر (۱۲ و ۱۵) را حذف کنیم و شش مقدار زیر را داشته باشیم:
۴، ۵، ۷، ۸، ۹، ۱۰
سپس میانگین این شش مقدار را برای یافتن میانگین اصلاحشده میگیریم که ۷.۱۶۶۷ است.
کاربردهای عملی میانگین اصلاحشده
حالا که اهمیت آن را درک کردیم، بیایید برخی از سناریوهای دنیای واقعی را بررسی کنیم که در آنها میانگین اصلاحشده شایستگی خود را ثابت میکند.
تحلیل مالی: هنگام بررسی بازده سهام، مقادیر شدید (مانند بازدههای غیرمعمول بالا یا پایین) میتوانند میانگین را منحرف کنند و به طور بالقوه منجر به تفسیر نادرست شوند. با اعمال میانگین اصلاحشده، تخمین قابل اعتمادتری از گرایش مرکزی بازدهها به دست میآوریم.
ارزیابی آموزش: در آزمونی که نمرات چند دانشآموز به طور قابل توجهی بالاتر یا پایینتر از بقیه است، میانگین اصلاحشده با کاهش تأثیر دادههای پرت به ارزیابی عملکرد کلی کمک میکند.
تحلیل قیمتگذاری خردهفروشی: در دنیای خردهفروشی، استراتژیهای قیمتگذاری نقش مهمی در تعیین سودآوری و رضایت مشتری دارند. هنگام تجزیه و تحلیل دادههای قیمت، دادههای پرت میتوانند به دلیل تبلیغات گاه به گاه، خطاها یا ویژگیهای منحصر به فرد محصول ایجاد شوند. با اعمال میانگین اصلاحشده، خردهفروشان میتوانند نمایش دقیقتری از قیمت معمولی به دست آورند و آنها را قادر میسازد تا در مورد تعیین قیمتهای رقابتی و به حداکثر رساندن درآمد، تصمیمات آگاهانهای بگیرند.
مطالعات اقلیمی: درک الگوها و روندهای اقلیمی برای پیشبینی شرایط آب و هوایی آینده، ارزیابی تأثیرات زیستمحیطی و تدوین استراتژیهای کاهش اثرات ضروری است. با این حال، مجموعه دادههای اقلیمی اغلب به دلیل ناهنجاریهای آب و هوایی، رویدادهای نادر یا خطاهای اندازهگیری، حاوی مقادیر افراطی هستند. این دادههای پرت میتوانند معیارهای آماری مانند میانگین را تحریف کنند و مانع تحلیل دقیق روند شوند.
با بهرهگیری از قدرت میانگین اصلاحشده در این زمینههای متنوع، میتوانیم عمیقتر در دادههای خود کاوش کنیم و ضمن کاهش تأثیر دادههای پرت، بینشهای معناداری را آشکار کنیم.
اطلاعات لازم برای استفاده
هنگام استفاده از میانگین اصلاحشده در تحلیلهای آماری، کنار گذاشتن بین ۵ تا ۲۵ درصد از مقادیر افراطی مجموعه دادهها رایج است. اما درصدهای دیگر نیز امکانپذیر است. با حذف بیشتر مجموعه دادهها، میانگین اصلاحشده در برابر دادههای پرت مقاومتر میشود.
با این حال، استحکام یا robustness با نوعی بدهبستان همراه است زیرا شما از دادههای اصلی کمتری استفاده میکنید و اندازه نمونه مؤثر و اطلاعات مربوط به دادههای اصلی خود را کاهش میدهید. در حالی که دادههای پرت میتوانند مشکلساز باشند، گاهی اوقات نشاندهنده تغییرپذیری مشروع در موضوع شما هستند. حذف نامناسب نقاط داده میتواند درک شما از پدیدهای که در حال مطالعه آن هستید را تحریف کند.
به طور معمول، هدف استفاده از میانگین پیرایششده، به حداقل رساندن خطای استاندارد یک مجموعه داده حاوی دادههای پرت و انحرافات کوچک از نرمال بودن است. کاهش خطای استاندارد، دقت تخمین و قدرت آماری آزمونهای فرضیه را افزایش میدهد.
در این زمینه، میانگین پیرایششده به شما کمک میکند تا بین میانگین معمولی و میانه، تعادل برقرار کنید.
از یک طرف، میانگین معمولی عملکرد بهینه را با توزیعهای نرمال و بدون دادههای پرت ارائه میدهد. از طرف دیگر، میانه عملکرد بهتری را برای مجموعه دادههایی با دادههای پرت متعدد و توزیعهای بسیار چولگی ارائه میدهد.
میانگین پیرایششده، مصالحهای مؤثر برای سناریوهایی که بین این دو حالت قرار میگیرند، فراهم میکند که در آنها نه میانگین معمولی و نه میانه بهینه نیستند. ویلکاکس و کسلمن (۲۰۰۳) بر اساس شبیهسازیهای کامپیوتری، پیشنهاد میکنند که پیرایش ۲۰٪ انتخاب پیشفرض خوبی برای به حداقل رساندن خطای استاندارد در این موارد است.
از آزمون t یوئن برای ارزیابی میانگینهای اصلاحشده استفاده کنید. این آزمون میتواند دادههای پرت و واریانس غیرثابت را بررسی کند.
پاسخگوی سوالات و نظرات شما هستیم