تحلیل داده های آماری

نرمال بودن داده های و روش های بررسی نرمالیتی

نرمال بودن داده های و روش های بررسی نرمالیتی

یکی از مسائل مهم در تحلیل آماری داده‌ها، انتخاب بین روش‌های پارامتری یا ناپارامتری به منظور انجام محاسبات و استنباط آماری است. هر چند روش‌های ناپارامتری ساده‌تر هستند ولی استفاده از آن‌ها در اکثر مواقع باعث می‌شود که نتایج تحلیل‌ها توان کمتری نسبت به روش‌های مشابه پارامتری داشته باشد. بنابراین اگر بتوانیم با آزمون نرمال بودن داده (Normality Test)، توزیع آن‌ها را گاوسی یا نرمال فرض کنیم، بهتر است که از روش‌های پارامتری استفاده کنیم.

در روشهای آمار پارامتری فرض بر این است که داده‌ها دارای توزیع شناخته شده و معینی هستند. در بیشتر موارد در آمار کلاسیک این توزیع برای داده‌ها، توزیع، گاوسی یا نرمال در نظر گرفته می‌شود. ولی اگر توزیع این داده‌ها گاوسی یا نرمال نباشد، پیش‌فرض‌های مربوط به آزمون‌ها و تحلیل‌های آمار پارامتری (Parametric Methods) و کلاسیک نقض شده و باید از روش‌های آماری غیرپارامتری یا ناپارامتری (Non Parametric Methods) استفاده کرد. البته ممکن است با کمی ساده‌گیری (بخصوص اگر عدم تقارن یا چولگی زیاد نباشد) فرض کنیم که داده‌ها دارای توزیع نرمال هستند تا از روش‌های پارامتری که بخصوص در آزمون‌های آماری از «توان آزمون» (Power Test) بیشتری برخوردارند، استفاده کنیم. گاهی نیز می‌توان با استفاده از رابطه یا تبدیلاتی، داده‌های غیرنرمال را به نرمال تغییر شکل داد و براساس آن‌ها استنباط و روش‌های پارامتری را به کار گرفت.

فرض نرمال بودن

بخش عمده‌ای از تحلیل‌های آماری مربوط به متغیرهای تصادفی و جوامع با توزیع نرمال است. اما اگر داده‌ها دارای توزیع نرمال نبوده ولی شما از روش‌های پارامتری برمبنای توزیع نرمال استفاده کنید، ممکن است این یافته‌های شما در طرح تحقیقاتی‌ و تجزیه و تحلیل آماری داده‌ها، گمراه کننده یا اشتباه باشد. در نتیجه انجام آزمون نرمال بودن یا تایید فرض نرمال بودن داده‌ها یک نکته کلیدی در تصمیم‌گیری برای انتخاب روش‌ برای استنباط آماری برمبنای نمونه‌های تصادفی است.

قبل از آنکه در مورد آزمون نرمال بودن داده (Normality Test) صحبت به میان آوریم، بهتر است خصوصیات داده‌هایی با توزیع نرمال را مرور کنیم.

در توزیع نرمال، منحنی مربوط به توزیع یا نحوه تقسیم احتمال برای نواحی مختلفی از داده‌ها به شکل یک زنگ بزرگ (زنگی شکل یا Bell Curve) است. قله این منحنی، میانگین، میانه و نما را مشخص می‌کند. از طرفی کاملا دیده می‌شود که این منحنی نسبت به نقطه مرکزی یعنی همان میانگین (یا میانه یا نما) متقارن است. همینطور پراکندگی حول میانگین نیز با انحراف معیار یا پارامتر دوم توزیع نرمال متناسب است.

از طرفی احتمال اینکه داده‌ای در بازه یک انحراف استاندارد از میانگین فاصله داشته باشد حدود 68 درصد است. همچنین احتمال اینکه در بازه ۲ انحراف استاندارد از میانگین داده‌ای مشاهده شود، تقریبا 95 درصد است. همین احتمال برای فاصله ۳ انحراف استاندارد تقریبا همه مقادیر را پوشش داده و حدود 99.7 درصد احتمال دارد که داده‌ای در این فاصله مشاهده شود. به این ترتیب مشخص است که احتمال اینکه داده‌ای بیشتر از سه انحراف استاندارد از میانگین فاصله داشته باشد بسیار ناچیز و تقریبا برابر با صفر خواهد بود.

برای آزمون نرمال بودن داده (Normality Test) از دو روش مختلف می‌توان استفاده کرد که در این نوشتار به آن‌ها اشاره خواهیم کرد.

    روش‌های تصویری (Graphical Methods): بوسیله ترسیم چندک‌ها یا مقدار احتمالات تجمعی برای هر نقطه از داده‌ها و مقایسه آن با توزیع نرمال، می‌توان به هم‌توزیعی جامعه آماری با توزیع نرمال پی‌برد.

    روش‌های آزمون فرض (Statistical Testing): در این گونه روش‌ها توسط آماره آزمون و فرضیه‌های آماری و به کمک نمونه تصادفی نسبت به رد یا تایید فرض صفر که همان نرمال بودن جامعه آماری است، رای می‌دهیم. واضح است که در این روش، ملاک اصلی ما مقدار احتمال (P-value) یا آماره آزمون و مقایسه آن با مقدار بحرانی آزمون است که توسط نمونه تصادفی حاصل شده.

روش هاي بررسی نرماليتي داده ها و متغیرها

11 روش برای بررسی نرمالیتی به دو گروه اصلی تقسیم می شوند که عبارتند از روشهای توصیفی و روشهای استنباطی (آزمون های آماری). این روشها به قرار زیر هستند:

روشهاي توصيفي

    نمودار هيستوگرام

    P-P پلات

    Q-Q پلات

    باکس پلات

    نمودار ساقه و برگ

آزمون هاي آماري براي بررسي نرماليتي

    آزمون شاپيرو ويلک در SPSS

    آزمون کلموگروف اسميرنوف در SPSS

    استفاده از آماره هاي چولگي و کشيدگي در SPSS

    آزمون آندرسون دارلينگ (Anderson-Darling test) در Minitab

    آزمون رايان جوينر (ryan joiner) در Minitab

    آزمون جارک برا (Jarque-Bera) در EViews

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *