روش های بررسی نرمال بودن توزیع داده ها و شرایط استفاده از هر روش چیست؟
3 روش اصلی برای بررسی نرمال بودن توزیع داده ها وجود دارد: روش های دیداری و آزمون های آماری [1][2][4].
روشهای بصری: این روشها شامل ایجاد یک هیستوگرام یا نمودار Q-Q از دادههای شما و مقایسه آن با توزیع عادی است. هیستوگرام به شما امکان می دهد ببینید که آیا داده ها از یک منحنی زنگی شکل پیروی می کنند یا خیر، در حالی که نمودارهای Q-Q چندک های داده های شما را با چندک های یک توزیع نرمال مقایسه می کنند [4].
روش های بصری نقطه شروع خوبی هستند، اما می توانند ذهنی باشند و ممکن است برای مجموعه داده های کوچک قابل اعتماد نباشند.
2- روش توصیفی : در این روش چولگی و کشیدگی بررسی می شود. اگر تعداد افراد نمونه ی آماری بالاست پیشنهاد می شود در مقاله و پایان نامه ی خود از این روش استفاده کنید.
3- روش استنباطی آماری: اینها آزمون های رسمیتری هستند که از محاسبات آماری برای تعیین اینکه آیا دادههای شما احتمالاً از توزیع نرمال آمدهاند یا خیر، استفاده میکنند.
چندین تست نرمال بودن مختلف وجود دارد که هر کدام نقاط قوت و ضعف خاص خود را دارند. برخی از آزمون های رایج عبارتند از آزمون شاپیرو-ویلک، آزمون کولموگروف-اسمیرنوف و آزمون اندرسون-دارلینگ [2][6].
انتخاب آزمون به اندازه مجموعه داده شما و سایر عوامل بستگی دارد [3][5].
منابع:
- https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6350423/ Descriptive Statistics and Normality Tests for Statistical Data by P Mishra (2019)
- Wikipedia: https://en.wikipedia.org/wiki/Normality_test Normality test
- Editage: https://www.editage.com/blog/normality-test-methods-of-assessing-normality/ Normality Test Explained: Methods Of Assessing Normality (September 27, 2022)
- https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3693611/ Normality Tests for Statistical Analysis: A Guide for Non-Statisticians by A Ghasemi (2012)
- ResearchGate: https://www.researchgate.net/publication/351128739_Testing_for_Normality_What_is_the_Best_Method Testing for Normality: What is the Best Method?
- Guides – Wiki: http://www.sthda.com/english/wiki/normality-test-in-r Normality Test
- in R
از کدام آزمون استفاده کنیم:
آزمون Shapiro-Wilk: این ارزیابی می کند که آیا یک مجموعه داده از توزیع نرمال پیروی می کند [1، 2، 3، 4، 5، 6]. این یک مقدار p را برای نشان دادن احتمال غیرعادی بودن داده ها ارائه می دهد. مقادیر p کوچکتر (معمولاً 0.05 ≤) نشان دهنده رد نرمال بودن است.
این آزمونها برای بررسی مفروضات سایر روشهای آماری استفاده میشوند، نه مستقیماً بر روی خود دادههای مقیاس لیکرت.
تست کولموگروف-اسمیرنوف (K-S): این یکی دیگر از تست های نرمال بودن است اما ممکن است قدرت کمتری نسبت به تست Shapiro-Wilk برای نمونه های کوچکتر داشته باشد [3].
کولموگروف-اسمیرنوف (K-S) برای داده های لیکرت و حجم نمونه بالای 30 نفر مناسب نیست و نتیجه گمراه کننده می دهد.بدین منظور پیشنهاد می شود از چولگی و کشیدگی استفاده کنید.
تست اندرسون-دارلینگ: این یک نوع تست K-S است که وزن بیشتری بر انحرافات در انتهای توزیع میگذارد [3].
انتخاب آزمون مناسب به عوامل مختلفی بستگی دارد، اما در این منابع شرایط خاصی برای هر آزمون ذکر نشده است. به طور کلی توصیه می شود که با یک آمارگیر مشورت کنید یا به منابع پیشرفته تر برای راهنمایی های عمیق مراجعه کنید.
- Built In – An Introduction to the Shapiro-Wilk Test for Normality ░: https://builtin.com/data-science/shapiro-wilk-test [1]
- Wikipedia – Shapiro–Wilk test ░: https://en.wikipedia.org/wiki/Shapiro%E2%80%93Wilk_test [2]
- UC Riverside – Assessing the Assumption of Normality ░: https://uc-r.github.io/assumptions_normality [3]
- SPSS Tutorials – SPSS Shapiro-Wilk Test ░: https://www.spss-tutorials.com/spss-shapiro-wilk-test-for-normality/ [4]
- ScienceDirect – Wilk Test ░: https://www.sciencedirect.com/topics/mathematics/wilk-test [5]
- Variation – Shapiro-Wilks Normality Test ░: https://variation.com/wp-content/distribution_analyzer_help/hs141.htm [6]