آزمون نیکویی برازش (Goodness of fit test )
آزمون نیکویی برازش (Goodness of Fit Test) یک روش آماری است که برای بررسی اینکه آیا دادههای مشاهدهشده با یک توزیع نظری خاص (مانند توزیع نرمال، دو جملهای، پواسون و غیره) تطابق دارند یا خیر، استفاده میشود. این آزمون به ما کمک میکند تا تعیین کنیم که آیا تفاوت بین دادههای مشاهدهشده و دادههای مورد انتظار از یک توزیع خاص، معنادار است یا خیر.
هدف آزمون نیکویی برازش:
- بررسی تطابق دادههای مشاهدهشده با یک توزیع نظری.
- تعیین اینکه آیا مدل نظری انتخابشده برای توصیف دادهها مناسب است یا خیر.
انواع رایج آزمونهای نیکویی برازش:
- آزمون کایاسکوئر (Chi-Square Goodness of Fit Test):
- این آزمون برای دادههای طبقهبندیشده (کیفی) استفاده میشود.
- فرضیهها:
- فرض صفر (H₀): دادهها از توزیع نظری مشخصی پیروی میکنند.
- فرض مقابل (H₁): دادهها از توزیع نظری مشخصی پیروی نمیکنند.
- فرمول محاسبه آماره آزمون:𝜒2=∑(𝑂𝑖−𝐸𝑖)2𝐸𝑖χ2=∑Ei(Oi−Ei)2
- 𝑂𝑖Oi: فراوانی مشاهدهشده در هر دسته.
- 𝐸𝑖Ei: فراوانی مورد انتظار در هر دسته بر اساس توزیع نظری.
- آزمون کولموگوروف-اسمیرنوف (Kolmogorov-Smirnov Test):
- این آزمون برای دادههای پیوسته استفاده میشود.
- فرضیهها:
- فرض صفر (H₀): دادهها از توزیع نظری مشخصی پیروی میکنند.
- فرض مقابل (H₁): دادهها از توزیع نظری مشخصی پیروی نمیکنند.
- این آزمون بر اساس مقایسه تابع توزیع تجمعی (CDF) دادههای مشاهدهشده و توزیع نظری انجام میشود.
- آزمون اندرسون-دارلینگ (Anderson-Darling Test):
- این آزمون نیز برای دادههای پیوسته استفاده میشود و حساسیت بیشتری نسبت به آزمون کولموگوروف-اسمیرنوف دارد.
- بهویژه برای تشخیص انحرافات در انتهای توزیع مفید است.
- آزمون شاپیرو-ویلک (Shapiro-Wilk Test):
- این آزمون برای بررسی نرمال بودن دادهها استفاده میشود.
- برای نمونههای کوچک (معمولاً کمتر از 50 داده) مناسب است.
مراحل انجام آزمون نیکویی برازش:
- تعیین توزیع نظری:
- انتخاب توزیع نظری که میخواهید دادهها را با آن مقایسه کنید (مانند نرمال، پواسون، دو جملهای و غیره).
- محاسبه فراوانیهای مورد انتظار:
- بر اساس توزیع نظری، فراوانیهای مورد انتظار برای هر دسته یا بازه محاسبه میشود.
- محاسبه آماره آزمون:
- با استفاده از فرمول مربوط به آزمون (مانند کایاسکوئر یا کولموگوروف-اسمیرنوف)، آماره آزمون محاسبه میشود.
- مقایسه با مقدار بحرانی:
- آماره آزمون با مقدار بحرانی از جدول توزیع مربوطه (مانند جدول کایاسکوئر) مقایسه میشود.
- تصمیمگیری:
- اگر آماره آزمون از مقدار بحرانی بزرگتر باشد، فرض صفر رد میشود و نتیجه گرفته میشود که دادهها از توزیع نظری پیروی نمیکنند.
- در غیر این صورت، فرض صفر پذیرفته میشود.
مثال کاربردی:
فرض کنید میخواهید بررسی کنید که آیا توزیع قد دانشآموزان یک مدرسه از توزیع نرمال پیروی میکند یا خیر. مراحل زیر را انجام میدهید:
- دادههای قد دانشآموزان را جمعآوری میکنید.
- با استفاده از آزمون شاپیرو-ویلک یا کولموگوروف-اسمیرنوف، نرمال بودن دادهها را بررسی میکنید.
- اگر p-value کمتر از سطح معناداری (معمولاً ۰٫۰۵) باشد، نتیجه میگیرید که دادهها از توزیع نرمال پیروی نمیکنند.
نکات مهم:
- آزمونهای نیکویی برازش بهطور کلی برای بررسی فرضیهها درباره توزیع دادهها استفاده میشوند.
- انتخاب آزمون مناسب به نوع دادهها (پیوسته یا گسسته) و حجم نمونه بستگی دارد.
- تفسیر نتایج باید با دقت انجام شود، زیرا رد فرض صفر لزوماً به معنای عدم تطابق کامل نیست، بلکه نشاندهنده تفاوت معنادار است.
این آزمونها ابزارهای قدرتمندی در تحلیلهای آماری هستند و در زمینههای مختلفی مانند علوم اجتماعی، پزشکی، مهندسی و اقتصاد کاربرد دارند.
خواهشمند است، نظر خودتان را در پایان نوشته در سایت https://rava20.ir مرقوم نمایید. همین نظرات و پیشنهاد های شما باعث پیشرفت سایت می گردد. با تشکر
پیشنهاد می شود مطالب زیر را هم در سایت روا 20 مطالعه نمایید:
کاهش قند بدن ، رژیم 3 روزه تخلیه قند اضافه از بدن
فرمول تاباچنیک و فیدل برای نمونهگیری