آیا قصد دارید تحقیقی را انجام دهید؟ و یا اینکه در حال مطالعه یک تحقیق می باشید؟
چگونه میتوانید از صحت روش تجزیه و تحلیل داده ها اطمینان حاصل فرمائید؟
شاخه های مختلف علوم برای تجزیه و تحلیل داده ها از روش های مختلفی مانند روش های ذیل استفاده می نمایند:
الف) روش تحلیل محتوا
ب) روش تحلیل آماری
ج) روش تحلیل ریاضی
د) روش اقتصاد سنجی
ه) روش ارزشیابی اقتصادی
و) …
تمرکز این نوشتار بر روش های تجزیه و تحلیل سیستمهای اقتصادی اجتماعی و بویژه روش های تحلیل آماری می باشد.
آمار علم طبقه بندی اطلاعات، علم تصميم گيری های علمی و منطقی، علم برنامه ريزي های دقيق و علم توصيف و بيان آن چيزي است که از مشاهدات می توان فهميد.
هدف ما آموزش درس آمار نیست زیرا اینگونه مطالب تخصصی را میتوان در مراجع مختلف یافت، هدف اصلی ما ارائه یک روش دستیابی سریع به بهترین روش آماری می باشد.
يكي از مشكلات عمومی در تحقبقات ميداني انتخاب روش تحلیل آماري مناسب و یا به عبارتی انتخاب آزمون آماری مناسب براي بررسي سوالات يا فرضيات تحقيق مي باشد.
در آزمون های آماری هدف تعیین این موضوع است که آیا داده های نمونه شواهد کافی برای رد یک حدس یا فرضیه را دارند یا خیر؟
انتخاب نادرست آزمون آماری موجب خدشه دار شدن نتایج تحقیق می شود.
دکتر غلامرضا جندقی استاد یار دانشگاه تهران در مقاله ای كاربرد انواع آزمون هاي آماري را با توجه به نوع داده ها و وبژگي هاي نمونه آماري و نوع تحليل نشان داده است که در این بخش به نکات کلیدی آن اشاره می شود:
قبل از انتخاب یک آزمون آماری بایستی به سوالات زیر پاسخ داد:
1- چه تعداد متغیر مورد بررسی قرار می گیرد؟
2- چند گروه مفایسه می شوند؟
3- آیا توزیع ویژگی مورد بررسی در جامعه نرمال است؟
4- آیا گروه های مورد بررسی مستقل هستند؟
5- سوال یا فرضیه تحقیق چیست؟
6- آیا داده ها پیوسته، رتبه ای و یا مقوله ای Categorical هستند؟
قبل از ادامه این مبحث لازم است مفهوم چند واژه آماری را یاد آور شوم که زیاد وقت گیر نیست.
1- جامعه آماری: به مجموعه كاملي از افراد يا اشياء يا اجزاء كه حداقل در يك صفت مورد علاقه مشترك باشند ،گفته می شود.
2- نمونه آماری: نمونه بخشي از يك جامعة آماری تحت بررسي است كه با روشي كه از پيش تعيين شده است انتخاب ميشود، به قسمي كه ميتوان از اين بخش، استنباطهايي دربارة كل جامعه بدست آورد.
3- پارامتر و آماره: پارامتر يك ويژگي جامعه است در حالي كه آماره يك ويژگي نمونه است. براي مثال ميانگين جامعه يك پارامتر است. حال اگر از جامعه نمونهگيري كنيم و ميانگين نمونه را بدست آوريم، اين ميانگين يك آماره است.
4- برآورد و آزمون فرض: برآوردیابی و آزمون فرض دو روشی هستند که برای استنباط درمورد پارامترهای مجهول دو جمعیت به کار می روند.
5- متغير: ويژگي يا خاصيت يک فرد، شئ و يا موقعيت است که شامل يک سری از مقادير با دسته بنديهای متناسب است. قد، وزن، گروه خونی و جنس نمونه هايي از متغير هستند. انواع متغير می تواند کمی و کیفی باشد.
6- داده های کمی مانند قد، وزن يا سن درجه بندی مي شوند و به همين دليل قابل اندازه گيری می باشند. داده های کمی نیز خود به دو دسته دیگر تقسیم می شوند:
الف: داده های فاصله ای (Interval data)
ب: داده های نسبتی (Ratio data)
7- داده های فاصله ای: به عنوان مثال داده هایی که متغیر IQ (ضریب هوشی) را در پنج نفر توصیف می کنند عبارتند از: 80، 110، 75، 97 و 117، چون این داده ها عدد هستند پس داده های ما کمی اند اما می دانیم که IQ نمی تواند صفر باشد و صفر در اینجا فقط مبنایی است تا سایر مقادیر IQ در فاصله ای منظم از صفر و یکدیگر قرار گیرند پس این داده ها فاصله ای اند.
8- داده های نسبتی: داده های نسبتی داده هایی هستند که با عدد نوشته می شوند اما صفر آنها واقعی است. اکثریت داده های کمی این گونه اند و حقیقتاً دارای صفر هستند. به عنوان مثال داده هایی که متغیر طول پاره خط بر حسب سانتی متر را توصیف می کنند عبارتند از: 20، 15، 35، 8 و 23، چون این داده ها عدد هستند پس داده های ما کمی اند و چون صفر در اینجا واقعاً وجود دارد این داده نسبتی تلقی می شوند.
9- داده های کيفی مانند جنس، گروه خونی يا مليت فقط دارای نوع هستند و قابل بيان با استفاده از واحد خاصی نيستند. داده های کیفی خود به دو دسته دیگر تقسیم می شوند:
الف: داده های اسمی (Nominal data)
ب: داده های رتبه ای (Ordinal data)
10- داده های رتبه ای Ordinal: مانند کیفیت درسی یک دانش آموز (ضعیف، متوسط و قوی) و یا رتبه بندی هتل ها ( یک ستاره، دو ستاره و …)
11- داده های اسمی (nominal ) که مربوط به متغير يا خواص کيفی مانند جنس يا گروه خونی است و بيانگر عضويت در يک گروها category خاص می باشد. (داده مقوله ای)
12- متغیر تصادفی گسسته و پیوسته: به عنوان مثال تعداد تصادفات جادهاي در روز يك متغير تصادفي گسسته است ولی انتخاب يك نقطه به تصادف روي دايرهاي به مركز مبدأ مختصات و شعاع 3 يك متغير تصادفي پيوسته است.
13- گروه: یک متغیر می تواند به لحاظ بررسی یک ویژگی خاص در یک گروه و یا دو و یا بیشتر مورد بررسی قرار گیرد. نکته 1: دو گروه می تواند وابسته و یا مستقل باشد. دو گروه وابسته است اگر ویژگی یک مجموعه افراد قبل و بعد از وقوع یک عامل سنجیده شود. مثلا میزان رضایت شغلی کارکنان قبل و بعد از پرداخت پاداش و همچنین اگر در مطالعات تجربی افراد از نظر برخی ویژگی ها در یک گروه با گروه دیگر همسان شود.
14- جامعه نرمال: جامعه ای است که از توزیع نرمال تبعیت می کند.
15- توزیع نرمال: یکی از مهمترین توزیع ها در نظریه احتمال است. و کاربردهای بسیاری در علوم دارد.
فرمول این توزیع بر حسب دو پارامتر امید ریاضی و واریانس بیان می شود. منحنی رفتار این تابع تا حد زیادی شبیه به زنگ های کلیسا می باشد. این منحنی دارای خواص بسیار جالبی است برای مثال نسبت به محور عمودی متقارن می باشد، نیمی از مساحت زیر منحنی بالای مقدار متوسط و نیمه دیگر در پایین مقدار متوسط قرار دارد و اینکه هرچه از طرفین به مرکز مختصات نزدیک می شویم احتمال وقوع بیشتر می شود.
سطح زیر منحنی نرمال برای مقادیر متفاوت مقدار میانگین و واریانس فراگیری این رفتار آنقدر زیاد است که دانشمندان اغلب برای مدل کردن متغیرهای تصادفی که با رفتار آنها آشنایی ندارند، از این تابع استفاده می کنند. به عنوان مثال در یک امتحان درسی نمرات دانش آموزان اغلب اطراف میانگین بیشتر می باشد و هر چه به سمت نمرات بالا یا پایین پیش برویم تعداد افرادی که این نمرات را گرفته اند کمتر می شود. این رفتار را بسهولت می توان با یک توزیع نرمال مدل کرد.
اگر یک توزیع نرمال باشد مطابق قضیه چی بی شف 26.68 % مشاهدات در فاصله میانگین، مثبت و منفی یک انحراف معیار قرار دارد. و 44.95 % مشاهدات در فاصله میانگین، مثبت و منفی دو انحراف معیار قرار دارد. و 73.99 % مشاهدات در فاصله میانگین، مثبت و منفی سه انحراف معیار قرار دارد.
نکته 1: واضح است که داده های رتبه ای دارای توزیع نرمال نمی باشند.
نکته 2: وقتی داده ها کمی هستند و تعداد نمونه نیز کم است تشخیص نرمال بودن داده ها توسط آزمون کولموگروف – اسمیرنف مشکل خواهد شد.
16- آزمون پارامتریک: آزمون هاي پارامتريک، آزمون هاي هستند که توان آماري بالا و قدرت پرداختن به داده هاي جمع آوري شده در طرح هاي پيچيده را دارند. در این آزمون ها داده ها توزيع نرمال دارند. (مانند آزمون تی).
17- آزمون هاي غيرپارامتري: آزمون هائی مي باشند که داده ها توزیع غیر نرمال داشته و در مقايسه با آزمون های پارامتري از توان تشخیصی کمتري برخوردارند. (مانند آزمون من – ویتنی و آزمون کروسکال و والیس)
نکته3: اگر جامعه نرمال باشد از آزمون های پارامتریک و چنانچه غیر نرمال باشد از آزمون های غیر پارامتری استفاده می نمائیم.
نکته 4: اگر نمونه بزرگ باشد، طبق قضیه حد مرکزی جتی اگر جامعه نرمال نباشد می توان از آزمون های پارامتریک استفاده نمود.
حال به کمک جدول زیر براحتی می توانید یکی از 24 آزمون مورد نظر خود را انتخاب کنید:
هدف | داده کمی و دارای توزیع نرمال | داده رتبه ای و یا داده کمی غیر نرمال | داده های کیفی اسمی Categorical |
توصیف یک گروه | آزمون میانگین و انحراف معیار | آزمون میانه | آزمون نسبت |
مقایسه یک گروه با یک مقدار فرضی | آزمون یک نمونه ای | آزمون ویلکاکسون | آزمون خی – دو یا آزمون دو جمله ای |
مقابسه دو گروه مستقل | آزمون برای نمونه های مستقل | آزمون من – ویتنی | آزمون دقیق فیشر ( آزمون خی دو برای نمونه های بزرگ) |
مقایسه دو گروه وابسته | آزمون زوجی | آزمون کروسکال | آزمون مک – نار |
مقایسه سه گروه یا بیشتر (مستقل) | آزمون آنالیز واریانس یک راهه | آزمون والیس | آزمون خی – دو |
مقایسه سه گروه یا بیشتر (وابسته) | آزمون آنالیز واریانس با اندازه های مکرر | آزمون فریدمن | آزمون کوکران |
اندازه همبستگی بین دو متغیر | آزمون ضریب همبستگی پیرسون | آزمون ضریب همبستگی اسپرمن | آزمون ضریب توافق |
پیش بینی یک متغیر بر اساس یک یا چند متغیر | آزمون رگرسیون ساده یا غیر خطی | آزمون رگرسیون نا پارامتریک | آزمون رگرسیون لجستیک |
در رویکردی دیگر بر مبنای تعداد متغیر، تعداد گروه و نرمال بودن جامعه نیز می توان به الگوریتم آزمون آماری مورد نظر دست یافت:
یک متغیر:
انتخاب آزمون آماری برای یک متغیر | یک متغیر در یک گروه | یک متغیر در دو گروه | یک متغیر در سه گروه یا بیشتر |
متغیر نرمال | آزمون میانگین و انحراف معیار | آزمون تی | آزمون آنالیز واریانس ANOVA |
متغیر غیر نرمال | آزمون نسبت (دو جمله ای) | آزمون خی -دو | آزمون ناپارامتریک |
دو متغیر
انتخاب آزمون آماری برای دو متغیر | هر دو متغیر پیوسته هستند | یک متغیر پیوسته و دیگری گسسته است | هر دو متغیر مقوله ای هستند |
آزمون همبستگی | آزمون آنالیز واریانس ANOVA | آزمون خی – دو |
سه متغیر و بیشتر:
انتخاب آزمون آماری برای سه متغیر و بیشتر | یک گروه | دو گروه و بیشتر |
آنالیز کواریانس | تحلیل ممیزی | |
آنالیز واریانس با اندازه های مکرر | آنالیز واریانس چند متغیره | |
تحلیل عاملیورگرسیون چند گانه |
قابل ذکر است قبل از ورود به الگوریتم انتخاب آزمون آماری بهتر است به سوالات زیر پاسخ دهیم:
1- آیا اختلافی بین میانگین (نسبت) یک ویژگی در دو یا چند گروه وجود دارد؟
2- آیا دو متغیر ارتباط دارند؟
3- چگونه می توان یک متغیر را با استفاده از متغیر های دیگر پیش بینی کرد؟
4- چه چیزی می توان با استفاده از نمونه در مورد جامعه گفت؟
پس از انتخاب آزمون آماری مناسب حال می توان با هر یک از آزمون ها به صورت تخصصی برخورد کرد:
آزمون كي دو (خي دو يا مربع كاي)
اين آزمون از نوع ناپارامتري است و براي ارزيابي همقوارگي متغيرهاي اسمي به كار ميرود. اين آزمون تنها راه حل موجود براي آزمون همقوارگي در مورد متغيرهاي مقياس اسمي با بيش از دو مقوله است، بنابراين كاربرد خيلي زيادتري نسبت به آزمونهاي ديگر دارد. اين آزمون نسبت به حجم نمونه حساس است.
آزمون z – آزمون خطاي استاندارد ميانگين
اين آزمون براي ارزيابي ميزان همقوارگي يا يكسان بودن و يكسان نبودن (Goodness of fit) ميانگين نمونه اي و ميانگين جامعه به كار مي رود. اين آزمون مواقعي به كار مي رود كه مي خواهيم بدانيم آيا ميانگين برآورد شده نمونه اي با ميانگين جامعه جور مي آيد يا نه. اگر این تفاوت کم باشد، اين تفاوت معلول تغيير پذيري نمونه اي شناخته مي شود، ولي اگر زياد باشد نتيجه گرفته مي شود كه برآورد نمونه اي با پارامتر جامعه يكسان (همقواره) نيست. اين آزمون پارامتري است يعني استفاده از آن مشروط به آن است كه دو پارامتر جامعه كه میانگین و انحراف معیار معلوم باشند. همچنين براي آزمون متغيرهاي پيوسته (مقياس فاصله اي) كاربرد دارد. تعداد نمونه بزرگتر و يا مساوي 30 باشد و نيز توزيع متغير در جامعه نرمال باشد.
آزمون استيودنت t
اين آزمون براي ارزيابي ميزان همقوارگي يا يكسان بودن و نبودن ميانگين نمونه اي با ميانگين جامعه در حالتي به كار مي رود كه انحراف معيار جامعه مجهول باشد. چون توزيع t در مورد نمونه هاي كوچك (کمتر از 30) با استفاده از درجات آزادي تعديل ميشود، ميتوان از اين آزمون براي نمونه هاي بسيار كوچك استفاده نمود. همچنين اين آزمون مواقعي كه خطاي استاندارد جامعه نامعلوم و خطاي استاندارد نمونه معلوم باشد، كاربرد دارد.
براي به كاربردن اين آزمون، متغير مورد مطالعه بايد در مقياس فاصله اي باشد، شكل توزيع آن نرمال و تعداد نمونه کمتر از 30 باشد.
آزمون t در حالتهاي زير كاربرد دارد:
– مقايسه يك عدد فرضي با ميانگين جامعه نمونه
– مقايسه ميانگين دو جامعه
– مقايسه يك نسبت فرضي با يك نسبتي كه از نمونه بدست آمده
– مقايسه دو نسبت از دو جامعه
آزمون F
اين آزمون تعميم يافته آزمون t است و براي ارزيابي يكسان بودن يا يكسان نبودن دو جامعه و يا چند جامعه به كار برده ميشود. در اين آزمون واريانس كل جامعه به عوامل اوليه آن تجزيه ميشود. به همين دليل به آن آزمون آناليز واريانس (ANOVA) نيز ميگويند.
وقتي بخواهيم بجاي دو جامعه، همقوارگي چند جامعه را تواما با هم مقايسه نماييم از اين آزمون استفاده ميشود، چون مقايسه ميانگين هاي چند جامعه با آزمون t بسيار مشكل است. مقايسه ميانگين ها و همقوارگي چند جامعه بوسيله اين آزمون (F يا ANOVA) راحت تر از آزمون t امكان پذير است.
آزمون كوكران
آزمون كوكران تعميم يافته آزمون مك نمار است. اين آزمون براي مقايسه بيش از دو گروه كه وابسته باشند و مقياس آنها اسمي يا رتبه اي باشند به كار ميرود و همچون آزمون مك نمار، جوابها بايد دوتايي باشند.
براي آزمون تغييرات يك نمونه در زمان ها و يا موقعيت هاي مختلف (مثل آراء راي دهندگان قبل از انتخابات در زمانهاي مختلف) به كار ميرود. مقياس ميتواند اسمي يا رتبه اي باشد. به جاي چند سوال ميتوان يك سوال را در موقعيت هاي مختلف ارزيابي نمود. همه افراد بايد به همه سوالات پاسخ گفته باشند. چون پاسخ ها دو جوابي است، در بعضي از انواع تحقيقات ممكن است اطلاعات بدست آمده از دست برود و بهتر است از رتبه بندي استفاده كرد كه در اين صورت «آزمون ويلكاكسون» بهتر جوابگو خواهد بود.
در صورت كوچك بودن نمونه ها آزمون كوكران مناسب نيست و بهتر است از «آزمون فريد من» استفاده شود.
آزمون فريدمن
اين آزمون براي مقايسه چند گروه از نظر ميانگين رتبه هاي آنهاست و معلوم ميكند كه آيا اين گروه ها ميتوانند از يك جامعه باشند يا نه؟
مقياس در اين آزمون بايد حداقل رتبه اي باشد. اين آزمون متناظر غير پارامتري آزمون F است و معمولا در مقياس هاي رتبه اي به جاي F به كار ميرود و جانشين آن ميشود (چون در F بايد همگني واريانس ها وجود داشته باشد كه در مقياسهاي رتبه اي كمتر رعايت ميشود).
آزمون فريدمن براي تجريه واريانس دو طرفه (براي داده هاي غير پارامتري) از طريق رتبه بندي به كار ميرود و نيز براي مقايسه ميانگين رتبه بندي گروه هاي مختلف. تعداد افراد در نمونه ها بايد يكسان باشند كه اين از معايب اين آزمون است. نمونه ها بايد همگي جور شده باشند.
آزمون كالماگورف- اسميرانف
اين آزمون از نوع ناپارامتري است و براي ارزيابي همقوارگي متغيرهاي رتبه اي در دو نمونه (مستقل و يا غير مستقل) و يا همقوارگي توزيع يك نمونه با توزيعي كه براي جامعه فرض شده است، به كار ميرود (اسميرانف يك نمونه اي). اين آزمون در مواردي به كار ميرود كه متغيرها رتبه اي باشند و توزيع متغير رتبه اي را در جامعه بتوان مشخص نمود. اين آزمون از طريق مقايسه توزيع فراواني هاي نسبي مشاهده شده در نمونه با توزيع فراواني هاي نسبي جامعه انجام ميگيرد. اين آزمون ناپارامتري است و بدون توزيع است اما بايد توزيع متغير در جامعه براي هر يك از رتبه هاي مقياس رتبه اي در جامعه بطور نسبي در نظر گرفته شود كه آنرا نسبت مورد انتظار مي نامند.
آزمون كالماگورف- اسميرانف دو نمونه اي Two- Sample Kalmogorov- Smiranov Test
اين آزمون در مواقعي به كار ميرود كه دو نمونه داشته باشيم (با شرايط مربوط به اين آزمون كه قبلا گفته شد) و بخواهيم همقوارگي بين آن دو نمونه را با هم مقايسه كنيم.
آزمون كروسكال- واليس
اين آزمون متناظر غير پارامتري آزمون F است و همچون آزمون F ، موقعي به كار برده ميشود كه تعداد گروه ها بيش از 2 باشد. مقياس اندازه گيري در كروسكال واليس حداقل بايد ترتيبي باشد.
اين آزمون براي مقايسه ميانگين هاي بيش از 2 نمونه رتبه اي (و يا فاصله اي) بكار ميرود. فرضيات در اين آزمون بدون جهت است يعني فقط تفاوت را نشان ميدهد و جهت بزرگتر يا كوچكتر بودن گروه ها را از نظر ميانگين هايشان نشان نمي دهد. كارايي اين آزمون 95 درصد آزمون F است.
آزمون مك نمار
اين آزمون از آزمونهاي ناپارامتري است كه براي ارزيابي همانندي دو نمونه وابسته بر حسب متغير دو جوابي استفاده ميشود. متغيرها ميتوانند داراي مقياس هاي اسمي و يا رتبه اي باشند. اين آزمون در طرح هاي ماقبل و مابعد ميتواند مورد استفاده قرار گيرد (يك نمونه در دو موقعيت مختلف). اين آزمون مخصوصا براي سنجش ميزان تاثير عملكرد تدابير به كار ميرود.
ويژگي ها: اگر متغيرها اسمي باشند، اين آزمون بي بديل است اما اگر رتبه اي باشد ميتوان از آزمون t نيز استفاده كرد (در صورت وجود شرايط آزمون t) ، و يا آزمون ويلكاكسون استفاده نمود. از عيوب اين آزمون اين است كه جهت و اندازه تغييرات را محاسبه نميكند و فقط وجود تغييرات را در نمونه ها در نظر ميگيرد.
آزمون ميانه
اين آزمون همتاي ناپارامتري آزمون هاي t – Z – F است و وقتي دو يا چند گروه از ميان دو يا چند جامعه مستقل با توزيع هاي يكسان انتخاب شده اند به كار برده ميشود. در اين آزمون مقياس اندازه گيري ترتيبي است و بين داده ها نبايد همرتبه وجود داشته باشد. اين آزمون، هم براي گروه هاي مستقل و هم وابسته كاربرد دارد و لزومي ندارد كه حتما حجم گروه هاي نمونه با يكديگر برابر باشند.
آزمون تك نمونه اي دورها
اين آزمون مواقعي به كار ميرود كه توالي مقادير متغيرها را بخواهيم آزمون نماييم كه آيا تصادفي بوده و يا نه. در واقع آزمون كي دو و يا آزمون هاي ديگر كه در آنها توالي متغيرها بي اهميت است، در اين آزمون مهم و اصل انگاشته ميشود. به عبارت ديگر، براي اينكه بتوانيم در يك نمونه كه در آن رويدادهاي مختلف از طرف فرد و يا واحد آماري رخ داده است، آزمون نماييم كه آيا اين رويدادها تصادفي است يا نه، به كار برده ميشود. هيچ آزمون ديگري همچون اين آزمون نمي تواند توالي را مورد نظر قرار دهد. بنابراين براي اين منظور منحصر به فرد ميباشد.
آزمون علامت
اين آزمون از انواع آزمونهاي غير پارامتري است و هنگامي به كار برده ميشود كه نمونه هاي جفت، مورد نظر باشد (مثل زن و شوهر و يا خانه هاي فرد و زوج و . . . ). زيرا در اين آزمون يافتهها به صورت جفت جفت بررسي ميشوند و اندازه مقادير در آن بي اثر است و فقط علامت مثبت و منفي و يا در واقع جهت پاسخ ها و يا بيشتر و كمتر بودن پاسخ هاي جفتهاي گروه مورد تحقيق (نمونه آماري) در نظر گرفته ميشود.
هنگامي كه ارزشيابي متغير مورد مطالعه با روشهاي عادي قابل اندازه گيري نباشد و قضاوت در مورد نمونه هاي آماري (كه به صورت جفت ها هستند) فقط با علامت بيشتر (+) و كمتر (-) مورد نظر باشد ، از اين آزمون ميتوان استفاده كرد. شكل توزيع ميتواند نرمال و يا غير نرمال باشد و يا از يك جامعه و يا دو جامعه باشند (مستقل و يا وابسته). توزيع بايد پيوسته باشد. اين آزمون فقط تفاوت هاي زوجها را مورد بررسي قرار ميدهد و در صورت مساوي بودن نظرات هر زوج (مشابه بودن) آنها را از آزمون حذف ميكند. چون مقادير در اين آزمون نقشي ندارند، شدت و ضعف و اندازه بيشتر يا كمتر بودن نظرات پاسخگويان (جفت ها) در اين آزمون بي اثر است و در واقع نقص اين آزمون حساب ميشود.
آزمون تي هتلينگ (T)
آزمون T هتلينگ تعميم يافته t استيودنت است. در آزمون t يك نمونه اي، ميانگين يك صفت از يك نمونه، با يك عدد فرضي كه ميانگين آن صفت از جامعه فرض ميشد، مورد مقايسه قرار ميگرفت، اما در T هتلينگ K متغير (صفت) از آن جامعه (نمونه هاي جامعه) با k عدد فرضي، مورد مقايسه قرار ميگيرند. در واقع اين آزمون از نوع آزمونهاي چند متغيره است كه همقوارگي (Goodness of fit) را بين صفت هاي مختلف از جامعه بدست ميدهد. در T هتلينگ دو نمونه اي نيز همچون T استيودنت دو نمونه اي، مقايسه دو نمونه است اما در اين آزمون K صفت از يك جامعه (نمونه) با K صفت از جامعه ديگر (نمونه ديگر) مورد مقايسه قرار ميگيرد.
آزمون مان وايتني U
هر گاه دو نمونه مستقل از جامعه اي مفروض باشد و متغيرهاي آنها به صورت ترتيبي باشند، از اين آزمون استفاده ميشود. اين آزمون مشابه t استيودنت با دو نمونه مستقل است و آزمون ناپارامتري آن محسوب ميشود.
هرگاه شرايط استفاده از آزمونهاي پارامتري در متغيرها موجود نباشد، يعني متغيرها پيوسته و نرمال نباشند از اين آزمون استفاده ميشود. دو نمونه بايد مستقل بوده و هر دو كوچكتر از 10 مورد باشند. در صورت بزرگتر بودن از 10 مورد بايد از آماره هاي Z استفاده كرد (در محاسبات كامپيوتري، تبديل به Z به طور خودكار انجام ميشود). در اين آزمون شكل توزيع، پيش فرضي ندارد يعني ميتواند نرمال و يا غير نرمال باشد.
آزمون ويلكاكسون
اين آزمون از آزمونهاي ناپارامتري است كه براي ارزيابي همانندي دو نمونه وابسته با مقياس رتبه اي به كار ميرود. همچون آزمون مك نمار، اين آزمون نيز مناسب طرح هاي ماقبل و مابعد است (يك نمونه در دو موقعيت مختلف)، و يا دو نمونه كه از يك جامعه باشند. اين آزمون اندازه تفاوت ميان رتبه ها را در نظر ميگيرد بنابراين متغيرها ميتوانند داراي جوابهاي متفاوت و يا فاصله اي باشند. اين آزمون متناظر با آزمون t دو نمونه اي وابسته است و در صورت وجود نداشتن شرايط آزمون t جانشين خوبي براي آن است. نمونه هاي به كار برده شده در اين آزمون بايد نسبت به ساير صفت هايشان جور شده (جفت شده) باشند.
آزمون لون Levene
آزمون لون همگنی واریانس ها را در نمونه های متفاوت بررسی می نماید. به عبارتی فرض تساوی متغیر وابسته را برای گروه هائی که توسط عامل رسته ای تعیین شده اند، آزمون می کند و نسبت به اکثر آزمونها کمتر به فرض نرمال بودن وابسته بوده و در واقع به انحراف نرمال مقاوم است.
این آزمون به منظور بررسی برابری واریانس جمعیت آماری در نمونههای مختلف انجام میشود. فرض صفر در اینجا این است که واریانسها همگن هستند، یعنی واریانس جمعیتها با یکدیگر برابر هستند. اگر مقدار P-VALUE در اماره لون کمتر از 0.05 باشد، تفاوت بدست آمده در واریانس نمونه بهطور بعید اتفاق افتاده است و بنابراین فرض صفر که برابری واریانسهاست رد میشود و نتیجه میگیریم که بین واریانسها در نمونه تفاوت وجود دارد.
برگرفته از وبلاگ : آقای منوچهری