بایگانی دسته: آموزش Spss اس پی اس اس

تحلیل ممیزی یا تشخیصی Discriminant Analysis

 

تحلیل تشخیص یکی از روش های تحلیل خوشه ای است که به تحلیل ممیزی نیز معروف است. در این تحلیل، هر داده در یکی از خوشه ها قرار می گیرد و محقق به دنبال آن است که تشخیص دهد آیا یک داده درست رده بندی شده است یا خیر. این تحلیل مشابه رگرسیون چندگانه است، با این تفاوت که در رگرسیون چندگانه، متغیر وابسته همیشه یک متغیر کمّی و دارای توزیع نرمال است. در حالی که در اینجا متغیر وابسته نه تنها توزیع نرمال ندارد، بلکه یک متغیر کیفی با سطوح محدود (رسته ای) است. در حالت خاصی که متغیر وابسته دو مقداری باشد، رگرسیون لجستیک مورد استفاده قرار می گیرد. اما اگر متغیر وابسته بیش از دو مقدار بگیرد، باید از روش تحلیل تشخیص استفاده کرد. 

توابع تحلیل تشخیصی که جزو گروه (GLM) یا همان مدل های خطی عمومی لحاظ می گردند، در واقع همانند تابع رگرسیون لجستیک نوعی ترکیب وزنی هستند که به منظور پیش بینی عضویت یک فرد یا موضوع مورد بررسی در یکی از چند گروه ممکن بکار می روند. با این تفاوت که در تحلیل تشخیصی متغیر مستقل حتماً باید دارای مقیاس فاصله ای یا نسبتی بوده و در آن نمی توان متغیرهای دارای مقیاس ترتیبی یا اسمی را وارد نمود. متغییر وابسته نیز مانند رگرسیون لجستیک می تواند اسمی یا ترتیبی باشد. همچنین تفاوت این تحلیل با تحلیل واریانس چند متغیره در این است که در تحلیل واریانس این متغیر وابسته است که حالت کمی داشته و متغیر(های) مستقل حالت کیفی یا مقوله ای دارند. پیشنهاد می گردد که حجم نمونه مورد استفاده در تحلیل تشخیص حداقل ۲۰ برابر تعداد متغیرهای مستقل باشد. معادله تحلیل تشخیصی را می توان همانند معادله رگرسیون چند متغیره بصورت زیر نوشت:

Yi = a + b1X1 + b2X2 + . . . + bnXn 

مسیر انجام تحلیل ممیزی در SPSS

Analyze/ Classify/Discriminant 

 

آزمون های پیش بینی متغیر ها

آزمون های پیش بینی متغیر ها

 

نوع متغیر ها

تعداد متغیرهای وابسته

تعداد متغیرهای مستقل

مدل تحلیل

مشاهده شده

یک

یک

رگرسیون ساده

مشاهده شده

یک

چند

رگرسیون چندگانه

مشاهده شده

چند

چند

تحلیل مسیر

مکنون

چند

چند

معادلات ساختاری

برای انجام تجزیه و تحلیل آماری و فصل ۴ پایان نامه با قیمت پایین و کیفیت بالا کلیک بفرمائید.

تحلیل آماری و فصل ۴ پایان نامه

 

داده گمشده چیست؟

داده گمشده [۱] چیست؟

مشاهدات گمشده چالش مهمی را به دنبال دارد، زیرا پروسه های مدل بندی به راحتی این موارد را از تحلیل کنار می گذارند. هنگامی که این مقادیر گمشده اندک هستند (چیزی کمتر از ۵ درصد از کل مشاهدات) و اگر بتوان گمشدگی آنها را بصورت تصادفی در نظر گرفت، یعنی گمشده ها به مقادیر دیگر بستگی نداشته باشند، آنگاه روش متداول حذف listwise روشی نسبتاً قابل اعتماد خواهد بود. پروسه ی Missing values علاوه بر اینکه می تواند ما را نسبت به استفاده از روش حذف listwise مطمئن گرداند، روش های دیگری نیز برای کار با داده های گمشده هنگامی که این روش معتبر نیست، ارائه می کند.

تحلیل Missing values مجموعه ای از ابزارهای نسبتاً متفاوت و روش های متنوعی از جانهی منفرد  را برای تحلیل داده های گمشده فراهم می آورد. یادآور می شویم که روش جانهی چندگانه (multiple imputation) به مراتب برتر از روش جانهی منفرد (single imputation) است.

تحلیل Missing Value

پروسه ی تحلیل Missing Value از سه دستورالعمل اولیه زیر پیروی می کند:

  • تشریح الگوی گمشدگی داده ها. اینکه مقادیر گمشده در کجا واقع شده اند؟ میزان گستردگی آنها تا چه اندازه است؟ آیا جفت متغیرهای یک مشاهده (Case) دارای مقادیر گمشده است؟ آیا این مقادیر گمشده در نقاط حدی (نقاط ابتدایی و انتهایی) واقع شده است؟ آیا گمشدگی بصورت تصادفی اتفاق افتاده است؟

  • برآورد میانگین ها، انحراف معیارها، کوواریانس ها و همبستگی ها برای روش های مختلف مقادیر گمشده (listwise, pairwise, regression, EM).

  • جانهی مقادیر گمشده با استفاده از برآورد این مقادیر با بهره از روش های رگرسیونی و الگوریتم

تحلیل Missing Value به ما در مقابله با نگرانی هایی که بواسطه ی داده های ناکامل بوجود می آید کمک می کند. اگر مشاهدات دارای مقادیر گمشده بصورت منظم و سیستماتیک متفاوت از مشاهدات بدون گمشدگی باشند، نتایج گمراه کننده خواهد بود. گذشته از این داده های گمشده دقت محاسبات آماری را به دلیل از دست دادن پاره ای از اطلاعات کاهش می دهد. نگرانی دیگر، فرضیاتی است که در پشت هر پروسه ی آماری وجود دارد، زیرا اکثر این فرضیات تنها در خصوص مشاهدات کامل برقرار است و مقادیر گمشده نیازمند تئوری های پیچیده تری خواهد بود.

برای انجام تجزیه و تحلیل آماری و فصل ۴ پایان نامه با قیمت پایین و کیفیت عالی کلیک بفرمائید.

تحلیل آماری و فصل ۴ پایان نامه

 

[۱]Missing data

جدول خلاصه آزمون های بررسی رابطه دو متغیر

آزمون های بررسی رابطه دو متغیر

در spss  را بطه  دو متغیر، اگر داده ها غیر نرمال یا اینکه متغیر ها در سطح اسمی و رتبه ای اندازه گیری شده باشند  از جداول دو بعدی برای بررسی رابطه استفاده می شود. البته اگر متغیر مستقل اسمی و وابسته فاصله ای یا نسبی باشد از آزمون های مقایسه ای (مانند تی تست و  تحلیل واریانس ) استفاده می شود   و اگر داده ها نرمال، رابطه خطی و هردو متغیر فاصله ای یا نسبی و مستقل  باشند از ضریب همبستگی پیرسونr  استفاده می شود و وقتی رابطه معنا دار و شدت آن بالا باشد برای پیش بینی متغیر وابسته از روی متغیر مستقل از رگرسیون استفاده می شود.  خلاصه این انتخاب ها در جدول زیر قابل مشاهده است.

سطح سنجش متغیر ها

آزمون آماری

متغیر مستقل

متغیر وابسته

اسمی

اسمی

خی دو ،فی،وی کرامر،لاندا

اسمی

ترتیبی

خی دو ،فی،وی کرامر،لاندا

اسمی

فاصله ای یا نسبی

تی تست، تحلیل واریانس یک طرفه

ترتیبی

اسمی

خی دو ،فی،وی کرامر،لاندا

ترتیبی

ترتیبی

گاما،تائوکندال،دی سامرز،رو اسپیرمن

ترتیبی

فاصله ای یا نسبی

تائوکندال ،رو اسپیرمن تی تست، تحلیل واریانس یک طرفه

فاصله ای یا نسبی

اسمی

خی دو ،فی،وی کرامر،لاندا

فاصله ای یا نسبی

ترتیبی

گاما،تائوکندال،دی سامرز،رو اسپیرمن

فاصله ای یا نسبی

فاصله ای یا نسبی

پیرسون،رگرسیون

 

برای انجام تجزیه و تحلیل آماری و فصل ۴ پایان نامه با قیمت پایین و کیفیت عالی کلیک بفرمائید.

تحلیل آماری و فصل ۴ پایان نامه

سطح معنی داری(Level of Significance)

سطح معنی داری(Level of Significance)

   موقعی که فرضیه ای را تنظیم می کنیم، باید با استفاده از آزمون های آماری مناسب، صحت یا سقم آن را در سطح خطای معین تعیین کنیم.

   سطح معنی داری، که در نرم افزارSPSS به اختصار با (Sig.)نشان داده می شود، میزان خطایی است که در رد فرض صفر(H) مرتکب می شویم. سطح معنی داری در علم آمار به P- value (مقدار احتمال) معروف است که معمولاً نیز در هنگام نگارش گزارش تحقیق، از همین علامت P استفاده می کنیم. در تفسیر نتایج هر آزمونی، اعم از پارامتری و ناپارامتری، هر چه مقدارSig. کوچک تر باشد، رد فرض صفر ساده تر است.    آلفا(α)سطح خطایی است که محقق در نظر می گیرد (مقدار آلفا معمولاً ۰۵/۰ یا ۵ صدم است). بسیاری از محققین در تمایز دو مفهوم Sig.و αاز همدیگر دچار اشتباه می شوند. در این خصوص باید گفت که α میزان خطای در نظر گرفته شده محقق و Sig. میزان خطای محاسبه شده در رد فرض H. است. به طور کلی، می توان گفت:
رد فرض H.و پذیرش فرض  H1 → (۰/۰۵)α>(P)Sig.
پذیرش فرض H.و رد فرض  H1 → (۰/۰۵)α≤ (P)Sig.
   برای این که با استفاده از سطح معنی داری به دست آمده برای هر آزمون، بتوانیم فرض H. را رد یا تأیید کنیم، تعیین معنی داری در دو سطح امکان پذیر است. یعنی این که می توانیم معنی داری یا عدم معنی داری هر آزمونی را در دو سطح تعیین و سپس بر اساس آن به قضاوت بپردازیم:

۱- سطح معنی دای کوچک تر از ۰۱/۰: در این سطح معنی داری، با ۹۹% سطح اطمینان و خطای ۰۱/۰ فرضH.رد می شود. این سطح به معنای واقعی نبودن رابطه در یک نمونه از هر ۱۰۰ نمونه می باشد. یعنی فقط یک نمونه از هر ۱۰۰ نمونه بر حسب تصادف به رابطه مشاهده شده در نمونه ما می کشد (دواس، ۱۳۷۶: ۱۹۱). چنان چه بتوانیم فرضH. را در سطح معنی داری ۰۱/۰ رد کنیم، در آن صورت دقت برآورد پارامتر جامعه از آماره نمونه بیش تر است.

۲- سطح معنی داری کوچک تر از ۰۵/۰: در این سطح معنی داری، با ۹۵% سطح اطمینان و خطای ۰۵/۰ فرضH. رد می شود. این سطح بدین معناست که فقط ۵ نمونه از هر ۱۰۰ نمونه بر حسب تصادف به رابطه مشاهده شده در نمونه ما می کشد (دواس، ۱۳۷۶: ۱۹۱). بنابراین، سطح اطمینان رد فرضH. در این سطح معنی داری، کم تر از سطح ۰۱/۰ است. در علم آمار و همچنین نرم افزار SPSS، برای رد یا قبول فرضH.، سطح ۰۵/۰ به عنوان مبنا در نظر گرفته می شود.

   نکته: بنابراین، ممکن است یک فرض صفر (H.) در یک سطح خطا، مثلاً ۰۱/۰، معنی دار نباشد، ولی در سطح ۰۵/۰، معنی دار باشد. از این رو، انتخاب سطح معنی داری در رد یا تأیید (H.) عامل بسیار مهمی در رد فرض H. است (اقتباس از مومنی، ۱۳۸۶: ۶۶-۶۵) و تعیین این امر به عهده خود محقق می باشد.

منبع: راهنمای جامع کاربرد SPSS در تحقیقات پیمایشی. کرم حبیب پور و رضا صفری