بایگانی ماهیانه: سپتامبر 2017

تحلیل ممیزی یا تشخیصی Discriminant Analysis

 

تحلیل تشخیص یکی از روش های تحلیل خوشه ای است که به تحلیل ممیزی نیز معروف است. در این تحلیل، هر داده در یکی از خوشه ها قرار می گیرد و محقق به دنبال آن است که تشخیص دهد آیا یک داده درست رده بندی شده است یا خیر. این تحلیل مشابه رگرسیون چندگانه است، با این تفاوت که در رگرسیون چندگانه، متغیر وابسته همیشه یک متغیر کمّی و دارای توزیع نرمال است. در حالی که در اینجا متغیر وابسته نه تنها توزیع نرمال ندارد، بلکه یک متغیر کیفی با سطوح محدود (رسته ای) است. در حالت خاصی که متغیر وابسته دو مقداری باشد، رگرسیون لجستیک مورد استفاده قرار می گیرد. اما اگر متغیر وابسته بیش از دو مقدار بگیرد، باید از روش تحلیل تشخیص استفاده کرد. 

توابع تحلیل تشخیصی که جزو گروه (GLM) یا همان مدل های خطی عمومی لحاظ می گردند، در واقع همانند تابع رگرسیون لجستیک نوعی ترکیب وزنی هستند که به منظور پیش بینی عضویت یک فرد یا موضوع مورد بررسی در یکی از چند گروه ممکن بکار می روند. با این تفاوت که در تحلیل تشخیصی متغیر مستقل حتماً باید دارای مقیاس فاصله ای یا نسبتی بوده و در آن نمی توان متغیرهای دارای مقیاس ترتیبی یا اسمی را وارد نمود. متغییر وابسته نیز مانند رگرسیون لجستیک می تواند اسمی یا ترتیبی باشد. همچنین تفاوت این تحلیل با تحلیل واریانس چند متغیره در این است که در تحلیل واریانس این متغیر وابسته است که حالت کمی داشته و متغیر(های) مستقل حالت کیفی یا مقوله ای دارند. پیشنهاد می گردد که حجم نمونه مورد استفاده در تحلیل تشخیص حداقل ۲۰ برابر تعداد متغیرهای مستقل باشد. معادله تحلیل تشخیصی را می توان همانند معادله رگرسیون چند متغیره بصورت زیر نوشت:

Yi = a + b1X1 + b2X2 + . . . + bnXn 

مسیر انجام تحلیل ممیزی در SPSS

Analyze/ Classify/Discriminant 

 

رگرسیون  غیر خطی یا انحنایی (Curve Regression) و نحوه ی محاسبه آن در Spss

رگرسیون  غیر خطی یا انحنایی (Curve Regression)

در رگرسیون خطی با افزایش متغیر مستقل متغیر وابسته کم یا زیاد می شود و بالعکس مثلاً هرچه رضایت شغلی بالاتر باشد تعهد سازمانی نیز بالاتر می رود . در صورتی که نتوانیم رابطه‌ی میان متغیرها را به شکل خطی تبیین کنیم، از رگرسیون انحنایی یا (Curve Regression)استفاده می کنیم . برای مثال، بین ترس از کارفرما  و عملکرد شغلی رابطه‌ای غیرخطی وجود دارد. کمی ترس از کارفرما می تواند برای عملکرد مفید باشد اما اگر این ترس  بیش از اندازه باشد، بر عملکرد شغلی فرد تأثیر منفی خواهد داشت. یعنی رابطه مثبت بین ترس کم و عملکرد شغلی، با افزایش میزان ترس به رابطه‌ای منفی گرایش پیدا می‌کند.

مسیر تحلیل رگرسیون غیر خطی در Spss:

  • Analyze/Regression/ Curve estimation

رگرسیون انحنایی شامل ۱۱ نوع رگرسیون غیرخطی است که در جدول زیر ارائه شده‌اند و باید بهترین مدل رگرسیونی را که با داده‌ها برازش دارد، انتخاب کنیم.

انواع مدل‌های رگرسیون

مدل رگرسیون

معادله رگرسیون

رگرسیون خطی (Linear)

Y = a + bX

رگرسیون لگاریتمی (Logarithmic)

(Y = a + (b lnX

رگرسیون معکوس (Inverse)

(Y = a + (b / X

رگرسیون سهمی (Quadratic)

(Y = a + (b1X) + (bX2

رگرسیون درجه ۳ (Cubic)

(Y = a + (bX) + (bX2) + (b3 X3

رگرسیون توانی (Power)

Y =aXb1 یا (lnY = lna + (b1 * lnX

رگرسیون مرکب (Compound)

(Y =a(b1X

رگرسیون منحنی (s (S-curve

Y=ea+b1/x

رگرسیون لجستیک (Logistic)

( Y=1/(1/u+ab1X , مقدار حد بالا: u

رگرسیون رشد (Growth)

Y=ea+b1x

رگرسیون نمایی (Exponential)

Y=aeb1x

پس از انجام رگرسیون  اول سطح معنی داری را نگاه می کنیم هر کدام که مقدار سطح معنی داری (sig ) کم تر از ۰۵/۰ داشت ( p<0/05)  مورد قبول است و در شرایطی که چند مدل معنی دار باشد مدلی که آماره F آن بیشتر باشد برازنده تر است.

 

تفاوت رگرسیون چند گانه و چند متغیره و انواع رگرسیون چند گانه پرکاربرد در علوم انسانی

  • در رگرسیون چندگانه یک متغیر وابسته و چند متغیر مستقل یا پیشگو داریم. ولی در رگرسیون چندمتغیره چند متغیروابسته با چند متغیر مستقل داریم.

تفاوت رگرسیون چند گانه و چند متغیره و انواع رگرسیون چند گانه پرکاربرد در علوم انسانی

نوع متغیر وابسته

نوع رگرسیون چند گانه

فاصله ای – نسبی

خطیLinear

رتبه ای

رتبه ای ordinal

اسمی دو مقوله ای (مثلاً بلی و خیر)

لجستیک Logestic

اسمی چند مقوله ای ( مثلاً محافظه کار، میانه رو، اصلاح طلب)

رگرسیون چند مقوله ای Multinomial logestic

جاده ی موفقیت مستقیم نیست،

جاده ی موفقیت مستقیم نیست،

پیچی دارد به نام “شکست”

دوربرگردانی به نام “سردرگمی”

سرعت گیرهایی به نام “افکار منفی”

و چراغ قرمزهایی به نام “دشمنان”

اما اگر یدکی به نام “اراده”

موتوری به نام “استقامت”

و راننده ای به نام “خدا” داشته باشید

به جایی خواهید رسید که “موفقیت” نامیده می شود

گاهی وقت ها باید یه نقطه بزاری

باز شروع کنی

باز بخندی

باز بجنگی

باز بلند شی و محکمتر باشی

 

گاهی باید یه لبخند خوشگل به همه تلخی ها بزنی و بگویی جز خدا کسی به دادم نمی رسد.

 

آزمون های پیش بینی متغیر ها

آزمون های پیش بینی متغیر ها

 

نوع متغیر ها

تعداد متغیرهای وابسته

تعداد متغیرهای مستقل

مدل تحلیل

مشاهده شده

یک

یک

رگرسیون ساده

مشاهده شده

یک

چند

رگرسیون چندگانه

مشاهده شده

چند

چند

تحلیل مسیر

مکنون

چند

چند

معادلات ساختاری

برای انجام تجزیه و تحلیل آماری و فصل ۴ پایان نامه با قیمت پایین و کیفیت بالا کلیک بفرمائید.

تحلیل آماری و فصل ۴ پایان نامه

 

داده گمشده چیست؟

داده گمشده [۱] چیست؟

مشاهدات گمشده چالش مهمی را به دنبال دارد، زیرا پروسه های مدل بندی به راحتی این موارد را از تحلیل کنار می گذارند. هنگامی که این مقادیر گمشده اندک هستند (چیزی کمتر از ۵ درصد از کل مشاهدات) و اگر بتوان گمشدگی آنها را بصورت تصادفی در نظر گرفت، یعنی گمشده ها به مقادیر دیگر بستگی نداشته باشند، آنگاه روش متداول حذف listwise روشی نسبتاً قابل اعتماد خواهد بود. پروسه ی Missing values علاوه بر اینکه می تواند ما را نسبت به استفاده از روش حذف listwise مطمئن گرداند، روش های دیگری نیز برای کار با داده های گمشده هنگامی که این روش معتبر نیست، ارائه می کند.

تحلیل Missing values مجموعه ای از ابزارهای نسبتاً متفاوت و روش های متنوعی از جانهی منفرد  را برای تحلیل داده های گمشده فراهم می آورد. یادآور می شویم که روش جانهی چندگانه (multiple imputation) به مراتب برتر از روش جانهی منفرد (single imputation) است.

تحلیل Missing Value

پروسه ی تحلیل Missing Value از سه دستورالعمل اولیه زیر پیروی می کند:

  • تشریح الگوی گمشدگی داده ها. اینکه مقادیر گمشده در کجا واقع شده اند؟ میزان گستردگی آنها تا چه اندازه است؟ آیا جفت متغیرهای یک مشاهده (Case) دارای مقادیر گمشده است؟ آیا این مقادیر گمشده در نقاط حدی (نقاط ابتدایی و انتهایی) واقع شده است؟ آیا گمشدگی بصورت تصادفی اتفاق افتاده است؟

  • برآورد میانگین ها، انحراف معیارها، کوواریانس ها و همبستگی ها برای روش های مختلف مقادیر گمشده (listwise, pairwise, regression, EM).

  • جانهی مقادیر گمشده با استفاده از برآورد این مقادیر با بهره از روش های رگرسیونی و الگوریتم

تحلیل Missing Value به ما در مقابله با نگرانی هایی که بواسطه ی داده های ناکامل بوجود می آید کمک می کند. اگر مشاهدات دارای مقادیر گمشده بصورت منظم و سیستماتیک متفاوت از مشاهدات بدون گمشدگی باشند، نتایج گمراه کننده خواهد بود. گذشته از این داده های گمشده دقت محاسبات آماری را به دلیل از دست دادن پاره ای از اطلاعات کاهش می دهد. نگرانی دیگر، فرضیاتی است که در پشت هر پروسه ی آماری وجود دارد، زیرا اکثر این فرضیات تنها در خصوص مشاهدات کامل برقرار است و مقادیر گمشده نیازمند تئوری های پیچیده تری خواهد بود.

برای انجام تجزیه و تحلیل آماری و فصل ۴ پایان نامه با قیمت پایین و کیفیت عالی کلیک بفرمائید.

تحلیل آماری و فصل ۴ پایان نامه

 

[۱]Missing data

جدول خلاصه آزمون های بررسی رابطه دو متغیر

آزمون های بررسی رابطه دو متغیر

در spss  را بطه  دو متغیر، اگر داده ها غیر نرمال یا اینکه متغیر ها در سطح اسمی و رتبه ای اندازه گیری شده باشند  از جداول دو بعدی برای بررسی رابطه استفاده می شود. البته اگر متغیر مستقل اسمی و وابسته فاصله ای یا نسبی باشد از آزمون های مقایسه ای (مانند تی تست و  تحلیل واریانس ) استفاده می شود   و اگر داده ها نرمال، رابطه خطی و هردو متغیر فاصله ای یا نسبی و مستقل  باشند از ضریب همبستگی پیرسونr  استفاده می شود و وقتی رابطه معنا دار و شدت آن بالا باشد برای پیش بینی متغیر وابسته از روی متغیر مستقل از رگرسیون استفاده می شود.  خلاصه این انتخاب ها در جدول زیر قابل مشاهده است.

سطح سنجش متغیر ها

آزمون آماری

متغیر مستقل

متغیر وابسته

اسمی

اسمی

خی دو ،فی،وی کرامر،لاندا

اسمی

ترتیبی

خی دو ،فی،وی کرامر،لاندا

اسمی

فاصله ای یا نسبی

تی تست، تحلیل واریانس یک طرفه

ترتیبی

اسمی

خی دو ،فی،وی کرامر،لاندا

ترتیبی

ترتیبی

گاما،تائوکندال،دی سامرز،رو اسپیرمن

ترتیبی

فاصله ای یا نسبی

تائوکندال ،رو اسپیرمن تی تست، تحلیل واریانس یک طرفه

فاصله ای یا نسبی

اسمی

خی دو ،فی،وی کرامر،لاندا

فاصله ای یا نسبی

ترتیبی

گاما،تائوکندال،دی سامرز،رو اسپیرمن

فاصله ای یا نسبی

فاصله ای یا نسبی

پیرسون،رگرسیون

 

برای انجام تجزیه و تحلیل آماری و فصل ۴ پایان نامه با قیمت پایین و کیفیت عالی کلیک بفرمائید.

تحلیل آماری و فصل ۴ پایان نامه