ضریب تعیین (تشخیص)
ضریب تعیین یا ضریب تشخیص Coefficient Of Determination قدرت توضیح دهندگی مدل را نشان میدهد. ضریب تعیین نشان میدهد که چند درصد از تغییرات متغیر وابسته توسط متغیرهای مستقل توضیح داده میشود. تغییرات کل متغیر وابسته برابر است با تغییرات توضیح داده شده توسط رگرسیون بعلاوه تغییرات توضیح داده نشده. این شاخص یکی از شاخصهای برازش مدل است که قدرت پیشبینی متغیر وابسته (ملاک) براساس متغیرهای مستقل (پیشبین) را نشان میدهد. مقدار این شاخص بین صفر تا یک میباشد و اگر از ۰/۶ بیشتر باشد نشان میدهد متغیرهای مستقل تا حد زیادی توانستهاند تغییرات متغیر وابسته را تبیین کنند.
ضریب تشخیص در معادلات رگرسیونی با علامت R2 نشان داده میشود و بیانگر میزان احتمال همبستگی میان دو دسته داده در آینده میباشد. این ضریب در واقع نتایج تقریبی پارامتر موردنظر در آینده را بر اساس مدل ریاضی تعریف شده که منطبق بر دادههای موجود است، بیان میدارد. در واقع معیاری است از این که خط رگرسیون، چقدر خوب خواندهها را معرفی میکند. اگر خط رگرسیون از تمام نقاط بگذرد توانائی معرفی همه متغیرها را دارد و هرچه از نقاط دورتر باشد نشان دهنده توانائی کمتر است. در این مقاله روش استفاده از این شاخص در رگرسیون، حداقل مربعات جزئی و مدل معادلات ساختاری توضیح داده شده است.
فرمول محاسبه ضریب تعیین (تشخیص) از نظر آماری
با توجه به اینکه
SST: مجموع توان دوم خطاها زمانی که از متغیرهای مستقل (X ها) استفاده نشود.
SSE: مجموع توان دوم خطاها زمانی که از متغیرهای مستقل (X ها) استفاده شود.
پارامتر SSR را مجموع توان دوم رگرسیون نامید و کاهش در مجموع توان دوم خطاها به خاطر استفاده از متغیرهای مستقل (x ها) را نشان میدهد. هر چه SSR بزرگتر باشد بهتر است و اگر SSR = 0 باشد رابطه رگرسیونی اصلا کاربرد نداشته است.
SSR = SST – SSE
می دانیم SSR کاهش تغییر پذیری (خطا) به خاطر استفاده از متغیرهای مستقل است. نسبت این کاهش را با R2 نشان داده و ضریب تعیین مینامیم.
R2 = SSR/SST
بنابراین مقادیری که R2 میتواند اختیار کند بین صفر و یک میباشد:
اگر R2 = 1 باشد آن گاه SSR=SST یا به عبارتی SSE = 0 یعنی زمانی که از متغیرهای مستقل استفاده کنید هیچ خطای وجود ندارد که این بهترین حالت ممکن است.
اگر R2 = 0 باشد آن گاه SSR=0 یا به عبارتی SSE = SSR یعنی استفاده از متغیرهای مستقل هیچ تاثیری بر برآورد خط رگرسیونی ندارد.
محاسبه ضریب تـعیین در SPSS
برای این منظور از رگرسیون خطی استفاده میشود.
از منوی Analyze گزینه Regression فرمان Linear را اجرا کنید.
متغیر وابسته تعهد را به کادر Dependent وارد کنید. در تکنیک رگرسیون خطی فقط میتوان یک متغیر را به کادر Dependent وارد کنید.
متغیر یا متغیرهای مستقل را به کادر Independent وارد کنید.
با تایید این کار چندین جدول در خروجی ظاهر خواهد شد.
برای مشاهده ضریب تعیین از جدول Model Summary استفاده کنید.
براساس نتایح این جدول متغیرهای پیش بین توانستهاند ۲۸% از تغییرات در متغیر وابسته را تبیین کنند.
تفاوت ضریب تعیین و ضریب تعیین تعدیلشده
ضریب تعیین فرض میکند که هر متغیر مستقل مشاهده شده در مدل، تغییرات موجود در متغیر وابسته را تبیین میکند. بنابراین درصد نشان داده شده توسط این شاخص با فرض تاثیر همه متغیرهای مستقل بر متغیر وابسته میباشد. در صورتی که درصد نشان داده شده توسط R2 تعدیل شده فقط حاصل از تاثیر واقعی متغیرهای مستقل مدل بر وابسته ( نه همه متغیرهای مستقل) است. تفاوت دیگراین است که مناسب بودن متغیرها برای مدل توسط R2 حتی با وجود مقدار بالا قابل مشخص نیست در صورتی که میتوان به مقدار براورد شده ضریب تعیین تعدیل شده اعتماد کرد.
در این رابطه N تعداد کل مشاهدات، P تعداد متغیرهای پیشبین و R2 ضریب تعیین است. این شاخص نیز در جدول خلاصه مدل در خروجی رگرسیون قابل مشاهده است.
آیا ضریب تعیین معیار مناسبی برای تبیین میزان تاثیر متغیر مستقل بر متغیر وابسته است؟
خیر. چون با افزایش مشاهدات و هم چنین با افزایش متغیرهای مستقل میزان R2 افزایش مییابد این افزایش ممکن است کاذب باشد.
برای رفع این مشکل به R2 تعدیل شده نیاز داریم. مقدار تعدیل شده میزان R2 را با توجه به متغیرهای مستقل اضافه شده به خط رگرسیون و با توجه به عرض از مبداهای جدید، تعدیل و اصلاح میکند. هرچه تفاوت بین R2 و R2 تعدیل شده کمتر باشدنشان میدهد که متغیرهای مستقل که به مدل اضافه شدهاند به درستی انتخاب شدهاند.
محاسبه ضریب تعیین در PLS
ضریب تعیین یکی از پنج معیار اصلی برازش مدل در روش حداقل مربعات جزئی است. این شاخص بیانگر میزان تغییرات هر یک از متغیرهای وابسته مدل است که به وسیله متغیرهای مستقل تبیین میشود. گفتنی است که مقدار R2 تنها برای متغیرهای درونزای مدل ارائه میشود و در مورد سازههای برونزا مقدار آن برابر صفر است. هرچه مقدار R2 مربوط به سازههای درونزای مدل بیشتر باشد، نشان از برازش بهتر مدل است.
چین (۱۹۹۸) سه مقدار ۰/۱۹، ۰/۳۳ و ۰/۶۷ را به عنوان مقدار ملاک برای مقادیر ضعیف، متوسط و قوی بودن برازش بخش ساختاری مدل به وسیله معیار R2 تعریف کرده است. همچنین در نرمافزار نسخه شماره ۳ این نرمافزار هم ضریب تعیین و هم ضریب تعیین تعدیلشده محاسبه میگردد. برای مطالعه بیشتر به بحث شاخصهای برازش حداقل مجذورات جزئی رجوع کنید.
منبع: محاسبه ضریب تعیین (تشخیص) نوشته آرش حبیبی کتاب آموزش SPSS
برگرفته از پارس مدیر – نویسنده آرش حبیبی
دانلود کتاب آموزش تصویری تعیین حجم نمونه با Spss sample power نرم افزار