نکاتی در مورد مفروضات رگرسیون خطی
جهت استفاده از رگرسیون خطی باید شرایط زیر محقق شود:
۱- میانگین (امید ریاضی) خطاها صفر باشد.
۲- واریانس خطاها ثابت باشد.
مفروضات ۱ و ۲ بدین معنی هستند که توزیع خطاها باید دارای توزیع نرمال باشد. بدین منظور باید نمودار توزیع خطاها و نمودار نرمال آنها رسم شود و سپس مقایسهای بین دو نمودار صورت گیرد.
۳- بین خطاهای مدل، همبستگی وجود نداشته باشد. به منظور بررسی این شرط از آزمون دوربین-واتسون استفاده میشود.
۴- متغیر وابسته مقیاس فاصلهای یا نسبی و دارای توزیع نرمال باشد.
۵- بین متغیرهای مستقل همبستگی وجود نداشته باشد (دارای هم خطی نباشند). در SPSS برای برقراری این شرط از آزمون هم خطی استفاده میشود.
یکی از پیشفرضهای رگرسیون خطی این است که توزیع دادههای متغیر وابسته نرمال یا نزدیک به نرمال باشد. برای پی بردن به نرمال بودن یا نبودن دادهها، میتوانیم از آزمون کولموگروف-اسمیرنوف، آزمون شاپیرو، آزمون اندرسون دارلین و آزمون جارکیو-برا استفاده کرد. اگر نتایج این آزمونها نشان داد که توزیع دادهها نرمال نیست، برای اجرا رگرسیون، باید از لگاریتم طبیعی دادهها استفاده شود. برای تبدیل دادهها به لگاریتم طبیعی، از دستور Transform > Compute Variable… استفاده میکنیم. سپس در پنجرهای که باز میشود از کادر Function Group در سمت راست، بر روی گزینه Arithmetic کلیک میکنیم تا تابع لگاریتم طبیعی با نام Ln در کادر Function and Special Variable نمایش داده شود. سپس، تابع Ln را انتخاب کرده و با کلیک بر روی دکمه وارد کادر Numeric Expression میکنیم و متغیر وابسته را درون این تابع قرار میدهیم. در قسمت Target Variable یا نام برای متغیر جدید انتخاب و در نهایت بر روی دکمه OK کلیک میکنیم.
یکی دیگر از مفروضاتی که در رگرسیون مدنظر قرار میگیرد، استقلال خطاها (تفاوت بین مقادیر واقعی و مقادیر پیش بینی شده توسط معادله رگرسیون) از یکدیگر است. در صورتی که فرضیه استقلال خطاها رد شود و خطاها با یکدیگر همبستگی داشته باشند امکان استفاده از رگرسیون وجود ندارد. به منظور بررسی استقلال مشاهدات (استقلال مقادیر باقی مانده یا خطاها) از یکدیگر از آزمون دوربین- واتسون استفاده میشود.
آمار، آماره دوربین-واتسن یک آماره آزمون میباشد که برای بررسی وجود خود همبستگی (رابطه بین مقادیر که با تاخیر زمانی مشخص از یکدیگر جدا شدهاند) بین باقیماندهها در تحلیل رگرسیون استفاده میگردد. مقدار این آماره همواره بین ۰ تا ۴ قرار میگیرد. در تحلیل رگرسیون بخصوص زمانی که متغیرها در طول یک فاصله زمانی مورد مطالعه قرار میگیرند ممکن است تغییر دادهها در طول زمان از الگوی خاصی پیروی کند برای تشخیص این الگو از آزمون دوربین واتسون استفاده میشود.
مفهوم مستقل بودن به این معنی است که نتیجه یک مشاهده تاثیری بر نتیجه مشاهدات دیگر نداشته باشد. در رگرسیون، بیشتر در مواقعی که رفتار متغیر وابسته در یک بازه زمانی مورد مطالعه قرار میگیرد ممکن است با مشکل مستقل نبودن خطاها برخورد کنیم به این نوع ارتباط در دادهها خودهمبستگی میگویند. در صورت وجود خودهمبستگی در خطاها نمیتوان از رگرسیون خطی استفاده کرد. برای بررسی این فرض به صورت شهودی میتوان از نمودار کردن توالی متغیر studentized در spss استفاده کرد. اما راه مطمئن تر استفاده از آزمون دوربین واتسون میباشد.
آماره دوربین واتسون بین ۰ تا ۴ میباشد. اگر بین باقیماندهها همبستگی متوالی وجود نداشته باشد، مقدار این آماره باید به ۲ نزدیک باشد. اگر به صفر نزدیک باشد نشان دهنده همبستگی مثبت و اگر به ۴ نزدیک باشد نشان دهنده همبستگی منفی میباشد. در مجموع اگر این آماره بین ۵/۱ تا ۵/۲ باشد جای نگرانی نیست.
مسیر انجام روش رگرسیون خطی در اس پی اس اس:
Analyze / Regression/ Linear
برای انتخاب دوربین واتسون در پنجره باز شده روی Statistics کلیک و در بخش Residuals گزینه Durbin- Watson را انتخاب نمائید.