نکاتی در مورد مفروضات رگرسیون خطی

نکاتی در مورد مفروضات رگرسیون خطی

جهت استفاده از رگرسیون خطی باید شرایط زیر محقق شود:

۱- میانگین (امید ریاضی) خطاها صفر باشد.

۲- واریانس خطاها ثابت باشد.

مفروضات ۱ و ۲ بدین معنی هستند که توزیع خطاها باید دارای توزیع نرمال باشد. بدین منظور باید نمودار توزیع خطا‌ها و نمودار نرمال آن‌ها رسم شود و سپس مقایسه‌ای بین دو نمودار صورت گیرد.

۳- بین خطاهای مدل، همبستگی وجود نداشته باشد. به منظور بررسی این شرط از آزمون دوربین-واتسون استفاده می‌شود.

۴- متغیر وابسته مقیاس فاصله‌ای یا نسبی و دارای توزیع نرمال باشد.

۵- بین متغیرهای مستقل همبستگی وجود نداشته باشد (دارای هم خطی نباشند). در SPSS برای برقراری این شرط از آزمون هم خطی استفاده می‌شود.

یکی از پیش‌فرض‌های رگرسیون خطی این است که توزیع داده‌های متغیر وابسته نرمال یا نزدیک به نرمال باشد. برای پی بردن به نرمال بودن یا نبودن داده‌ها، می‌توانیم از آزمون کولموگروف-اسمیرنوف، آزمون شاپیرو، آزمون اندرسون دارلین و آزمون جارکیو-برا استفاده کرد. اگر نتایج این آزمون‌ها نشان داد که توزیع داده‌ها نرمال نیست، برای اجرا رگرسیون، باید از لگاریتم طبیعی داده‌ها استفاده شود. برای تبدیل داده‌ها به لگاریتم طبیعی، از دستور Transform > Compute Variable… استفاده می‌کنیم. سپس در پنجره‌ای که باز می‌شود از کادر Function Group در سمت راست، بر روی گزینه Arithmetic کلیک می‌کنیم تا تابع لگاریتم طبیعی با نام Ln در کادر Function and Special Variable نمایش داده شود. سپس، تابع Ln را انتخاب کرده و با کلیک بر روی دکمه  وارد کادر Numeric Expression می‌کنیم و متغیر وابسته را درون این تابع قرار می‌دهیم. در قسمت Target Variable یا نام برای متغیر جدید انتخاب و در نهایت بر روی دکمه OK کلیک می‌کنیم.

یکی دیگر  از مفروضاتی که در رگرسیون مدنظر قرار می‌گیرد، استقلال خطاها (تفاوت بین مقادیر واقعی و مقادیر پیش بینی شده توسط معادله رگرسیون) از یکدیگر است. در صورتی که فرضیه استقلال خطاها رد شود و خطاها با یکدیگر همبستگی داشته باشند امکان استفاده از رگرسیون وجود ندارد. به منظور بررسی استقلال مشاهدات (استقلال مقادیر باقی مانده یا خطاها) از یکدیگر از آزمون دوربین- واتسون استفاده می‌شود.

آمار، آماره دوربین-واتسن یک آماره آزمون می‌باشد که برای بررسی وجود خود همبستگی (رابطه بین مقادیر که با تاخیر زمانی مشخص از یکدیگر جدا شده‌اند) بین باقیمانده‌ها در تحلیل رگرسیون استفاده می‌گردد. مقدار این آماره همواره بین ۰ تا ۴ قرار می‌گیرد. در تحلیل رگرسیون بخصوص زمانی که متغیرها در طول یک فاصله زمانی مورد مطالعه قرار می‌گیرند ممکن است تغییر داده‌ها در طول زمان از الگوی خاصی پیروی کند برای تشخیص این الگو از آزمون دوربین واتسون استفاده می‌شود.

مفهوم مستقل بودن به این معنی است که نتیجه یک مشاهده تاثیری بر نتیجه مشاهدات دیگر نداشته باشد. در رگرسیون، بیشتر در مواقعی که رفتار متغیر وابسته در یک بازه زمانی مورد مطالعه قرار می‌گیرد ممکن است با مشکل مستقل نبودن خطا‌ها برخورد کنیم به این نوع ارتباط در داده‌ها خودهمبستگی می‌گویند. در صورت وجود خودهمبستگی در خطا‌ها نمی‌توان از رگرسیون خطی استفاده کرد. برای بررسی این فرض به صورت شهودی می‌توان از نمودار کردن توالی متغیر studentized در spss استفاده کرد. اما راه مطمئن تر استفاده از آزمون دوربین واتسون می‌باشد.

آماره دوربین واتسون بین ۰ تا ۴ می‌باشد. اگر بین باقیمانده‌ها همبستگی متوالی وجود نداشته باشد، مقدار این آماره باید به ۲ نزدیک باشد. اگر به صفر نزدیک باشد نشان دهنده همبستگی مثبت و اگر به ۴ نزدیک باشد نشان دهنده همبستگی منفی می‌باشد. در مجموع اگر این آماره بین ۵/۱ تا ۵/۲ باشد جای نگرانی نیست.

مسیر انجام روش رگرسیون خطی  در اس پی اس اس:

Analyze / Regression/ Linear

برای انتخاب دوربین واتسون در پنجره باز شده روی Statistics کلیک و در بخش Residuals گزینه Durbin- Watson را انتخاب نمائید.