بایگانی دسته: آموزش Spss اس پی اس اس

تحلیل خوشه ای (خوشه بندی) (Cluster Analysis)

تحلیل خوشه ای (خوشه بندی) (Cluster Analysis)

تجزیه و تحلیل خوشه ای، یک روش آماری برای گروه بندی داده ها یا مشاهدات، با توجه به شباهت یا درجه نزدیکی آنها است. از طریق تجزیه و تحلیل خوشه ای داده ها یا مشاهدات به دسته های همگن و متمایز از هم تقسیم می شوند. از این روش برای بخش بندی کردن مشتریان بر مبنای شباهت هایشان استفاده می شود. غالبا در تحلیل خوشه ای، تصمیم گیری درباره تعداد خوشه ها بر مبنای ملاک بیزی و ملاک آکائیکه گرفته می شود. جوابی در سطح حد اقل ملاک بیزی و ملاک آکائیکه به دست می آید، می تواند معرف بهترین تعادل موجود بین دقت و پیچیدگی باشد که مهم ترین تاثیرات را در نظر بگیرد و اهمیت آنها را کم نشان ندهد. همچنین، راه دیگر برای تصمیم گیری در زمینه تعداد خوشه ها، استفاده از نسبت فاصله می باشد. بهینه ترین تعداد خوشه ها هنگامی است که تغییری بزرگ در نسبت فاصله مشاهده می گردد.

اصطلاح تحلیل خوشه ای اولین بار توسط Tryon در سال ۱۹۳۹ برای روش های گروه بتدی اشیائی که شبیه بودند مورد استفاده قرار گرفت. تجزیه خوشه ای ابزار میانبر تحلیل داده هاست که هدف آن نظم دادن به اشیا مختلف به گروه هایی که درجه ارتباط بین دو شئی اگر آنها به یک گروه تعلق داشته باشند حداکثر و در غیر این صورت حداقل است. به عبارت دیگر تحلیل خوشه ای ساختار داده ها را بدون توضیح اینکه چه وجود دارد را نشان می دهد.

تحلیل خوشه ای یک ابزار اکتشاف  است و نتایج آن ممکن است ۱)در تعریف یک طرح طبقه بندی مانند رده بندی حیوانات، حشرات یا گیاهان مفید باشد. ۲)قواعدی برای اختصاص موارد جدید به طبقه ها به منظور شناسایی و تشخیص به دست دهد. ۳)حدود تعریف، اندازه و تنوغ و تعریف برای آنچه قبلا به شکل مفاهیم وسیعی بوده است، فراهم آورد. ۴) نمونه هایی برای معرفی طبقه ها بیاید. ۵)مدل آماری برای توصیف جامعه ارائه دهد.

مفاهیم فاصله و تشابه از مفاهیم اساسی تحلیل خوشه ای است. فاصله اندازه‌ای است که نشان می دهد دو مشاهده تا چه حد جدا از یکدیگرند. در حالی که تشابه شاخص نزدیکی آنها با یکدیگر است. پژوهشگر قبل از تحلیل، نخست باید یک مقیاس کمی  را که بر پایه همخوانی(تشابه) بین مشاهده‌ها اندازه گرفته می شود را انتخاب کند. این شاخص ها با توجه به الگوریتم تشکیل خوشه، ماهیت متغیر ها(پیوسته، گسسته یا دو ارزشی) و مقیاس اندازه گیری انتخاب می شوند.

مثال های از تحلیل خوشه ای:

  • اگر بخواهیم کشورها را بر حسب شاخص های فرهنگی و اقتصادی طبقه بندی کنیم.
  • اگر بخواهیم کلان شهر ها را بر حسب شاخص های بهداشتی و آموزشی طبقه بندی کنیم.
  • اگر بخواهیم افراد را بر اساس ویژگی های شخصیتی طبقه بندی کنیم.

اولین کار برای تحلیل خوشه ای نشان داده واحد ها (افراد) بر روی یک نمودار پراکندگی است.

 

 

اگر داده هایی دhرید و می خواهید آن ها را با نرم افزار Spss تحیلیل کنید می توانید با قیمتی بسیار پاین و کیفیت بالا آن از ما بخواهید.

تجزیه و تحلیل داده ها با نرم افزار Spss

 

آموزش Spss (جدول فراوانی )

  • تفاوت درصد و درصد معتبر در جدول فراوانیspss:

  • درصد یعنی درصد ازافراد که در نمونه آورده شده اند و شامل میزینگ(از دست رفته) هم می شود. ولی درصد معتبر درصد افرادی است که به سوال ما پاسخ داده اند و شامل میزینگ نمی شود . بنابراین درصد بر اساس کل نمونه مورد مطالعه حساب می شود و درصد معتبر بر اساس تعداد کل افرادی که به سوال ما جواب داده اند.دصد معتبر یا برابر با درصد یا بزگتر از آن است. اگر بدون پاسخ نداشته باشیم درصد معتبر برابر درصد است و اگر بدون پاسخ داشته باشیم همواره از آن بیشتر است.

تحلیل واریانس چندعاملی (MANOVA):

از این آزمون به منظور بررسی اختلاف چند میانگین از چند جامعه آماری استفاده می شود. در طرح هایی که بیش از یک متغیر وابسته وجود دارد می تواند اثرات یک یا تعداد بیشتری از متغیرهای مستقل و تعامل بین متغیرهای مستقل را بررسی کند. در حالیکه Anova می تواند فقط زمانی که یک متغیر وابسته وجود دارد به کار رود. این تحلیل می تواند به طور همزمان چندین متغیر وابسته را بررسی کند. در manova حق انتخاب چهار آزمون یکی از چهار آزمون: ۱- آزمون اثر پیلایی ۲- آزمون اثر هلتینگ ۳- آزمون لامبدای ویکس و ۴- آزمون بزرگترین ریشه روی، وجود دارد.

مثال: آیا بین نمرات ادبیات و زبان دانش آموزان ۳ مدرسه متفاوت، تفاوت وجود دارد.      ( ادبیات و زبان دو متغیر وابسته، نوع مدرسه متغیر گروهبندی «مستقل»)

{یعنی نوع مدرسه بر نمرات ادبیات و زبان تأثیر دارد}.

توجه: باید قبل از مانوا همبستگی متغیر های وابسته بررسی شود.  اگر همبستگی متغیرهای وابسته معنی دار بود نمی توان از مانوا استفاده کرد.

مسیر  SPSS:

Analyze/General liner model/ multivariate ….

در کادر بازشده متغیرهای وابسته را به قسمت Dependent Variable  و عامل (ها) را در صورتی که تثبیت شده باشند به قسمت Fixed Factor(S) می بریم و در صورتی که هرکدام از آن ها تصادفی بودند به قسمت Random Factor(S) می بریم و اگر متغیر تصادفی کمکی داشتیم و خواستیم اثرش حذف شود  به Covarait(Sمی بریم.

{ توجه:  با این انتخاب یعنی Mancova را نیز انجام داده ایم} سپس با زدنOK خروجی ظاهر می شود.

 

دسترسی به انواع پرسشنامه های استاندارد، با روایی،  پایایی، روش نمره گذاری و منابع معتبر

تجزیه و تحلیل داده های آماری با نرم افزار پیشرفته SPSS

مبانی نظری و پژوهشی متغیر های مختلف

مطالب متنوع روش تحقیق، مدیریت و …

انواع  پاورپونت

عضویت در کانال تلگرام

 

تحلیل ممیزی یا تشخیصی Discriminant Analysis

 

تحلیل تشخیص یکی از روش های تحلیل خوشه ای است که به تحلیل ممیزی نیز معروف است. در این تحلیل، هر داده در یکی از خوشه ها قرار می گیرد و محقق به دنبال آن است که تشخیص دهد آیا یک داده درست رده بندی شده است یا خیر. این تحلیل مشابه رگرسیون چندگانه است، با این تفاوت که در رگرسیون چندگانه، متغیر وابسته همیشه یک متغیر کمّی و دارای توزیع نرمال است. در حالی که در اینجا متغیر وابسته نه تنها توزیع نرمال ندارد، بلکه یک متغیر کیفی با سطوح محدود (رسته ای) است. در حالت خاصی که متغیر وابسته دو مقداری باشد، رگرسیون لجستیک مورد استفاده قرار می گیرد. اما اگر متغیر وابسته بیش از دو مقدار بگیرد، باید از روش تحلیل تشخیص استفاده کرد. 

توابع تحلیل تشخیصی که جزو گروه (GLM) یا همان مدل های خطی عمومی لحاظ می گردند، در واقع همانند تابع رگرسیون لجستیک نوعی ترکیب وزنی هستند که به منظور پیش بینی عضویت یک فرد یا موضوع مورد بررسی در یکی از چند گروه ممکن بکار می روند. با این تفاوت که در تحلیل تشخیصی متغیر مستقل حتماً باید دارای مقیاس فاصله ای یا نسبتی بوده و در آن نمی توان متغیرهای دارای مقیاس ترتیبی یا اسمی را وارد نمود. متغییر وابسته نیز مانند رگرسیون لجستیک می تواند اسمی یا ترتیبی باشد. همچنین تفاوت این تحلیل با تحلیل واریانس چند متغیره در این است که در تحلیل واریانس این متغیر وابسته است که حالت کمی داشته و متغیر(های) مستقل حالت کیفی یا مقوله ای دارند. پیشنهاد می گردد که حجم نمونه مورد استفاده در تحلیل تشخیص حداقل ۲۰ برابر تعداد متغیرهای مستقل باشد. معادله تحلیل تشخیصی را می توان همانند معادله رگرسیون چند متغیره بصورت زیر نوشت:

Yi = a + b1X1 + b2X2 + . . . + bnXn 

مسیر انجام تحلیل ممیزی در SPSS

Analyze/ Classify/Discriminant 

 

آزمون های پیش بینی متغیر ها

آزمون های پیش بینی متغیر ها

 

نوع متغیر ها

تعداد متغیرهای وابسته

تعداد متغیرهای مستقل

مدل تحلیل

مشاهده شده

یک

یک

رگرسیون ساده

مشاهده شده

یک

چند

رگرسیون چندگانه

مشاهده شده

چند

چند

تحلیل مسیر

مکنون

چند

چند

معادلات ساختاری

برای انجام تجزیه و تحلیل آماری و فصل ۴ پایان نامه با قیمت پایین و کیفیت بالا کلیک بفرمائید.

تحلیل آماری و فصل ۴ پایان نامه

 

داده گمشده چیست؟

داده گمشده [۱] چیست؟

مشاهدات گمشده چالش مهمی را به دنبال دارد، زیرا پروسه های مدل بندی به راحتی این موارد را از تحلیل کنار می گذارند. هنگامی که این مقادیر گمشده اندک هستند (چیزی کمتر از ۵ درصد از کل مشاهدات) و اگر بتوان گمشدگی آنها را بصورت تصادفی در نظر گرفت، یعنی گمشده ها به مقادیر دیگر بستگی نداشته باشند، آنگاه روش متداول حذف listwise روشی نسبتاً قابل اعتماد خواهد بود. پروسه ی Missing values علاوه بر اینکه می تواند ما را نسبت به استفاده از روش حذف listwise مطمئن گرداند، روش های دیگری نیز برای کار با داده های گمشده هنگامی که این روش معتبر نیست، ارائه می کند.

تحلیل Missing values مجموعه ای از ابزارهای نسبتاً متفاوت و روش های متنوعی از جانهی منفرد  را برای تحلیل داده های گمشده فراهم می آورد. یادآور می شویم که روش جانهی چندگانه (multiple imputation) به مراتب برتر از روش جانهی منفرد (single imputation) است.

تحلیل Missing Value

پروسه ی تحلیل Missing Value از سه دستورالعمل اولیه زیر پیروی می کند:

  • تشریح الگوی گمشدگی داده ها. اینکه مقادیر گمشده در کجا واقع شده اند؟ میزان گستردگی آنها تا چه اندازه است؟ آیا جفت متغیرهای یک مشاهده (Case) دارای مقادیر گمشده است؟ آیا این مقادیر گمشده در نقاط حدی (نقاط ابتدایی و انتهایی) واقع شده است؟ آیا گمشدگی بصورت تصادفی اتفاق افتاده است؟

  • برآورد میانگین ها، انحراف معیارها، کوواریانس ها و همبستگی ها برای روش های مختلف مقادیر گمشده (listwise, pairwise, regression, EM).

  • جانهی مقادیر گمشده با استفاده از برآورد این مقادیر با بهره از روش های رگرسیونی و الگوریتم

تحلیل Missing Value به ما در مقابله با نگرانی هایی که بواسطه ی داده های ناکامل بوجود می آید کمک می کند. اگر مشاهدات دارای مقادیر گمشده بصورت منظم و سیستماتیک متفاوت از مشاهدات بدون گمشدگی باشند، نتایج گمراه کننده خواهد بود. گذشته از این داده های گمشده دقت محاسبات آماری را به دلیل از دست دادن پاره ای از اطلاعات کاهش می دهد. نگرانی دیگر، فرضیاتی است که در پشت هر پروسه ی آماری وجود دارد، زیرا اکثر این فرضیات تنها در خصوص مشاهدات کامل برقرار است و مقادیر گمشده نیازمند تئوری های پیچیده تری خواهد بود.

برای انجام تجزیه و تحلیل آماری و فصل ۴ پایان نامه با قیمت پایین و کیفیت عالی کلیک بفرمائید.

تحلیل آماری و فصل ۴ پایان نامه

 

[۱]Missing data

جدول خلاصه آزمون های بررسی رابطه دو متغیر

آزمون های بررسی رابطه دو متغیر

در spss  را بطه  دو متغیر، اگر داده ها غیر نرمال یا اینکه متغیر ها در سطح اسمی و رتبه ای اندازه گیری شده باشند  از جداول دو بعدی برای بررسی رابطه استفاده می شود. البته اگر متغیر مستقل اسمی و وابسته فاصله ای یا نسبی باشد از آزمون های مقایسه ای (مانند تی تست و  تحلیل واریانس ) استفاده می شود   و اگر داده ها نرمال، رابطه خطی و هردو متغیر فاصله ای یا نسبی و مستقل  باشند از ضریب همبستگی پیرسونr  استفاده می شود و وقتی رابطه معنا دار و شدت آن بالا باشد برای پیش بینی متغیر وابسته از روی متغیر مستقل از رگرسیون استفاده می شود.  خلاصه این انتخاب ها در جدول زیر قابل مشاهده است.

سطح سنجش متغیر ها

آزمون آماری

متغیر مستقل

متغیر وابسته

اسمی

اسمی

خی دو ،فی،وی کرامر،لاندا

اسمی

ترتیبی

خی دو ،فی،وی کرامر،لاندا

اسمی

فاصله ای یا نسبی

تی تست، تحلیل واریانس یک طرفه

ترتیبی

اسمی

خی دو ،فی،وی کرامر،لاندا

ترتیبی

ترتیبی

گاما،تائوکندال،دی سامرز،رو اسپیرمن

ترتیبی

فاصله ای یا نسبی

تائوکندال ،رو اسپیرمن تی تست، تحلیل واریانس یک طرفه

فاصله ای یا نسبی

اسمی

خی دو ،فی،وی کرامر،لاندا

فاصله ای یا نسبی

ترتیبی

گاما،تائوکندال،دی سامرز،رو اسپیرمن

فاصله ای یا نسبی

فاصله ای یا نسبی

پیرسون،رگرسیون

 

برای انجام تجزیه و تحلیل آماری و فصل ۴ پایان نامه با قیمت پایین و کیفیت عالی کلیک بفرمائید.

تحلیل آماری و فصل ۴ پایان نامه

سطح معنی داری(Level of Significance)

سطح معنی داری(Level of Significance)

   موقعی که فرضیه ای را تنظیم می کنیم، باید با استفاده از آزمون های آماری مناسب، صحت یا سقم آن را در سطح خطای معین تعیین کنیم.

   سطح معنی داری، که در نرم افزارSPSS به اختصار با (Sig.)نشان داده می شود، میزان خطایی است که در رد فرض صفر(H) مرتکب می شویم. سطح معنی داری در علم آمار به P- value (مقدار احتمال) معروف است که معمولاً نیز در هنگام نگارش گزارش تحقیق، از همین علامت P استفاده می کنیم. در تفسیر نتایج هر آزمونی، اعم از پارامتری و ناپارامتری، هر چه مقدارSig. کوچک تر باشد، رد فرض صفر ساده تر است.    آلفا(α)سطح خطایی است که محقق در نظر می گیرد (مقدار آلفا معمولاً ۰۵/۰ یا ۵ صدم است). بسیاری از محققین در تمایز دو مفهوم Sig.و αاز همدیگر دچار اشتباه می شوند. در این خصوص باید گفت که α میزان خطای در نظر گرفته شده محقق و Sig. میزان خطای محاسبه شده در رد فرض H. است. به طور کلی، می توان گفت:
رد فرض H.و پذیرش فرض  H1 → (۰/۰۵)α>(P)Sig.
پذیرش فرض H.و رد فرض  H1 → (۰/۰۵)α≤ (P)Sig.
   برای این که با استفاده از سطح معنی داری به دست آمده برای هر آزمون، بتوانیم فرض H. را رد یا تأیید کنیم، تعیین معنی داری در دو سطح امکان پذیر است. یعنی این که می توانیم معنی داری یا عدم معنی داری هر آزمونی را در دو سطح تعیین و سپس بر اساس آن به قضاوت بپردازیم:

۱- سطح معنی دای کوچک تر از ۰۱/۰: در این سطح معنی داری، با ۹۹% سطح اطمینان و خطای ۰۱/۰ فرضH.رد می شود. این سطح به معنای واقعی نبودن رابطه در یک نمونه از هر ۱۰۰ نمونه می باشد. یعنی فقط یک نمونه از هر ۱۰۰ نمونه بر حسب تصادف به رابطه مشاهده شده در نمونه ما می کشد (دواس، ۱۳۷۶: ۱۹۱). چنان چه بتوانیم فرضH. را در سطح معنی داری ۰۱/۰ رد کنیم، در آن صورت دقت برآورد پارامتر جامعه از آماره نمونه بیش تر است.

۲- سطح معنی داری کوچک تر از ۰۵/۰: در این سطح معنی داری، با ۹۵% سطح اطمینان و خطای ۰۵/۰ فرضH. رد می شود. این سطح بدین معناست که فقط ۵ نمونه از هر ۱۰۰ نمونه بر حسب تصادف به رابطه مشاهده شده در نمونه ما می کشد (دواس، ۱۳۷۶: ۱۹۱). بنابراین، سطح اطمینان رد فرضH. در این سطح معنی داری، کم تر از سطح ۰۱/۰ است. در علم آمار و همچنین نرم افزار SPSS، برای رد یا قبول فرضH.، سطح ۰۵/۰ به عنوان مبنا در نظر گرفته می شود.

   نکته: بنابراین، ممکن است یک فرض صفر (H.) در یک سطح خطا، مثلاً ۰۱/۰، معنی دار نباشد، ولی در سطح ۰۵/۰، معنی دار باشد. از این رو، انتخاب سطح معنی داری در رد یا تأیید (H.) عامل بسیار مهمی در رد فرض H. است (اقتباس از مومنی، ۱۳۸۶: ۶۶-۶۵) و تعیین این امر به عهده خود محقق می باشد.

منبع: راهنمای جامع کاربرد SPSS در تحقیقات پیمایشی. کرم حبیب پور و رضا صفری