تحلیل خوشه ای (خوشه بندی) (Cluster Analysis)
تجزیه و تحلیل خوشه ای، یک روش آماری برای گروه بندی داده ها یا مشاهدات، با توجه به شباهت یا درجه نزدیکی آنها است. از طریق تجزیه و تحلیل خوشه ای داده ها یا مشاهدات به دسته های همگن و متمایز از هم تقسیم می شوند. از این روش برای بخش بندی کردن مشتریان بر مبنای شباهت هایشان استفاده می شود. غالبا در تحلیل خوشه ای، تصمیم گیری درباره تعداد خوشه ها بر مبنای ملاک بیزی و ملاک آکائیکه گرفته می شود. جوابی در سطح حد اقل ملاک بیزی و ملاک آکائیکه به دست می آید، می تواند معرف بهترین تعادل موجود بین دقت و پیچیدگی باشد که مهم ترین تاثیرات را در نظر بگیرد و اهمیت آنها را کم نشان ندهد. همچنین، راه دیگر برای تصمیم گیری در زمینه تعداد خوشه ها، استفاده از نسبت فاصله می باشد. بهینه ترین تعداد خوشه ها هنگامی است که تغییری بزرگ در نسبت فاصله مشاهده می گردد.
اصطلاح تحلیل خوشه ای اولین بار توسط Tryon در سال ۱۹۳۹ برای روش های گروه بتدی اشیائی که شبیه بودند مورد استفاده قرار گرفت. تجزیه خوشه ای ابزار میانبر تحلیل داده هاست که هدف آن نظم دادن به اشیا مختلف به گروه هایی که درجه ارتباط بین دو شئی اگر آنها به یک گروه تعلق داشته باشند حداکثر و در غیر این صورت حداقل است. به عبارت دیگر تحلیل خوشه ای ساختار داده ها را بدون توضیح اینکه چه وجود دارد را نشان می دهد.
تحلیل خوشه ای یک ابزار اکتشاف است و نتایج آن ممکن است ۱)در تعریف یک طرح طبقه بندی مانند رده بندی حیوانات، حشرات یا گیاهان مفید باشد. ۲)قواعدی برای اختصاص موارد جدید به طبقه ها به منظور شناسایی و تشخیص به دست دهد. ۳)حدود تعریف، اندازه و تنوغ و تعریف برای آنچه قبلا به شکل مفاهیم وسیعی بوده است، فراهم آورد. ۴) نمونه هایی برای معرفی طبقه ها بیاید. ۵)مدل آماری برای توصیف جامعه ارائه دهد.
مفاهیم فاصله و تشابه از مفاهیم اساسی تحلیل خوشه ای است. فاصله اندازهای است که نشان می دهد دو مشاهده تا چه حد جدا از یکدیگرند. در حالی که تشابه شاخص نزدیکی آنها با یکدیگر است. پژوهشگر قبل از تحلیل، نخست باید یک مقیاس کمی را که بر پایه همخوانی(تشابه) بین مشاهدهها اندازه گرفته می شود را انتخاب کند. این شاخص ها با توجه به الگوریتم تشکیل خوشه، ماهیت متغیر ها(پیوسته، گسسته یا دو ارزشی) و مقیاس اندازه گیری انتخاب می شوند.
مثال های از تحلیل خوشه ای:
- اگر بخواهیم کشورها را بر حسب شاخص های فرهنگی و اقتصادی طبقه بندی کنیم.
- اگر بخواهیم کلان شهر ها را بر حسب شاخص های بهداشتی و آموزشی طبقه بندی کنیم.
- اگر بخواهیم افراد را بر اساس ویژگی های شخصیتی طبقه بندی کنیم.
اولین کار برای تحلیل خوشه ای نشان داده واحد ها (افراد) بر روی یک نمودار پراکندگی است.
اگر داده هایی دhرید و می خواهید آن ها را با نرم افزار Spss تحیلیل کنید می توانید با قیمتی بسیار پاین و کیفیت بالا آن از ما بخواهید.
تجزیه و تحلیل داده ها با نرم افزار Spss