تالار گفتمان مانشت
صحت الگوریتم های خوشه بندی - نسخه‌ی قابل چاپ

صحت الگوریتم های خوشه بندی - AmiriManesh - 18 خرداد ۱۳۹۳ ۰۱:۲۸ ب.ظ

با سلام
دوستانی که داده کاوی خوندن، من یک سوال داشتم:
صحت الگوریتم های خوشه بندی متفاوت چطور سنجیده میشه؟ برای مثال در صورتی که من یک دیتاست داشته باشم و یک الگوریتم خوشه بندی رو روی اون اعمال کنم، از کجا میتونم متوجه بشم که چقدر خوشه بندی که این الگوریتم انجام داده، درست بوده؟ در واقع درصد صحت اون چقدر بوده؟ (البته این رو هم میدونم که این بررسی میزان صحت، در الگوریتم نظارت شده، براحتی میتونه انجام بگیره؛ با تقسیم داده ها به دو گروه داده های آموزشی و داده های آزمایشی و سپس با استفاده از داده های آزمایشی میزان صحت بررسی میشه.)

منتظر اطلاعات دوستان هستم.

RE: صحت الگوریتم های خوشه بندی - alirezad - 18 خرداد ۱۳۹۳ ۰۴:۱۳ ب.ظ

(۱۸ خرداد ۱۳۹۳ ۰۱:۲۸ ب.ظ)AmiriManesh نوشته شده توسط:  با سلام
دوستانی که داده کاوی خوندن، من یک سوال داشتم:
صحت الگوریتم های خوشه بندی متفاوت چطور سنجیده میشه؟ برای مثال در صورتی که من یک دیتاست داشته باشم و یک الگوریتم خوشه بندی رو روی اون اعمال کنم، از کجا میتونم متوجه بشم که چقدر خوشه بندی که این الگوریتم انجام داده، درست بوده؟ در واقع درصد صحت اون چقدر بوده؟ (البته این رو هم میدونم که این بررسی میزان صحت، در الگوریتم نظارت شده، براحتی میتونه انجام بگیره؛ با تقسیم داده ها به دو گروه داده های آموزشی و داده های آزمایشی و سپس با استفاده از داده های آزمایشی میزان صحت بررسی میشه.)

منتظر اطلاعات دوستان هستم.

کیفیت یک الگوریتم خوشه بندی بر اساس موارد زیر بررسی میشه:
۱/ قوی بودن رابطه ی شباهت
۲/ پیاده سازی
۳/ توانایی الگوریتم در پیدا کردن الگو های مخفی خفن Wink

معیار های زیر هم هست:
Scalability
Ability to deal with different types of attributes
Ability to handle dynamic data
Discovery of clusters with arbitrary shape
Minimal requirements for domain knowledge to determine input parameters
Able to deal with noise and outliers
Insensitive to order of input records
High dimensionality
Incorporation of user-specified constraints
Interpretability and usability

موفق بایشید

صحت الگوریتم های خوشه بندی - AmiriManesh - 18 خرداد ۱۳۹۳ ۰۶:۳۸ ب.ظ

ممنون جناب Alireza.
چیزهایی که نوشتید مد نظر من نبودن. چون اونها خودشون باز هم جای سوال داره که چطور سنجیده میشن! مثلا این که چه رابطه ی شباهتی رو قوی میدونیم. جوابی که میخواستم رو توی این لینک پیدا کردم:

مهمان عزیز شما قادر به مشاهده پیوندهای انجمن مانشت نمی‌باشید. جهت مشاهده پیوندها ثبت نام کنید.