۰
subtitle
ارسال: #۱
  
صحت الگوریتم های خوشه بندی
با سلام
دوستانی که داده کاوی خوندن، من یک سوال داشتم:
صحت الگوریتم های خوشه بندی متفاوت چطور سنجیده میشه؟ برای مثال در صورتی که من یک دیتاست داشته باشم و یک الگوریتم خوشه بندی رو روی اون اعمال کنم، از کجا میتونم متوجه بشم که چقدر خوشه بندی که این الگوریتم انجام داده، درست بوده؟ در واقع درصد صحت اون چقدر بوده؟ (البته این رو هم میدونم که این بررسی میزان صحت، در الگوریتم نظارت شده، براحتی میتونه انجام بگیره؛ با تقسیم داده ها به دو گروه داده های آموزشی و داده های آزمایشی و سپس با استفاده از داده های آزمایشی میزان صحت بررسی میشه.)
منتظر اطلاعات دوستان هستم.
دوستانی که داده کاوی خوندن، من یک سوال داشتم:
صحت الگوریتم های خوشه بندی متفاوت چطور سنجیده میشه؟ برای مثال در صورتی که من یک دیتاست داشته باشم و یک الگوریتم خوشه بندی رو روی اون اعمال کنم، از کجا میتونم متوجه بشم که چقدر خوشه بندی که این الگوریتم انجام داده، درست بوده؟ در واقع درصد صحت اون چقدر بوده؟ (البته این رو هم میدونم که این بررسی میزان صحت، در الگوریتم نظارت شده، براحتی میتونه انجام بگیره؛ با تقسیم داده ها به دو گروه داده های آموزشی و داده های آزمایشی و سپس با استفاده از داده های آزمایشی میزان صحت بررسی میشه.)
منتظر اطلاعات دوستان هستم.
۰
ارسال: #۲
  
RE: صحت الگوریتم های خوشه بندی
(۱۸ خرداد ۱۳۹۳ ۰۱:۲۸ ب.ظ)AmiriManesh نوشته شده توسط: با سلام
دوستانی که داده کاوی خوندن، من یک سوال داشتم:
صحت الگوریتم های خوشه بندی متفاوت چطور سنجیده میشه؟ برای مثال در صورتی که من یک دیتاست داشته باشم و یک الگوریتم خوشه بندی رو روی اون اعمال کنم، از کجا میتونم متوجه بشم که چقدر خوشه بندی که این الگوریتم انجام داده، درست بوده؟ در واقع درصد صحت اون چقدر بوده؟ (البته این رو هم میدونم که این بررسی میزان صحت، در الگوریتم نظارت شده، براحتی میتونه انجام بگیره؛ با تقسیم داده ها به دو گروه داده های آموزشی و داده های آزمایشی و سپس با استفاده از داده های آزمایشی میزان صحت بررسی میشه.)
منتظر اطلاعات دوستان هستم.
کیفیت یک الگوریتم خوشه بندی بر اساس موارد زیر بررسی میشه:
۱/ قوی بودن رابطه ی شباهت
۲/ پیاده سازی
۳/ توانایی الگوریتم در پیدا کردن الگو های مخفی خفن
معیار های زیر هم هست:
Scalability
Ability to deal with different types of attributes
Ability to handle dynamic data
Discovery of clusters with arbitrary shape
Minimal requirements for domain knowledge to determine input parameters
Able to deal with noise and outliers
Insensitive to order of input records
High dimensionality
Incorporation of user-specified constraints
Interpretability and usability
موفق بایشید
۰
ارسال: #۳
  
صحت الگوریتم های خوشه بندی
ممنون جناب Alireza.
چیزهایی که نوشتید مد نظر من نبودن. چون اونها خودشون باز هم جای سوال داره که چطور سنجیده میشن! مثلا این که چه رابطه ی شباهتی رو قوی میدونیم. جوابی که میخواستم رو توی این لینک پیدا کردم:
مهمان عزیز شما قادر به مشاهده پیوندهای انجمن مانشت نمیباشید. جهت مشاهده پیوندها ثبت نام کنید.
چیزهایی که نوشتید مد نظر من نبودن. چون اونها خودشون باز هم جای سوال داره که چطور سنجیده میشن! مثلا این که چه رابطه ی شباهتی رو قوی میدونیم. جوابی که میخواستم رو توی این لینک پیدا کردم:
مهمان عزیز شما قادر به مشاهده پیوندهای انجمن مانشت نمیباشید. جهت مشاهده پیوندها ثبت نام کنید.
Can I see some ID?
Feeling left out?
نگران نباش، فقط روی این لینک برای ثبت نام کلیک کن. رمزت رو فراموش کردی؟ اینجا به یادت میاریم! close