(۲۹ دى ۱۳۹۶ ۱۲:۲۷ ب.ظ)gogooli نوشته شده توسط: f - measure به چه دردی می خوره؟
بحث خیلی جامعی هست و اگه بخوایم خیلی به دقت بررسی کنیم، جزئیات، ظرایف و پیچیدگیهای مفهومی زیادی داره، اما به صورت کلی و خلاصه عموما تو بحث
سیستمهای بازیابی اطلاعات مطرح میشه و زمانیکه بخوایم ارتباط بین نیازهای کاربران و اون چیزی که سیستم به عنوان پاسخ ارائه میده رو تحلیل کنیم و بر این اساس میزان اثربخشی اون سیستم بازیابی اطلاعات رو تعیین کنیم، مثلا میزان موفقیت Google و Bing در ارائه و رتبهبندی نتایج و ارتباط اون با نیاز کاربر. به صورت خیلی ساده فرضا ما میایم یک پرس و جویی (Query) رو حالا تو یک سیستم اطلاعاتی طرح میکنیم و طبیعتا یه سری نتایج به دست میاد، اما این نتایج چقدر به خواسته ما نزدیک بود؟ در واقع هدف اینه که ما بیایم و میزان "ارتباط" یا "ربط" این دو (۱/ نتایج مورد انتظار و ۲/ نتایج به دست اومده) رو به عنوان یک معیار سنجش موفقیت در نظر بگیریم و ببینیم چقدر بین نیاز کاربر و خروجی سیستمهای اطلاعاتی تطابق هست.
حالا برای سنجش این ارتباط ما معیارهای مختلفی بر حسب نوع سیستم و کاربرد مورد انتظار داریم که یکی از اونها F-Measure هست. حالا برای اینکه بخوایم ببینم دقیقا کار معیار F چطوری هست نیاز به دو تا معیار پیش نیاز به نامهای
بازیافت (Recall) و
دقت (Precision) داریم که تو یک مفهوم عام اولی به معنی پاسخهای بازیابی شده (خروجی) و دومی به معنی پاسخهای واقعی و مورد انتظار مرتبط با پرس و جو هست که دو تا فرمول مخصوص به خودشون رو دارند که در واقع میتونن به تنهایی ارتباط مورد نظر ما رو ارزیابی کنند.
اما بعدها یک مورد سنجش سومی هم به نام
F-Measure برای سنجش این میزان ارتباط تو سیستمهای اطلاعاتی ایجاد شد که هدفش گرفتن یک میانگین توافقی یا هارمونیک (در محدوده صف و یک) بین دو معیار بالا (Recall و Precision) و در واقع برقراری یک تعادل کیفی یا اینطور بگم به دست آوردن بهترین حالت ممکن بین این دو هست که خب همونطور که در فرمول F-Measure هم میبینیم دادههای ورودی بر حسب میزان دو معیار بالاست.