(۲۰ شهریور ۱۳۹۲ ۰۹:۵۵ ب.ظ)Ghiasoddin نوشته شده توسط: شاید این چندتا نکته بهتون سرنخ بده؛
ابتدا همه صفحات وب در دیتابیس ایندکس میشن و سپس بر اساس لینک هایی که بین صفحات وجود داره یک مدل گرافی (بهش میگن web graph) از کل محیط وب (بخشی که در دیتا بیس ایندکس شده) بدست میاد؛ یعنی هر صفحه رو بگیرید یه گره و لینکهای بین صفحات میشن یالهای گراف وب؛ بعد از این رتبه بندی صفحات در دو تا فاز انجام میشه، یکی آفلاین و یکی آنلاین؛
در فاز آفلاین معروفترین الگوریتمی که استفاده میشه google page rank هست؛ شما باید بعد از اشنایی با این الگوریتم (بسیار ساده است) چندتا از نسخه های بهبود یافته اون رو هم در مطالعات خودتون بیارید (اسم الگوریتم رو سرچ کنید چندتا مقاله survey خوب پیدا میکیند)؛
اما فاز آنلاین (یعنی بعد از اینکه کاربر عبارت مورد جستجوش رو وارد کرد) خودش یه دنیای دیگه است که از هر نوع اطلاعات مفید و جزئی که در صفحه ها و همین کوئری وجود داره استفاده میشه که میتونید با سرچ عبارتی مثل learning to rank algorithms یا ranking algorithms مقاله ها و حتی کتابهای بسیار زیادی رو پیدا کنید (شاید فارسی هم باشه)؛
ممنون بزرگوار از اینکه وقت گذاشتین جواب دادین با همین چند خط ه خیلی کمک کردین بی نهایت ممنون