(۰۱ مهر ۱۳۹۳ ۰۶:۳۵ ب.ظ)sarehkar نوشته شده توسط: ببخشید یه سوال دیگه این روالی که شما نوشتین رو درک کردم ولی چه طوری اشخاص رو تشخیص میدن ؟ صورت انسان رو که نمیشه فقط با این کارها تفکیک کرد ؟ خوردن؟
سلام.
معمولا علم CBIR در مرحله اول به همین تشخیص دسته بندی اشیاء میپردازه. یعنی مثلا اگه شما عکس یه انسان رو دادین باید انتظار استخراج عکس انسان رو داشته باشین یا گل دادین انتظار استخراج گل رو داشت باشین ( جستجوگر گوگل در همین حد فعلا داره کار میکنه). فعلا این حوزه در این حد خوب داره کار میکنه ولی برای فاز دوم که شما گفتین یعنی اگه عکس یه انسان خاص رو دادین همونم انتظار داشته باشیم، میره تو فاز تشابه سازی ریز تشخیص صورت و این موارد که خودش یه فیلد دیگه است و روش های خاصی داره که بسیارم سخته و پیچیده.
(۰۱ مهر ۱۳۹۳ ۰۶:۳۵ ب.ظ)sarehkar نوشته شده توسط: مثلا وقتی اسم یه بازیگر رو مینویسیم انواع و اقسام حالات اون فرد رو میاره این مدل تصاویر از طرف انسان برچسب خوردن؟
سوال خوبی پرسیدین. باید بگم که این نوع استخراج تصاویر رو TBIR
Text Base Image Retrieval بهش میگن که معمولا برای هر عکس یکسری کلمه کلیدی معرفی میشه و وقتی هر یکی از این کلمات در ورودی جستجو قرار میگیره عکس مربوط به اون کلمات کلیدی استخراج میشه. این یه روش قدیمی بود که خب قدرت چندانی نداره و چیزی در مورد فهم ماشین و موارد هوش مصنوع رو اعمال نمیکنه. البته جدیدا تلاش های زیادی با استفاده تکنولوژی امثال آنتولوژی شده که یک سری قدرت تصمیم گیری رو به این حوزه میده. البته اینم باید بگم که خب همین نوع استخراج تصویر خیلی به کار موتورهای جستجوگری مثل گوگل میخوره که بر اساس جستجو متنی کار می کنند.
(۰۱ مهر ۱۳۹۳ ۰۶:۳۵ ب.ظ)sarehkar نوشته شده توسط: آیا غیر از متلب چه چیزهایی تو این کار باید یاد داشته باشیم؟
باید بگم که علم پردازش تصویر بیشتر بر اساس مسایل الگوریتمی کار میکنه و شما باید در واقع ایده پرداز خوبی باشین و تکنولوژی تصاویر رو خوب بشناسید که برای این کارم بله تولباکس بسیاری قوی متلب برای پردازش تصویر معرفی شده که ابزارهای بسیار خوبی در اختیار شما برای پیاده سازی ایده ها بر روی تصویر رو میده.
(۰۱ مهر ۱۳۹۳ ۰۶:۳۵ ب.ظ)sarehkar نوشته شده توسط: اگه مقاله ای بهم معرفی کنین یه دنیا دعاتون میکنم انگلیسی هم بود مشکلی ندارم
مقاله ای رو در پیوست قرار دادم که از روش تشابه سازی بر اساس لبه های مختلف تصاویر کار میکنه و دید خوبی به شما در حوزه
Content Base Image Retrieval میده.