در بسیاری از رشته های علمی و فنی، در نهایت ما با مجموعه ای از داده ها روبرو هستیم که حجم کم یا زیادی را دارند؛ اما مهم ترین کار، به دست آوردن چنین پایگاه داده ای نیست. بلکه باید بتوانیم، سطح بالاتری از دانش را با توجه به پایگاه داده مذکور به دست بیاوریم؛ این یعنی نتیجه گیری و جمع بندی تمام تلاش هایی که برای جمع آوری آن داده ها صرف شده است.
اکثر دانشمندان و محققین سرشناس هر رشته علمی یا فنی، در کنار عامل خلاقیت و تخصص، یک ویژگی مشترک و بسیار مهم دارند، و آن نتیجه گیری های مهمی است که از مشاهدات و داده های جمع آوری شده ارائه کرده اند. در رشته های مختلف علمی، نظریه های بسیار مهمی که با مطالعات میدانی به دست آمده اند، همگی دارای این مولفه مشترک هستند: به دست آوردن قواعد و قوانینی که توضیحی فشرده و مفهومی از داده های در دسترس را ارائه می دهند. این عملیات، و مجموعه دیگری از کارهای مرتبط با آن، موضوع بحث یکی از زیر شاخه های مشترک علوم کامپیوتر و آمار، به نام داده کاوی یا Data Mining است. فرآیند کلی استخراج دانش از داده، معنای عام تری از داده کاوی را در بر دارد که به Knowledge Discovery from Data یا KDD معروف است.
تشخیص داده های پرت می تواند به عنوان یک مرحله پیش پردازش در مسیر داده کاوی، و یا مستقلا به عنوان یک عملیات داده کاوی مطرح شود. روش های متعددی برای تشخیص داده های پرت وجود دارد، که در فیلم آموزشی تشخیص داده های پرت، سعی شده است مروری کلی بر روی این موارد انجام شود و در نهایت یک مورد که کاربرد بیشتری دارد، یعنی آنالیز مبتنی بر معیار T2 مفصلا مورد بررسی واقع شده است و در محیط متلب پیاده سازی شده است.
ادامه توضیحات و فیلم آموزشی در لینک زیر می باشد:
مهمان عزیز شما قادر به مشاهده پیوندهای انجمن مانشت نمیباشید. جهت مشاهده پیوندها ثبت نام کنید.