در بسیاری از رشته های علمی و فنی، در نهایت ما با مجموعه ای از داده ها روبرو هستیم که حجم کم یا زیادی را دارند؛ اما مهم ترین کار، به دست آوردن چنین پایگاه داده ای نیست. بلکه باید بتوانیم، سطح بالاتری از دانش را با توجه به پایگاه داده مذکور به دست بیاوریم؛ این یعنی نتیجه گیری و جمع بندی تمام تلاش هایی که برای جمع آوری آن داده ها صرف شده است.
اکثر دانشمندان و محققین سرشناس هر رشته علمی یا فنی، در کنار عامل خلاقیت و تخصص، یک ویژگی مشترک و بسیار مهم دارند، و آن نتیجه گیری های مهمی است که از مشاهدات و داده های جمع آوری شده ارائه کرده اند. در رشته های مختلف علمی، نظریه های بسیار مهمی که با مطالعات میدانی به دست آمده اند، همگی دارای این مولفه مشترک هستند: به دست آوردن قواعد و قوانینی که توضیحی فشرده و مفهومی از داده های در دسترس را ارائه می دهند. این عملیات، و مجموعه دیگری از کارهای مرتبط با آن، موضوع بحث یکی از زیر شاخه های مشترک علوم کامپیوتر و آمار، به نام داده کاوی یا Data Mining است. فرآیند کلی استخراج دانش از داده، معنای عام تری از داده کاوی را در بر دارد که به Knowledge Discovery from Data یا KDD معروف است.
در فیلم آموزشی روش های پیش پردازش داده ها برای شروع فرایند داده کاوی مورد بررسی واقع شده اند. برای نتیجه گیری بهتر از بسیاری از الگوریتم های داده کاوی، لازم است تغییرات و یا اصلاحاتی بر روی داده های خام انجام شوند، تا کیفیت الگوها و قواعد کاوش شده از داده ها، به بیشترین حد ممکن افزایش یابد.
ادامه متن و فیلم آموزشی در این
مهمان عزیز شما قادر به مشاهده پیوندهای انجمن مانشت نمیباشید. جهت مشاهده پیوندها ثبت نام کنید.
می باشد.