داده کاوی و آیتم های پرتکرار - نسخهی قابل چاپ |
داده کاوی و آیتم های پرتکرار - fo-eng - 20 آبان ۱۳۹۴ ۰۲:۱۱ ق.ظ
سلام. وقت بخیر. دوستان من دارم روی یکسری آیتم های پرتکرار کار می کنم. خب تا اینجا می دونم که باید از الگوریتم آپریوری یا apriori کار کنم. البته کار من با نرم افزار weka هست. کسی هست بهم کمی کمک کنه! من داده ها رو وارد نرم افزار می کنم ولی خب باید کاری کنم که تعداد تکرار هر کلمه رو مشخص کنه! کسی بلد هست؟ با استفاده از فیلترها هم کردم و نشد! |
RE: داده کاوی و آیتم های پرتکرار - fo-eng - 20 آبان ۱۳۹۴ ۰۱:۲۶ ب.ظ
(۲۰ آبان ۱۳۹۴ ۱۲:۲۹ ب.ظ)Aurora نوشته شده توسط: از همون صفحه ی اول وکا سپاسگذارم عزیزم. راستش این کار رو کردم ولی متاسفانه نمی شه. به دلیل اینکه عددهای من به این شکل هستند ۱۲ ۱۵ ۱۸ ۲۳ ۱۹ این میاد هر سطر رو بررسی می کنه و می بینه که چند بار تکرار شده و تعداد تکرارش رو میگه که اکثرا هم یک هست در صورتی که باید هر عدد رو مشخص کنه و بعد تکرارش رو بگه! میشه ما توی وکا کار کنیم که این بیاد هر عدد رو مشخص کنه یا باید بازم برم سراغ برنامه نویسی!؟ بعد تصویر رو هم برای من نمی یاره! نمی دونم مشکل از سیستم من هست یا خیر؟ |
RE: داده کاوی و آیتم های پرتکرار - fo-eng - 20 آبان ۱۳۹۴ ۰۴:۲۵ ب.ظ
(۲۰ آبان ۱۳۹۴ ۰۲:۱۶ ب.ظ)Aurora نوشته شده توسط: باید درست کار کنه.عذرخواهی می کنم من ویندوزم رو تازه عوض کردم و صفحه رو باز نمی کنه! این لینک کل داده ها خدمت شما: مهمان عزیز شما قادر به مشاهده پیوندهای انجمن مانشت نمیباشید. جهت مشاهده پیوندها ثبت نام کنید. |
داده کاوی و آیتم های پرتکرار - fo-eng - 20 آبان ۱۳۹۴ ۰۶:۱۷ ب.ظ
آره. دقیقا باید روی همین ها کار کنیم. |
داده کاوی و آیتم های پرتکرار - fo-eng - 20 آبان ۱۳۹۴ ۱۰:۰۶ ب.ظ
چون حجم کار زیاد هست باید کمی منتظر بمونیم. ولی بازم وقتی وارد وکا میشه در قسمت پایین که شما چند سطر ویژگی داشتید (age , ...) واسه این کار یک ستون بیشتر نداره! والا یکی از دوستانم هم از این روشی که شما بالا گفتید انجام داد و تکرار هر عدد رو گفت منتهی من درست و حسابی ندیدم ولی همین stringtowordvector رو زد! |
داده کاوی و آیتم های پرتکرار - fo-eng - 20 آبان ۱۳۹۴ ۱۱:۲۴ ب.ظ
خب روش حل این گونه مساله ها میشه قوانین انجمنی! الگوریتم apriori هم شامل این میشه ... توی الگوریتم آپریوری ما باید بیاییم اول یک آیتمی ها رو حذف کنیم. بعد دو آیتمی ها رو و ... همین طور بریم جلو! واسه همین باید تعداد تکرارش مشخص شه! |