تالار گفتمان مانشت
داده کاوی و آیتم های پرتکرار - نسخه‌ی قابل چاپ

داده کاوی و آیتم های پرتکرار - fo-eng - 20 آبان ۱۳۹۴ ۰۲:۱۱ ق.ظ

سلام. وقت بخیر.
دوستان من دارم روی یکسری آیتم های پرتکرار کار می کنم. خب تا اینجا می دونم که باید از الگوریتم آپریوری یا apriori کار کنم.
البته کار من با نرم افزار weka هست. کسی هست بهم کمی کمک کنه!
من داده ها رو وارد نرم افزار می کنم ولی خب باید کاری کنم که تعداد تکرار هر کلمه رو مشخص کنه! کسی بلد هست؟ با استفاده از فیلترها هم کردم و نشد!

RE: داده کاوی و آیتم های پرتکرار - fo-eng - 20 آبان ۱۳۹۴ ۰۱:۲۶ ب.ظ

(۲۰ آبان ۱۳۹۴ ۱۲:۲۹ ب.ظ)Aurora نوشته شده توسط:  از همون صفحه ی اول وکا
در قسمت filter
filter رو باز کنید
unsupervised
بعد هم
stringtowordvector
رو انتخاب کنید
این گزینه تعداد تکرار کلمات رو میده.
بعد از اینکه این گزینه رو انتخاب کردید و برگشت رو صفحه اصلی اگر مثل شکل زیر رو تصویر کلیک کنید تنظیماتشم می تونید عوض کنید.
[تصویر:  389922_j7xuv1gqg1q17otjctb5.png]

سپاسگذارم عزیزم.
راستش این کار رو کردم ولی متاسفانه نمی شه.
به دلیل اینکه عددهای من به این شکل هستند
۱۲ ۱۵ ۱۸ ۲۳ ۱۹
این میاد هر سطر رو بررسی می کنه و می بینه که چند بار تکرار شده و تعداد تکرارش رو میگه که اکثرا هم یک هست در صورتی که باید هر عدد رو مشخص کنه و بعد تکرارش رو بگه!
میشه ما توی وکا کار کنیم که این بیاد هر عدد رو مشخص کنه یا باید بازم برم سراغ برنامه نویسی!؟
بعد تصویر رو هم برای من نمی یاره! نمی دونم مشکل از سیستم من هست یا خیر؟

RE: داده کاوی و آیتم های پرتکرار - fo-eng - 20 آبان ۱۳۹۴ ۰۴:۲۵ ب.ظ

(۲۰ آبان ۱۳۹۴ ۰۲:۱۶ ب.ظ)Aurora نوشته شده توسط:  باید درست کار کنه.
میشه چند تا سطر اول داده ها رو اینجا بزاری.
عکسی که مشکل داره:

مهمان عزیز شما قادر به مشاهده پیوندهای انجمن مانشت نمی‌باشید. جهت مشاهده پیوندها ثبت نام کنید.
عذرخواهی می کنم من ویندوزم رو تازه عوض کردم و صفحه رو باز نمی کنه! این لینک کل داده ها خدمت شما:

مهمان عزیز شما قادر به مشاهده پیوندهای انجمن مانشت نمی‌باشید. جهت مشاهده پیوندها ثبت نام کنید.


داده کاوی و آیتم های پرتکرار - fo-eng - 20 آبان ۱۳۹۴ ۰۶:۱۷ ب.ظ

آره. دقیقا باید روی همین ها کار کنیم.

داده کاوی و آیتم های پرتکرار - fo-eng - 20 آبان ۱۳۹۴ ۱۰:۰۶ ب.ظ

چون حجم کار زیاد هست باید کمی منتظر بمونیم. ولی بازم وقتی وارد وکا میشه در قسمت پایین که شما چند سطر ویژگی داشتید (age , ...) واسه این کار یک ستون بیشتر نداره!
والا یکی از دوستانم هم از این روشی که شما بالا گفتید انجام داد و تکرار هر عدد رو گفت منتهی من درست و حسابی ندیدم ولی همین stringtowordvector رو زد! Sad

داده کاوی و آیتم های پرتکرار - fo-eng - 20 آبان ۱۳۹۴ ۱۱:۲۴ ب.ظ

خب روش حل این گونه مساله ها میشه قوانین انجمنی!
الگوریتم apriori هم شامل این میشه ... توی الگوریتم آپریوری ما باید بیاییم
اول یک آیتمی ها رو حذف کنیم.
بعد دو آیتمی ها رو
و ...
همین طور بریم جلو!
واسه همین باید تعداد تکرارش مشخص شه!