انشالله فعلا که برگه اعزام به خدمتم جلومه D:
یه مقاله میخوندم میگفت حداقل باید حجم پایگاهتون چند ده مگابایت باشه تا اصن بشه اسمشو داده کاوی گذاشت
شما اگه به قول این خارجیا میخواین Forecast ! انجام بدید (مثلا بورس که سود چند ده سال اخیر رو داریم میخوایم سود سال آینده رو حدس بزنیم) نیاز دارید که تا حداقل ده سال قبل رو بگیرید
ولی یه تجربه تلخ دارم میگم اینجا!!! پاکسازی داده ها واقعا پدر آدم رو در میاره حالا شاید داخل اطلاعات دانش آموزا یکم کار راحت تر باشه ولی من واسه دانشجو ها رو داشتمم هزار حالت ممکن داشت
یکی دو ترم مشروط بود
یکی چند ترم مهمانی گرفته بود
و و و
اگه داده زیاد میگیرید باید فکر اینا رو هم کنید که کار بسیار کسل کننده ای میشه البتهه هشتاد نود درصد کار همینه و بعدش دیگه شاید کار یه هفته باشه
حالا پس اگه کاری که میخواید انجام بدید به زمان وابسته باشه ناچارید که ده پونزده سال اخیر رو بگیرید
ولی اگه مثلا مثل من پیش بینی معدل و عوامل موفقیت بود میشه با سه چهار پنج سال اخیر هم کار کرد .فقط هر چی داده بیشتر داشته باشید الگوهای بهتری بدست میاد.
اما واسه اینکه کدوم مقطع کار کنید
خب فکرای متونعی الان داره میاد تو ذهنم !!
به نظرم یه موضوعی بگیرید که نتایجش به چشم بیاد
مثلا اینکه حدس بزنید با توحه به نمره های دبیرستان بهتره کدوم رشته بره تو دانشگاه(به شرطی که داده هاش موجود باشه)
یا اینکه مثلا قبل کنکور بهش بگیم شما رتبت این میشه!
(کلا بپرسید آیا رتبه کنکور بچه ها رو هم دارن یا نه اگه داشته باشن عالی میشه )
واسه بچه های ابتدایی شاید شناسایی ضعفاشون با توحه به نمره های سال اول و دوم خوب باشه
من الان موضوع خوبی واسه بچه دبستانیا به ذهنم نمیاد ولی چون رو موضوع کنکور کارشناسی و دبیرستانیا زیاد کار شده شاید بد نباشه رو داده های بچه های ابتدایی کار کنید به شرط این که موضوع خوبی و هدف مناسبی پیدا کنید
و حالا خلاصه حرفام D: :
احتمالا شما نیاز ندارید داده های بیش از ده سال رو داشته باشید و همین قدر که اطلاعات دانشجوها به اندازه کافی باشه ، مناسبه
اگه موضوعی خوبی واسه دبستانیا گیر آوردین حتما رو اون کار کنید وگرنه روی دبیرستانیاا و موضوعات مربوط به انتخاب رشته و کنکور کار کنید
اووف دهنم کف کرد
اطلاعاتم تموم شد دیگه D:
بازم هر سوالی بود بفرمایید