فایل ورد کامل تحقیق تکنیک های طبقه بندی داده کاوی و مروری بر تحقیقات شناسایی الگوهای طراحی از کد منبع ۲۰ صفحه در word


در حال بارگذاری
10 جولای 2025
پاورپوینت
17870
2 بازدید
۷۹,۷۰۰ تومان
خرید

توجه : به همراه فایل word این محصول فایل پاورپوینت (PowerPoint) و اسلاید های آن به صورت هدیه ارائه خواهد شد

 فایل ورد کامل تحقیق تکنیک های طبقه بندی داده کاوی و مروری بر تحقیقات شناسایی الگوهای طراحی از کد منبع ۲۰ صفحه در word دارای ۲۰ صفحه می باشد و دارای تنظیمات در microsoft word می باشد و آماده پرینت یا چاپ است

لطفا نگران مطالب داخل فایل نباشید، مطالب داخل صفحات بسیار عالی و قابل درک برای شما می باشد، ما عالی بودن این فایل رو تضمین می کنیم.

فایل ورد فایل ورد کامل تحقیق تکنیک های طبقه بندی داده کاوی و مروری بر تحقیقات شناسایی الگوهای طراحی از کد منبع ۲۰ صفحه در word  کاملا فرمت بندی و تنظیم شده در استاندارد دانشگاه  و مراکز دولتی می باشد.

توجه : در صورت  مشاهده  بهم ریختگی احتمالی در متون زیر ،دلیل ان کپی کردن این مطالب از داخل فایل ورد می باشد و در فایل اصلی فایل ورد کامل تحقیق تکنیک های طبقه بندی داده کاوی و مروری بر تحقیقات شناسایی الگوهای طراحی از کد منبع ۲۰ صفحه در word،به هیچ وجه بهم ریختگی وجود ندارد


بخشی از متن فایل ورد کامل تحقیق تکنیک های طبقه بندی داده کاوی و مروری بر تحقیقات شناسایی الگوهای طراحی از کد منبع ۲۰ صفحه در word :

بخشی از فهرست مطالب فایل ورد کامل تحقیق تکنیک های طبقه بندی داده کاوی و مروری بر تحقیقات شناسایی الگوهای طراحی از کد منبع ۲۰ صفحه در word

۲-۱-مقدمه    
۲-۲- تکنیک های طبقه بندی    
۲-۲-۱-   طبقه بند C5.0    
۲-۲-۲-  طبقه بند SVM    
۲-۲-۳-  طبقه بند  BOOSTED C5.0    
۲-۴-معیارهای  ارزیابی کارایی    
۲-۵-مروری بر تحقیقات پیشین    
کارهای مرتبط    
فهرست منابع و مآخذ    

بخشی از منابع و مراجع فایل ورد کامل تحقیق تکنیک های طبقه بندی داده کاوی و مروری بر تحقیقات شناسایی الگوهای طراحی از کد منبع ۲۰ صفحه در word

[] Z. Balanyi and R. Ferenc. Mining Design Patterns from C++ Source Code. In Proceedings of the 19th International Conference on Software Maintenance (ICSM 2003), pages 305–۳۱۴ IEEE Computer Society, Sept

[] R. Ferenc, ´A. Besz´edes, L. Fulop, and J. Lele. Design pattern mining enhanced by machine learning. In ICSM, pages 295–۳۰۴, ۲۰۰۵

[] N. Shi and R. A. Olsson, “Reverse engineering of design patterns from java source code,” in ASE’۰۶ Washington, USA: IEEE Computer Society, 2006, pp. 123–۱۳۴

[] N. Tsantalis, A. Chatzigeorgiou, G. Stephanides, and S. T. Halkidis, “Design pattern detection using similarity scoring,” IEEE TSE, vol. 32, no. 11, pp. 896–۹۰۹, ۲۰۰۶

[] G. Antoniol, R. Fiutem, and L. Cristoforetti. Using Metrics to Identify Design Patterns in Object-Oriented Software. In Proceedings of the Fifth International Symposium on Software Metrics (METRICS98), pages 23–۳۴ IEEE Computer Society, Nov

[] M. Zanoni. MARPLE: discovering structured groups of classes for design pattern detection. Master’s thesis, Università degli studi di Milano-Bicocca, Milano, Italy, July

[] M. Zanoni. Data mining techniques for design pattern detection. PhD’s thesis, Università degli Studi di Milano Bicocca,  ۲۰۱۲

[] S. Uchiyama, H. Washizaki, Y.  Fukazawa and A.  Kubo,  Design Pattern Detection using Software Metrics and Machine Learning

[]A. Binun and G. Kniesel. Joining Forces for Higher Precision and Recall of Design Pattern Detection, in proceeding of the 16th conference on software maintenance and reengineering (CSMR2012), March 27-30, Washington, DC, USA, 2012. IEEE Computer society

[] Clementine 12, copyright(c) integral solutions ltd, help-modeling nodes, (1994-2007)

[] J. Han, M. Kamber and J. Pei, Data Mining third edition: concepts and techniques, M. Kaufmann pub,

[] S. Alhusain, S. Coupland, R. John AND M. Kavanagh. Towards Machine Learning Based Design Pattern Recognition. Computational intellingent, (UKCI)

[] Y. Freund AND R.E. Schapire. A Short Introduction to Boosting, Proc. Journal of Japanese Society for Artificial Intelligence, 14(5):771-780, September,

۲-۱-مقدمه

   دراین مقاله مختصری بروی مفاهیم و تعاریف اولیه­ روش­های داده ­کاوی و معیارهای ارزیابی مدل­های پیش بینی کننده خواهیم داشت

۲-۲- تکنیک های طبقه بندی[۱]

در داده­کاوی با دو مجموعه داده مواجه هستیم، داده­ آموزشی و داده آزمایشی. صفات داده­ آموزشی را مجموعه معیارهایی تشکیل می­دهند که هویت موجودیت­های قرارگرفته درر­کورد­ها را پیشگویی می­کنند. موجودیت­های داده­ی آموزشی، مشاهداتی هستند که از قبل هویت­شان شناسایی شده­ است. داده­ی آموزشی حاوی یک ستون پیش­گویی است. مقادیر این ستون، با برچسب­هایی پر می­شوند که هویت اصلی موجودیت­ها را نشان می­دهد (مثلا درست یا غلط). داده­ آزمایشی حاوی مشاهداتی است که هویت اصلیشان شناخته شده نیست. با تجزیه ­و­ تحلیلی که به واسطه­ الگوریتم­های داده­کاوی روی داده­ی آموزشی صورت می­گیرد مدل­هایی ساخته می­شود. مدل­سازی، دانش موجود در مشاهدات داده­ آموزشی را در قالب یک سری قوانین استخراج می­کند. داده­ آزمایشی برای ارزیابی دقت پیش­گویی مدل ساخته شده روی داده­ آموزشی بکار برده میشود. در واقع پیشگویی یک فرایند دو مرحله­ای دارد، فاز یادگیری و فاز دسته­بندی

‌‌‌در فاز یادگیری بر اساس مجموعه داده­ی آموزشی، مدل طبقه­بند ساخته می­شود و در فاز طبقه­بندی بر اساس مدل ساخته شده در فاز قبل، مجموعه داده­ جدید که در فاز یادگیری استفاده نشده است (مجموعه داده آزمایشی) دسته­بندی می­شود (پیش­گویی می­شود که مشاهدات جدید چه برچسبی به خود بگیرند). جهت خودکار سازی  عملگر تصحیح برچسب در این تحقیق، از روش­های داده ­کاوی (الگوریتم­های  طبقه بندی) استفاده شده است [۱۷]

دقت مدل، درصد نمونه­ هایی از مجموعه داده آزمایش است که به درستی طبقه بندی شده­اند. مجموعه داده  لازم جهت ساخت مدل طبقه بندی، از متغیر­های مستقل و وابسته تشکیل شده است. متغیر­های مستقل همان خصیصه­ ها هستند که جهت طبقه بندی متغیر وابسته که در واقع بر چسب کلاس­ها می باشد، مورد استفاده قرار می­گیرند [۱۷]. توضیح مختصری در مورد انواع طبقه ­بندی­هایی که در این تحقیق مورد استفاده قرار گرفته اند در ادامه آمده است

۲-۲-۱-   طبقه بند C

این طبقه بند در واقع براساس تقسیم  مبتنی بر نمونه روی فیلدی که بیشترین سود اطلاعاتی را با خود دارد، کار می­کند. سپس هر زیرنمونه تعریف شده با اولین تقسیم، دوباره تقسیم می­شود (معمولا بر اساس یک فیلد متفاوت). این فرایند تکرار می­شود تا اینکه هیچ زیرنمونه قابل تقسیم نداشته باشیم. سرانجام پایین ترین سطح تقسیم ها دوباره بررسی می شوند. آنهایی که تاثیر قابل توجهی بر مقدار مدل ندارند حذف یا هرس می­شوند  [۱۶]

۲-۲-۲-  طبقه بند SVM

یک طبقه بند و الگوریتم رگرسیون است که از تئوری یادگیری ماشین با حداکثر دقت پیش بینی بدون” اُور فیتینگ[۲] ” داده ها استفاده می­کند. این روش از یک تبدیل غیر خطی بر داده های یادگیری استفاده می­کند، و با جستجوی برای تساوی های رگرسیون در داده­های تبدیل شده کلاس­ها (اهداف) را جدا می­کنند.SVM  خصوصا برای آنالیز داده­ها با تعداد زیادی از فیلد­های پیش گویی کننده مناسب می­باشد [۱۶]

۲-۲-۳-  طبقه بند  BOOSTED C

یک الگوریتم داده­ کاوی است که برای کاهش خطای الگوریتم­های یادگیری  ضعیف (به آرامی به سمت طبقه بندی صحیح میل می­کنند) مورد استفاده قرار می­گیرد و آنها را به یک الگوریتم یادگیری قوی تبدیل می­کند. در این کار برای قدرت بیشتر بخشیدن به الگوریتم تصمیم گیری  C5.0 استفاده شده است [۲۷]

[۱] classification

[۲] Over fitting generally occurs when a model is excessively complex, such as having too many parameters relative to the number of observations

[۳] Confusion matrix

  راهنمای خرید:
  • همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
  • ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
  • در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.