فایل ورد کامل نمونه برداری هوشمند و یادگیری عملکرد افزایشی برای داده های بسیار بزرگ با ابعاد بالا


در حال بارگذاری
10 جولای 2025
پاورپوینت
17870
5 بازدید
۷۹,۷۰۰ تومان
خرید

توجه : به همراه فایل word این محصول فایل پاورپوینت (PowerPoint) و اسلاید های آن به صورت هدیه ارائه خواهد شد

این مقاله، ترجمه شده یک مقاله مرجع و معتبر انگلیسی می باشد که به صورت بسیار عالی توسط متخصصین این رشته ترجمه شده است و به صورت فایل ورد (microsoft word) ارائه می گردد

متن داخلی مقاله بسیار عالی، پر محتوا و قابل درک می باشد و شما از استفاده ی آن بسیار لذت خواهید برد. ما عالی بودن این مقاله را تضمین می کنیم

فایل ورد این مقاله بسیار خوب تایپ شده و قابل کپی و ویرایش می باشد و تنظیمات آن نیز به صورت عالی انجام شده است؛ به همراه فایل ورد این مقاله یک فایل پاور پوینت نیز به شما ارئه خواهد شد که دارای یک قالب بسیار زیبا و تنظیمات نمایشی متعدد می باشد

توجه : در صورت مشاهده بهم ریختگی احتمالی در متون زیر ،دلیل ان کپی کردن این مطالب از داخل فایل می باشد و در فایل اصلی فایل ورد کامل نمونه برداری هوشمند و یادگیری عملکرد افزایشی برای داده های بسیار بزرگ با ابعاد بالا،به هیچ وجه بهم ریختگی وجود ندارد

تعداد صفحات این فایل: ۳۵ صفحه


بخشی از ترجمه :

چکیده

داده های بسیار بزرگ و با ابعاد بالا امروزه شایع بوده و چالش های جدیدی را بر الگوریتم های داده محور و داده فشرده تحمیل می نمایند. تکنیک های هوش محاسباتی از توانایی بالقوه ارائه ابزارهای قدرتمند برای پرداختن به این چالش ها برخوردارند اما ادبیات حاضر عمدتاً بر مسائل مقیاس پذیری مربوط به حجم داده ها بر حسب اندازه نمونه در راستای امور طبقه بندی متمرکز است.
کار حاضر رویکرد نظام مند و جامعی را برای پرداختن بهینه به امور رگرسیون با داده های بسیار بزرگ و با ابعاد بالا ارائه می نماید. رویکرد پیشنهادی مبتنی بر تکنیک های نمونه برداری هوشمند به منظور تقلیل تعداد نمونه های تولیدی با استفاده از یک رویکرد تکرار شونده می باشد که مجموعه نمونه های جدیدی را تا زمانی که فضای ورودی و خروجی تابع تقریبی به صورت بهینه پوشش داده شوند، ایجاد می نماید. یادگیری تابع افزایشی در هر تکرار نمونه برداری رخ داده و از نمونه های جدید برای هماهنگ سازی نتایج رگرسیون الگوریتم یادگیری تابع استفاده می شود. سطح دقت و اطمینان تابع تقریب حاصله با استفاده از چارچوب محاسبات احتمالی و تقریبی صحیح ارزیابی می گردد.
تکنیک های نمونه برداری هوشمند و یادگیری تابع افزایشی را به راحتی می توان در برنامه های کاربردی به کار برد مقیاس پذیری مناسبی در داده های بسیار بزرگ دارند. نتایج مطلوب و امکان سنجی تکنیک های پیشنهادی با استفاده از توابع معیار و نیز توابع حاصل از مسائل دنیای واقعی مشخص گردیده است.

 

۶- نتیجه گیری ها

در این مقاله یک رویکرد نوینی (SSIFL) را برای محاسبه مدل رگرسیون ارائه نمودیم که توابع تعریف شده در فضاهای با ابعاد بالا را با دقت تقریب می زند. این امر منوط به کمینه سازی تعداد فراخوانی تابع هدف در تولید داده های آموزشی حاصل می گردد. ما هوشمندانه روش ها و ابزارهای عمیق نظری را که قبلا منتشر شده بودند در یک الگوریتم یادگیری تابع و نمونه برداری عملی با هم ترکیب نموده و کاربردپذیری تکنیک پیشنهاد شده را برای مسائل مربوط به رگرسیون با ابعاد بالا نشان دادیم. روش نمونه برداری مورد استفاده برای تولید مجموعه داده آموزشی نقش کلیدی را در دستیابی به عملکرد بالای مدل رگرسیون ایفا می کند. روش های مختلف نمونه برداری ارزیابی شده و به طور نظام مند در این مطالعه مورد تجزیه و تحلیل قرار گرفتند. پس از تجزیه و تحلیل جامع متمایز، در این مقاله نشان دادیم که توالی نمونه LCVT و HA در داده گردانی در بُعدچندی بالا، توالی برتر بوده و به همین دلیل در میان کلیه تکنیک های یگر برای تکنیک نمونه برداری هوشمند پیشنهادی انتخاب شدند. با این حال، به دلیل اقدامات محاسباتی بالای مورد نیاز برای محاسبه توالی، استفاده از روش HA در فضاهای بُعدی بسیار بالا راحت تر بوده و در این مطالعه نیز دستاوردهای خوبی از نظر زمان محاسباتی معقول حاصل آمده است.

عنوان انگلیسی:Smart sampling and incremental function learning for very large high dimensional data~~en~~

Abstract

Very large high dimensional data are common nowadays and they impose new challenges to data-driven and data-intensive algorithms. Computational Intelligence techniques have the potential to provide powerful tools for addressing these challenges, but the current literature focuses mainly on handling scalability issues related to data volume in terms of sample size for classification tasks.
This work presents a systematic and comprehensive approach for optimally handling regression tasks with very large high dimensional data. The proposed approach is based on smart sampling techniques for minimizing the number of samples to be generated by using an iterative approach that creates new sample sets until the input and output space of the function to be approximated are optimally covered. Incremental function learning takes place in each sampling iteration, the new samples are used to fine tune the regression results of the function learning algorithm. The accuracy and confidence levels of the resulting approximation function are assessed using the probably approximately correct computation framework.
The smart sampling and incremental function learning techniques can be easily used in practical applications and scale well in the case of extremely large data. The feasibility and good results of the proposed techniques are demonstrated using benchmark functions as well as functions from real-world problems.

۶- Conclusions

In this paper we presented a novel approach (SSIFL) for computing a regression model that accurately approximates functions defined over high dimensional input spaces. This has been achieved under the constraint of minimizing the number of calls to the target function for generating the training data. We smartly combine previously published deep theoretical methods and tools into a practical sampling and function learning algorithm and we showed the applicability of the proposed technique to high-dimensional regression problems. The sampling method used for generating the training dataset plays a key-role in order to reach high performance of the regression model. Different sampling methods have been evaluated and systematically analyzed in this study. Following a comprehensive discrimination analysis, in this paper we showed that the LCVT and HA sampling sequences are superior in handling data in high dimensionality and therefore they have been selected among all the other techniques for the proposed smart sampling technique. However, due to high computational effort needed for calculating the sequence, it might be more convenient to use the HA method in very high dimensional spaces, which has been already pointed out in this study to reach good achievements in reasonable computational time.

$$en!!

  راهنمای خرید:
  • همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
  • ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
  • در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.