فایل ورد کامل ساختارکاوی وب با الگوریتم پیش پردازش داده ها


در حال بارگذاری
10 جولای 2025
پاورپوینت
17870
3 بازدید
۷۹,۷۰۰ تومان
خرید

توجه : به همراه فایل word این محصول فایل پاورپوینت (PowerPoint) و اسلاید های آن به صورت هدیه ارائه خواهد شد

این مقاله، ترجمه شده یک مقاله مرجع و معتبر انگلیسی می باشد که به صورت بسیار عالی توسط متخصصین این رشته ترجمه شده است و به صورت فایل ورد (microsoft word) ارائه می گردد

متن داخلی مقاله بسیار عالی، پر محتوا و قابل درک می باشد و شما از استفاده ی آن بسیار لذت خواهید برد. ما عالی بودن این مقاله را تضمین می کنیم

فایل ورد این مقاله بسیار خوب تایپ شده و قابل کپی و ویرایش می باشد و تنظیمات آن نیز به صورت عالی انجام شده است؛ به همراه فایل ورد این مقاله یک فایل پاور پوینت نیز به شما ارئه خواهد شد که دارای یک قالب بسیار زیبا و تنظیمات نمایشی متعدد می باشد

توجه : در صورت مشاهده بهم ریختگی احتمالی در متون زیر ،دلیل ان کپی کردن این مطالب از داخل فایل می باشد و در فایل اصلی فایل ورد کامل ساختارکاوی وب با الگوریتم پیش پردازش داده ها،به هیچ وجه بهم ریختگی وجود ندارد

تعداد صفحات این فایل: ۱۴ صفحه


بخشی از ترجمه :

چکیده

شبکه جهانی وب یک مجموعه بی نهایت بزرگ از اطلاعات می باشد، به عبارتی فراتر از حد تصور ما می باشد. آن اطلاعات کافی طبق نیاز کاربر ارائه می دهد. وب به سرعت رو به افزایش می باشد به گونه ای که روزانه تقریباً ۷۰ میلیون صفحه اضافه می گردد. کشف دانش روی داده های وب، وب کاوی نامیده می شود. ساختارکاوی وب مبتنی بر تحلیل الگوها از ساختار هایپرلینک در وب می باشد. درست مثل داده کاوی، وب کاوی نیز دارای چهار مرحله می باشد، به عبارتی جمع آوری داده ها، پیش پردازش، کشف دانش و تحلیل دانش. این مقاله مبتنی بر دو مرحله جمع آوری و پیش پردازش داده ها می باشد. جمع آوری داده ها به جمع آوری داده های مورد نیاز برای تحلیل اشاره می کند. پیش پردازش به عنوان یک مرحله مهم از ساختارکاوی وب در نظر گرفته است ، زیرا داده های موجود روی وب غیر ساختاریافته، ناهمگن و نویزی هستند.

 

۱- مقدمه

داده کاوی به فرایند تحلیل داده ها از رویکردهای مختلف و جمع بندی آنها در اطلاعات مفید گفته می شود. با رشد وب، حال مقدار بزرگی از داده ها برای کاربران روی وب موجود می باشد. داده های پیش پردازش شده کارایی و مقیاس پذیری مراحل بعدی ساختارکاوی وب را بهبود می بخشند. این کار را می توان در فازهای مختلفی انجام داد: ترکیب داده ها، استخراج داده ها، تمیز کردن یا پاکسازی داده ها، استخراج لینک ها و فراداده ها (متادیتا)، تکمیل مسیر و غیره انجام داد. ترکیب داده ها شامل جمع آوری صفحات جمع آوری شده از وب سرورهای مختلف می شود. از استخراج داده ها برای استخراج لوگ داده ها طبق مدت زمان تحلیل استفاده می شود. پاکسازی داده ها به پاکسازی لینک های بی ربط اشاره می کند که برای تحلیل ساختار مفید نیستند، به عبارتی فایلهای چند رسانه ای، ورقه سبک html و غیره.

عنوان انگلیسی:Data Preprocessing Algorithm for Web Structure Mining~~en~~

Abstract

World Wide Web is an extremely large collection of information, i.e. beyond our imagination. It provides enough information according to user’s need. Web is rising dreadfully as approximately 70 million pages are added daily. Knowledge Discovery on web data is referred as Web Mining. Web Structure Mining based on the analysis of patterns from hyperlink structure in the web. Like as Data Mining, Web Mining has four stages i.e. Data Collection, Preprocessing, Knowledge Discovery and Knowledge Analysis. This paper based on the first two stages Data collection and Preprocessing. Data collection is to collect the data required for analysis. Data preprocessing is considered as an important stage of Web Structure mining because of data available on web is unstructured, heterogeneous and noisy.

 

I- INTRODUCTION

Data mining is the process of analyzing data from different perspectives and summarizing it into useful information. With the growth of Web, a large amount of data is now available for users on web. Web .Preprocessed data improves efficiency and scalability of later stages of Web structure mining. This can be done in several phases: Data fusion, Data Extraction, Data cleaning, links and metadata extraction, Path completion etc. Data fusion includes collecting of pages collected from various Web servers. Data extraction is used to extract log data according to time duration of analysis. Data cleaning refers to the cleaning of irrelevant links which is not useful for the purpose of structure analysis i.e. multimedia files html style sheet etc.

$$en!!

  راهنمای خرید:
  • همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
  • ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
  • در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.