فایل ورد کامل  پلتفرم مبتنی بر هدوپ برای پردازش زبان طبیعی اسناد و صفحات وب


در حال بارگذاری
10 جولای 2025
پاورپوینت
17870
5 بازدید
۷۹,۷۰۰ تومان
خرید

توجه : به همراه فایل word این محصول فایل پاورپوینت (PowerPoint) و اسلاید های آن به صورت هدیه ارائه خواهد شد

این مقاله، ترجمه شده یک مقاله مرجع و معتبر انگلیسی می باشد که به صورت بسیار عالی توسط متخصصین این رشته ترجمه شده است و به صورت فایل ورد (microsoft word) ارائه می گردد

متن داخلی مقاله بسیار عالی، پر محتوا و قابل درک می باشد و شما از استفاده ی آن بسیار لذت خواهید برد. ما عالی بودن این مقاله را تضمین می کنیم

فایل ورد این مقاله بسیار خوب تایپ شده و قابل کپی و ویرایش می باشد و تنظیمات آن نیز به صورت عالی انجام شده است؛ به همراه فایل ورد این مقاله یک فایل پاور پوینت نیز به شما ارئه خواهد شد که دارای یک قالب بسیار زیبا و تنظیمات نمایشی متعدد می باشد

توجه : در صورت مشاهده بهم ریختگی احتمالی در متون زیر ،دلیل ان کپی کردن این مطالب از داخل فایل می باشد و در فایل اصلی فایل ورد کامل  پلتفرم مبتنی بر هدوپ برای پردازش زبان طبیعی اسناد و صفحات وب،به هیچ وجه بهم ریختگی وجود ندارد

تعداد صفحات این فایل: ۲۱ صفحه


بخشی از ترجمه :

۵. نتیجه گیری و برنامه های آینده
در این مقاله ، سیستم توزیعی برای کرالینگ  اسناد  وب و استخراج کلیواژه ها و عبارات ارائه شده است.ساختار موازی با اجرای پایگاه هدوپ آپاچی ارائه شده در حالی که تفسیر متن و استخراج ویژگی های کلیدی متکی بر پایگاه گیت منبع باز NLP است. سهم اصلی پیشنهادی کار ما ، قابلیت اجرای کاربردهای گیت چندمنظوره (شامل دامنه ی وسیعی از فعالیت های NLP) در طراحی توزیع شده (با استفاده از مزیت عملکردهای مقیاس بندی ، خصوصا برای مجموعه نوشتاری متنی بسیار حجیم ) با به روز رسانی کد مینیمم و بدون نیاز به برنامه نویس برای نظارت بر محاسبه ی موازی محدودیت هایی مثل تجزیه ی متن ، نقشه کشی و مسائل همگام سازی است. ارزیابی عملکردهای پردازش روی اشکال مختلف خوشه ای (از ۲-۵ گره) قابلیت مقیاس پذیری تقریبا خطی سیستم را از خود نشان داده که نتیجه ی مطلوب ارزیابی های آینده در ترکیب بندی های ی خوشه ای و مجموعه داده های بزرگتر است . که در واقع نشان دهنده ی مسائل باز به روی کارهای آینده است. علاوه براین ، اجرای مدول استخراج کلیدواژه/عبارت اصلی روی محیط محاسباتی موازی دیگر ، مثل اسپارک ، کار جالبی است. علاوه براین ، برای ارتقای کیفی استخراج ویژگی های اصلی ، منابع دانش خارجی را می توان به کار برد، خصوصا چارجوب ها و مخازن معنایی ، تا تفسیر ویژگی های معنایی و ارتباط آنها فراهم شود.

عنوان انگلیسی: A hadoop based platform for natural language processing of web pages and documents~~en~~

۵ Conclusions and future work

In this paper, a distributed system for crawling webdocuments and extracting keywords and keyphrases has been presented. The parallel architecture is provided byimplementing the Apache Hadoop platform, while textannotation and key features extraction rely on the NLPopens source GATE platform. The main contributionsoffered by our work is the capability of executing generalpurpose GATE applications (including a wide range of NLPactivities) in a distributed design (exploiting the benefitsof scaling performances, especially for very large textcorpora) with minimal code update and without the needfor programmers to care about parallel computing constraints,such as task decomposition, mapping and synchronizationissues. Evaluating processing performanceson different cluster configurations (from 2 to 5 nodes) hasshowed a nearly linear scalability of the system, which isan encouraging result for future assessments on even largerdatasets and cluster configurations. These actuallyrepresents open issues for future work. Moreover, it couldbe interesting to implement our keywords/keyphrasesextraction module on other parallel computing environment,such as the cited Spark. Furthermore, in order toimprove the quality of key features extraction, externalknowledge resources could be used, especially Semanticrepositories and frameworks, to allow the annotation ofsemantic features and relations.

$$en!!

  راهنمای خرید:
  • همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
  • ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
  • در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.