فایل ورد کامل ساخت سلسله مراتب و طبقه بندی متن بر اساس استراتژی آزاد سازی و مدل حداقل اطلاعات


در حال بارگذاری
10 جولای 2025
پاورپوینت
17870
3 بازدید
۷۹,۷۰۰ تومان
خرید

توجه : به همراه فایل word این محصول فایل پاورپوینت (PowerPoint) و اسلاید های آن به صورت هدیه ارائه خواهد شد

این مقاله، ترجمه شده یک مقاله مرجع و معتبر انگلیسی می باشد که به صورت بسیار عالی توسط متخصصین این رشته ترجمه شده است و به صورت فایل ورد (microsoft word) ارائه می گردد

متن داخلی مقاله بسیار عالی، پر محتوا و قابل درک می باشد و شما از استفاده ی آن بسیار لذت خواهید برد. ما عالی بودن این مقاله را تضمین می کنیم

فایل ورد این مقاله بسیار خوب تایپ شده و قابل کپی و ویرایش می باشد و تنظیمات آن نیز به صورت عالی انجام شده است؛ به همراه فایل ورد این مقاله یک فایل پاور پوینت نیز به شما ارئه خواهد شد که دارای یک قالب بسیار زیبا و تنظیمات نمایشی متعدد می باشد

توجه : در صورت مشاهده بهم ریختگی احتمالی در متون زیر ،دلیل ان کپی کردن این مطالب از داخل فایل می باشد و در فایل اصلی فایل ورد کامل ساخت سلسله مراتب و طبقه بندی متن بر اساس استراتژی آزاد سازی و مدل حداقل اطلاعات،به هیچ وجه بهم ریختگی وجود ندارد

تعداد صفحات این فایل: ۲۶ صفحه


بخشی از ترجمه :

چکیده

دسته بندی سلسله مراتب رویکردی مؤثر برای دسته بندی داده های متنی بزرگ مقیاس است. ما یک استراتژی آزاد سازی شده روش دسته بندی سلسله مراتبی مرسوم را به منظور بهبود عملکرد سیستم معرفی می کنیم. روش ما در حین فرایند ساخت سازه سلسله مراتبی داوری گره دسته نامعین را تا زمانی که به وضوح بتوان آن را دسته بندی کرد به تأخیر می اندازد. این رویکرد مسئله «انسداد» را به صورت مؤثری کاهش می دهد که در سازه سلسله مراتبی خطای دسته بندی را از سطح بالاتر به سطح پایین تر انتقال می دهد. یک رویکرد وزن دهی واژه جدید بر مبنای نظریه حداقل اطلاعات (LIT) برای دسته بندی سلسله مراتب اتخاذ شده است. این رویکرد اطلاعات را در تغییرات توزیع احتمال تعیین می کند و مدل نمایش سند جدیدی را ارائه می کند که در آن می توان مشارکت هر واژه را به صورت صحیح وزن داد. نتایج آزمایشگاهی نشان می دهد که رویکرد آزاد سازی سلسله مراتب معقول تری ایجاد می کند و عملکرد دسته بندی را بیشتر بهبود می بخشد. این رویکرد همچنین در مقایسه با روش های دسته بندی دیگر مانند SVM (ماشین بردار پشتیبان) عملکرد بهتری بر حسب کارایی دارد و برای وظایف دسته بندی متن بزرگ مقیاس کارآمدتر است. روش های مبتنی بر LIT در مقایسه با روش وزن دهی واژه کلاسیک TF*IDF به بهبود قابل توجهی در عملکرد دسته بندی دست می یابد.

 

– نتایج

ما رویکرد دسته بندی سلسله مراتب را بر مبنای استراتژی آزاد سازی ارائه می کنیم که تأثیر مسئله «انسداد» را کاهش می دهد. این رویکرد تصمیم دسته نامعین را تا زمانی که به صورت قطعی دسته بندی شود به تأخیر می اندازد و بنابراین خطایی که در سطح بالاتر روی داده است به سطح پایین تر انتقال داده نمی شود. همچنین نظریه حداقل اطلاعات را در وزن دهی واژه و نمایش سند سازی نیز اعمال کردیم که توسط توزیع های احتمال مختلف مدل تعیین کیفیت اطلاعات اساسی جدیدی را ارائه می کند. آزمایش های روی داده های RCV1 نشان می دهد که روش دسته بندی سلسله مراتبی متن مبتنی بر استراتژی آزاد سازی با افزایش اندازه داده در مقایسه با SVM کارایی بالاتری بر حسب عملکرد زمانی دارد. همچنین می تواند همزمان دقت بالاتر و فراخوانی را حفظ کند. به ویژه با استفاده از روش LIT برای وزن دهی واژه عملکرد دسته بندی در بیشتر رده بندها در مقایسه با TF*IDF بهبود قابل توجهی می یابد. LIT فاصله بین دو توزیع احتمال را اندازه می گیرد و رویکرد کمیت اطلاعات اساسی جدیدی را وضع می کند. این رویکرد نه تنها در زمینه دسته بندی متن بلکه در کاربردهای پردازش زبان طبیعی، مانند خوشه بندی، بازیابی اطلاعات و غیره، نیز عملکرد بهتری در مقایسه با TF*IDF دارد.

عنوان انگلیسی:Hierarchy construction and text classification based on the relaxation strategy and least information model~~en~~

Abstract

Hierarchical classification is an effective approach to categorization of large-scale text data. We introduce a relaxed strategy into the traditional hierarchical classification method to improve the system performance. During the process of hierarchy structure construction, our method delays node judgment of the uncertain category until it can be classified clearly. This approach effectively alleviates the ‘block’ problem which transfers the classification error from the higher level to the lower level in the hierarchy structure. A new term weighting approach based on the Least Information Theory (LIT) is adopted for the hierarchy classification. It quantifies information in probability distribution changes and offers a new document representation model where the contribution of each term can be properly weighted. The experimental results show that the relaxation approach builds a more reasonable hierarchy and further improves classification performance. It also outperforms other classification methods such as SVM (Support Vector Machine) in terms of efficiency and the approach is more efficient for large-scale text classification tasks. Compared to the classic term weighting method TF*IDF, LIT-based methods achieves significant improvement on the classification performance.

 

– Conclusions

We propose the hierarchical classification approach based on the relaxation strategy which alleviates the impact of the ‘blocking’ problem. It delays the uncertain category decision until it can be classified definitely, and so the error that has occurred in the upper level will not be transferred to the lower level. We also apply the Least Information Theory in term weighting and documentation representation and it offers a new basic information quantify model by different probability distributions. The experiments on RCV1 data shows that the text hierarchical classification method based on the relaxation strategy has greater advantage on the time performance over SVM with an increasing data size. And it can also maintain both higher precision and recall simultaneously. Specially, by the use of LIT method for term weighting, the classification performance achieves significant improvement over classic TFIDF on most classifiers. LIT measures the distance between two probability distributions and establishes a new basic information quantity approach. It performed better than TFIDF not only in the field of text classification but also other natural language processing application, such as clustering, information retrieval and so on.

$$en!!

  راهنمای خرید:
  • همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
  • ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
  • در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.