فایل ورد کامل تکنیک تقسیم بندی جدید برای متن فارسی با هر فونت
توجه : به همراه فایل word این محصول فایل پاورپوینت (PowerPoint) و اسلاید های آن به صورت هدیه ارائه خواهد شد
این مقاله، ترجمه شده یک مقاله مرجع و معتبر انگلیسی می باشد که به صورت بسیار عالی توسط متخصصین این رشته ترجمه شده است و به صورت فایل ورد (microsoft word) ارائه می گردد
متن داخلی مقاله بسیار عالی، پر محتوا و قابل درک می باشد و شما از استفاده ی آن بسیار لذت خواهید برد. ما عالی بودن این مقاله را تضمین می کنیم
فایل ورد این مقاله بسیار خوب تایپ شده و قابل کپی و ویرایش می باشد و تنظیمات آن نیز به صورت عالی انجام شده است؛ به همراه فایل ورد این مقاله یک فایل پاور پوینت نیز به شما ارئه خواهد شد که دارای یک قالب بسیار زیبا و تنظیمات نمایشی متعدد می باشد
توجه : در صورت مشاهده بهم ریختگی احتمالی در متون زیر ،دلیل ان کپی کردن این مطالب از داخل فایل می باشد و در فایل اصلی فایل ورد کامل تکنیک تقسیم بندی جدید برای متن فارسی با هر فونت،به هیچ وجه بهم ریختگی وجود ندارد
تعداد صفحات این فایل: ۱۶ صفحه
بخشی از ترجمه :
چکیده
یک الگوریتم تقسیم بندی جدید بر اساس برچسب گذاری مشروط حد فاصل فوقانی ارائه شده است. یک روش پیش پردازش پیشنهاد شده است که خط مبنای موضعی برای هر زیرکلمه تنظیم می کند. این الگوریتم روی یک مجموعه داده ها از متون فارسی چاپ شده در ۲۰ فونت مورد آزمایش قرار گرفت. ۹۸۵% از کاراکترهای متصل شده به درستی تقسیم بندی شدند.
۵- نتایج تجربی
الگوریتم تقسیم بندی بر روی مجموعه ای از متون چاپ شده در ۲۰ فونت مختلف (شکل ۱۴) مورد آزمایش قرار گرفت. مجموعه آزمون شامل ۱۱۳۴۷ کاراکتر می شود که ۸۰۵۶ از آنها متصل هستند. نمونه های آموزش در مجموعه آزمون گنجانده نمی شوند. جدول ۱ خلاصه ای از نتایج را قبل و بعد از پس پردازش نشان می دهد. برخی از نمونه های نوعی از تقسیم بندی نادرست در شکل ۱۵ نشان داده شده اند.
۶- نتیجه گیری
در این مقاله، یک الگوریتم تقسیم بندی کاراکتر برای متن فارسی با هر فونت پیشنهاد شد. نرخ تقسیم بندی صحیح در حدود ۹۹ به دست آمد. الگوریتم در برابر کج شدن و تا حدی به هم ریختن خطوط پایه موضعی، مقاوم است. خطاهای تقسیم بندی عمدتا ناشی از رزولوشن اسکن کم و خطوط اریب متن می باشند.
عنوان انگلیسی:A new segmentation technique for omnifont Farsi text~~en~~
Abstract
A new segmentation algorithm based on the conditional labeling of the upper contour is presented. A pre-processing technique is proposed that adjusts the local base line for each subword. The algorithm was tested on a data set of printed Farsi texts in 20 fonts. 98.5% of the connected characters were correctly segmented.
۵- Experimental results
The segmentation algorithm was tested on a set of printed texts in 20 dierent fonts (Fig. 14). The test set includes 11,347 characters, 8056 of them connected. The training samples are not included in the test set. Table 1 shows a summary of the results, before and after the post-processing. Some typical examples of incorrect segmentation are shown in Fig. 15.
۶- Conclusion
In this paper, a character segmentation algorithm was proposed for omnifont Farsi text. A correct segmentation rate of about 99% was achieved. The algorithm is tolerant to the slant and to some extent to the misalignment of the local base lines. The segmentation errors were mainly due to the low scanning resolution and skewed text lines.
$$en!!
- همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
- ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
- در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.
مهسا فایل |
سایت دانلود فایل 