پاورپوینت کامل نقش ویرایش در معیارسازی و پردازش ماشینی خط و زبان فارسی ۸۶ اسلاید در PowerPoint


در حال بارگذاری
10 جولای 2025
پاورپوینت
17870
2 بازدید
۷۹,۷۰۰ تومان
خرید

توجه : این فایل به صورت فایل power point (پاور پوینت) ارائه میگردد

 پاورپوینت کامل نقش ویرایش در معیارسازی و پردازش ماشینی خط و زبان فارسی ۸۶ اسلاید در PowerPoint دارای ۸۶ اسلاید می باشد و دارای تنظیمات کامل در PowerPoint می باشد و آماده ارائه یا چاپ است

شما با استفاده ازاین پاورپوینت میتوانید یک ارائه بسیارعالی و با شکوهی داشته باشید و همه حاضرین با اشتیاق به مطالب شما گوش خواهند داد.

لطفا نگران مطالب داخل پاورپوینت نباشید، مطالب داخل اسلاید ها بسیار ساده و قابل درک برای شما می باشد، ما عالی بودن این فایل رو تضمین می کنیم.

توجه : در صورت  مشاهده  بهم ریختگی احتمالی در متون زیر ،دلیل ان کپی کردن این مطالب از داخل فایل می باشد و در فایل اصلی پاورپوینت کامل نقش ویرایش در معیارسازی و پردازش ماشینی خط و زبان فارسی ۸۶ اسلاید در PowerPoint،به هیچ وجه بهم ریختگی وجود ندارد


بخشی از متن پاورپوینت کامل نقش ویرایش در معیارسازی و پردازش ماشینی خط و زبان فارسی ۸۶ اسلاید در PowerPoint :

در اینجا ابتدا به‌اختصار تعریفی برای هریک از اصطلاحات «ویرایش»، «معیار»، «معیارسازی» و «پردازش ماشینی» عرضه می‌داریم، سپس از تفاوت متن‌های علمی و خبری با متن‌های ادبی سخن می‌گوییم، بعد به چگونگی تحول ویرایش در متن‌های خبری فارسی اشاره می‌کنیم و نهایتاً به بحث اصلی خود می‌پردازیم.

به یاد استاد احمد حب علی موجانی

مقدمه

در اینجا ابتدا به‌اختصار تعریفی برای هریک از اصطلاحات «ویرایش»، «معیار»، «معیارسازی» و «پردازش ماشینی» عرضه می‌داریم، سپس از تفاوت متن‌های علمی و خبری با متن‌های ادبی سخن می‌گوییم، بعد به چگونگی تحول ویرایش در متن‌های خبری فارسی اشاره می‌کنیم و نهایتاً به بحث اصلی خود می‌پردازیم و با انجام یک آزمایش ساده، نشان می‌دهیم که ویرایشِ متن‌های خبری فارسی چه نقش مهمی در فعالیت‌های پردازشی، مثلاً ترجم ماشینی متن‌ها به زبان انگلیسی دارد. بحث دربار اهمیت مطالعات مربوط به پردازش زبان، و لزوم توجه به آنها برای تقویت هرچه بیشتر زبان فارسی از مباحث پایانی این مقاله است.

ویرایش

حسین معصومی‌همدانی دربار اهمیت زبان علم در فارسی به‌درستی چنین گفته است (۱۳۸۲): «یکی از بخت‌های ما ایرانیان این است که زبان ملی و زبان علمی‌مان یکی است. ملت‌هایی در جهان و در کشورهای اطراف ما هستند که یا به‌حکم اوضاع‌و احوال تاریخی یا دانسته و به این گمان که اختیارکردنِ یک زبان اروپایی به‌عنوان زبان علمی می‌تواند ایشان را در کار انتقال علوم و غلبه بر عقب‌ماندگی علمی موفق کند، زبان ملی خود را برای کاربردهای روزمره نگاه داشته‌اند و برای کاربردهای علمی، لااقل در سطوح دانشگاهی، یک زبان اروپایی را برگزیده‌اند. زیان‌های این گزینش به حدی است که بر فواید احتمالی آن می‌چربد…».

معصومی‌همدانی در ادام مقال خود از فواید و اهمیت چنین اتفاق خجسته‌ای در زبان فارسی سخن گفته و ضمن برشمردن شیوه‌هایی برای تثبیت و تقویت این جنبه از زبان فارسی به نیکی از کسانی یاد کرده است که از ابتدای ورود علم جدید به ایران زبان فارسی را برای بیان مفاهیم علمی برگزیدند. با تأسیس فرهنگستانِ اول در سال ۱۳۱۴ نخستین گام‌ها برای برنامه‌ریزی زبانی در حوز واژه‌گزینی در مباحث علمی برداشته شد و پس از آن با شکل‌گیری نهادهایی چون مؤسس انتشارات فرانکلین در ۱۳۳۳ و بعدها مرکز نشر دانشگاهی در ۱۳۵۹، امرِ ویرایش نیز برای تثبیت و تقویت هرچه بیشتر این جنبه از زبان فارسی وارد میدان شد.

ویرایش عبارت است از انجام فعالیت‌های گوناگونی چون یک‌دست‌کردن اصطلاحاتِ متن، یک‌دست‌کردن نشانه‌های سجاوندی و شیو ارجاعات در متن، تنظیم پاراگراف‌بندی‌ها و اطمینان‌یافتن از رعایت دستور زبان معیار و دستور خط مصوب سازمان انتشاراتی در متن، و غیره و غیره، برای کمک به انتقال هرچه بهتر و دقیق‌تر اطلاعات از نویسنده یا مترجم به خواننده. اما نکته‌ای که حتی بسیاری از ویراستاران نیز بدان توجهی ندارند این است که ویرایش بیش از هر چیز، بخشی از یک برنامه‌ریزی زبانی است که هدفش هرچه معیارتر‌کردن زبان معیار است. اهمیت دو مفهوم «زبان معیار» و «برنامه‌ریزی زبانی» در امر ویرایشِ متن‌های علمی و خبری چنان زیاد است که هر تعریفی از ویرایش بدون توجه به آن دو مفهوم، تعریفی ناقص و ناتمام خواهد بود.

زبان معیار و معیارسازی زبان

زبان‌ها مخصوصاً در جوامع بزرگ و پیشرفته، برحسب کاربردشان دارای تنوعات بسیاری هستند. اهل زبان بسته به موقعیت جغرافیایی خود یا بسته به ویژگی‌های دیگری همچون سن و جنس و موقعیت اجتماعی‌شان دارای گونه‌های زبانی متفاوتی هستند؛ مثلاً در مورد زبان فارسی، گون فارسی مشهدی با گون فارسی اصفهانی تفاوت دارد، یا گون زبانی زنان با گون زبانی مردان در بسیاری موارد متفاوت است. همچنین اهل زبان بسته به رسمی‌بودن یا دوستانه‌بودن بافتی نیز که در آن سخن می‌گویند از سبک‌های متفاوتی استفاده می‌کنند؛ مثلاً سبکی که آنها در خانه و میهمانی‌های دوستانه به‌کار می‌برند متفاوت از سبکی است که در محیط‌های رسمی همچون دادگاه و دانشگاه از آن استفاده می‌کنند. گونه‌هایی از یک زبان که متناسب با بافت اجتماعی گفتار مورد استفاده قرار می‌گیرند، سبک‌های مختلف آن زبان به شمار می‌روند (مدرسی ۱۳۶۸: ۱۸۵-۱۸۶؛ همچنین رک. سارلی۱۳۸۷: ۱۶-۱۷). اما در میان این گونه‌ها و سبک‌های متفاوت معمولاً فقط یکی گون معیار (standard) یا گون وجهه‌دارِ (prestigious) زبان شمرده می‌شود. گون معیار به گون وجهه‌داری اطلاق می‌شود که مورد قبول اکثر افراد جامعه است و از آن در نوشتار، اخبارِ رادیو و تلویزیون، احکام حکومتی، و کلی محیط‌های رسمی استفاده می‌کنند. گون معیار همچنین همان گونه‌ای است که غالباً در جوامع چندزبانه از آن به‌عنوان زبان مشترک و میانجی استفاده می‌شود و گاه بدان زبان رسمی یا زبان ملی اطلاق می‌شود.

«معیارسازی» (standardization) هم به انتخاب یک گون زبانی به‌عنوان گون معیار اطلاق می‌شود، و هم به آماده‌سازی و تقویت گون معیار برای انجام هرچه بهتر وظایفی که بر عهده دارد. تدوین فرهنگ‌های لغت و کتاب‌های دستور، تهی واژه‌نامه‌ها و واژگان‌ها، و نگارش آثاری چون «غلط ننویسیم» (نجفی ۱۳۹۷؛ نیز رک. طبیب‌زاده ۱۳۹۷)، «فرهنگ املایی زبان فارسی» (صادقی و زندی‌مقدم ۱۳۹۸)، «راهنمای ویرایش» (سمیعی ۹۵؛ ۹۷)، «فرهنگ توصیفی دستور زبان فارسی» (طباطبایی ۱۳۹۵) و غیره، همه و همه فعالیت‌هایی در جهت هرچه معیارترساختن زبان فارسی محسوب می‌شوند. گاهی معیارسازی به شکل طبیعی و به‌اصطلاح خودانگیخته است، و گاهی به‌صورت آگاهانه. مثلاً تا پیش از نهضت مشروطه در ایران زبان فارسی به‌صورت طبیعی و خودانگیخته و با سرعتی بسیار اندک مسیر معیارشدن را طی می‌کرد، اما طی این مسیر پس از نهضت‌ مشروطه و به‌ویژه در دوران پهلوی اول و پس از تأسیس فرهنگستان نخست، به‌صورت آگاهانه درآمد و مدام بر سرعت آن افزوده شد. البته جریان معیارسازی در مورد زبان‌های زنده و پرکاربرد هیچ‌گاه متوقف نمی‌شود، و چه در حالت خودانگیخته و چه در حالت آگاهانه، همواره وجود دارد و مراحل گوناگون را پشت‌سر می‌گذارد. تعیین ویژگی‌های زبان و خط معیار از طریق تدوین دستورهای زبان و خط امکان‌پذیر است و چون چنین دستورهایی به‌ناگزیر تجویزی هستند، گون معیار نیز خواه‌ناخواه و پس از اندکی، مبدل به گونه‌ای برساخته می‌شود که جریان تحول آن اندکی کندتر از جریان تحول زبان گفتار است. از‌این‌رو می‌توان و باید هر چند سال یک‌بار به تجدیدنظر در ویژگی‌های متفاوت گون معیار پرداخت و از این طریق مانع از ثابت‌ماندن گون معیار و دور‌شدن آن از جریان تحول کلّی زبان طبیعی گفتار شد.

پردازش زبان‌های طبیعی و متن‌های علمی و خبری

حوز پردازش زبان‌های طبیعی (Natural Language Processing= NLP) که آغاز شکل‌گیری آن به سال‌های ده پنجاه قرن بیستم بازمی‌گردد، محل تلاقی سه رشت گوناگون زبان‌شناسی و علوم رایانه‌ای و هوش مصنوعی است. این حوزه به تعامل میان رایانه و زبان اختصاص دارد و به موضوعاتی می‌پردازد همچون تحلیل و پردازش خودکارِ داده‌های انبوه زبانی با استفاده از کامپیوتر، درک گفتار، تولید گفتار، تبدیل متن به نوشتار، تبدیل نوشتار به متن، بازیابی اطلاعات از درون متن، تهی پیکره‌های عظیم زبانی و ترجم ماشینی و غیره. به اعتقاد نگارند این سطور اولاً با توجه به پیشرفت‌های روزافزون در حوز پردازش زبان‌های طبیعی، دیری نخواهد گذشت که زبان‌های زند جهان برحسب میزان پیشرفت‌هایشان در استفاده از فناوری‌های جدید در حوز پردازش زبان‌های طبیعی، به دو دست زبان‌های اصلی و زبان‌های پیرامونی تقسیم می‌شوند؛ ثانیاً معیارسازی آگاهان زبان از طریق برنامه‌ریزی‌های زبانی و مخصوصاً از طریق ویرایش، سبب می‌شود تا متن‌های علمی و خبری خودبه‌خود دارای ویژگی‌هایی شوند که کار متخصصانِ حوزه‌های گوناگون در پردازش زبان را در انجام کارهای خود بسیار ساده‌ کند. بدیهی است که اگر قرار باشد زبان فارسی در آینده در زمر زبان‌های پیرامونی نباشد، باید از هم‌اکنون به تقویت هرچه بیشتر آن در این مطالعات یاری رساند. با آزمایشی ساده می‌توان نشان داد که معیارسازی زبان نوشتار از طریق ویرایش، می‌تواند دارای چه سهم مهمی در آماده‌سازی زبان از حیث مباحث مربوط به پردازش زبان باشد.

متن‌های علمی و خبری از حیث نقش (function) و گونه و نیز پردازش دارای تفاوت‌های بسیاری با متن‌های ادبی هستند. از حیث نقش، زبانِ متن‌های علمی و خبری همواره دارای نقش ارجاعی (referential) هستند اما در متن‌های ادبی نقش شاعرانه (poetic) اهمیت دارد؛ یعنی در متن‌های خبری و علمی همواره به جهان بیرون از متن ارجاع داده می‌شود و از این طریق بر اطلاعات خواننده افزوده می‌شود، اما در متن‌های ادبی و مخصوصاً در شعر آنچه اهمیت دارد خود زبان است و آرایه‌های گوناگون ادبی موجود در آن. از حیث گونه، متن‌های علمی و خبری همواره به گون معیار و رسمی نگاشته می‌شوند و استفاده از هر گون دیگری در آنها معمول نیست، اما در متن‌های ادبی از انواع گونه‌ها و سبک‌ها ممکن است استفاده شود. و بالاخره از حیث مسائل مربوط به پردازش زبان‌های طبیعی نیز متن‌های علمی و خبری بیشترین میزان آمادگی را برای متخصصان این قبیل مطالعات دارند، اما به متن‌های ادبی به علت پیچیدگی‌های سبکی و معنایی متعددشان، کمتر از این حیث پرداخته می‌شود. بنابراین کار ویراستارانِ متون علمی و خبری بیش از هر چیز به مسئل گون معیار مربوط می‌شود؛ آنان با افزودن بر صراحت و سادگی این متن‌ها باعث افزایش نقش ارجاعی آنها می‌شوند، و با کاستن از تنوعات زبانی در آنها امکان پردازش هرچه سریع‌تر و دقیق‌تر آنها را افزایش می‌دهند.

بررسی نقش ویرایش در پردازش ماشینی متن‌های ویراسته یا معیار

اگر بخواهیم زبان فارسی در آینده در زمر زبان‌های پیرامونی قرار نگیرد، باید از هم‌اکنون ازطریق معیارسازی و نیز از طریق انجام پژوهش و مطالعات هرچه بیشتر در حوز پردازش ماشینی، به تقویت آن یاری برسانیم. در اینجا با آزمایش ساده‌ای نشان می‌دهیم که چگونه معیارسازی آگاهان زبان و مخصوصاً فعالیت‌های ویرایشی، خودبه‌خود باعث تسهیل کار متخصصانِ پردازش زبان فارسی می‌شود.

چهار بند زیر را به‌طور کاملاً تصادفی از چهار روزنامه فارسی که به فواصل ۵۰ تا ۶۰ سال از سال ۱۲۲۹ شمسی تا ۱۳۹۹ منتشر شده‌اند برگزیدیم. این روزنامه‌ها به فواصل ۵۰ تا ۶۰ سال از هم منتشر شده‌اند و هر یک از بندهای زیر نیز به‌طور میانگین شامل ۱۰۲ واژه است. دو متن اول مبین معیارسازی خودانگیخته و دو بند دوم مبین معیارسازی کم‌وبیش آگاهانه هستند:

۱. روزنامچه اخبار دارالخلاف طهران [وقایع اتفاقیه]

شمار ۱، جمعه پنجم ربیع‌الثانی ۱۲۶۷ه‌ق/ ۱۸ بهمن ۱۲۲۹: کشتی بزرک دولت فرانسه که در شهر برست بود یکصد و هست عراده توپ در میانش بود یکنفر از توپچیان فشنک آتش‌بازی درست میکرد ناکاه باروطی که در آنجا بود آتش کرفت و خود آن توپچی و هشت نفر دیکر که نزدیک او بودند آتش کرفته هلاک شدند و ده دوازده نفر هم از تخته پاره زخم دار شدند

درین روزها در دریاهای اطراف مملکت انکلیس و فرانسه طوفان زیاد شده و بسیار ضرر بکشتیها خورده است ازجمله یک کشتی در سمت مغرب ولایت انکلیس بسنک خورده و غرق شد و مال‌التجاره که در آن بود سی پنجهزار پوند پول انکلیس بود که هفتاد هفت هزار تومان پول ایران باشد و همه تلف شد.۲

۲. حبل‌المتین (تهران)

شمار ۱، صفح ۲-۳، ۱۵ ربیع‌الاول ۱۳۲۵ه‌ق/ ۹ اردیبهشت ۱۲۸۵ه‌ش: تا کنون هر گونه حوادث و وقایع که نتیجه آنها افتتاح مجلس شورای ملّی بود واقع میشد (انقلاب) میگفتیم اما پاره واقعات که این روزها بظهور رسیده و در بعضی اماکن سرزده و میزند باید آنهارا اختلال بگوئیم انقلاب – مبارزت و ستیزه ‌است که فیما بین دولت و ملت واقع میشود و اختلال عبارت‌است از اغتشاش و هرج‌ومرجی که باغوا واغفال دولت و دولتیان ظاهر میشود و فائده اختلال برای دولت آنستکه انقلاب و مشاجره با دولت توقیف گردیده خلق بجان یکدیگر افتاده دولتیانرا آسوده میگذارند و حکومت از ضعف و سستی خلاص شده محکم و پایدار میگردد

۳. روزنام اطلاعات

شمار ۱۰۶۴۹، سال ۳۶، شانزده آبان ۱۳۴۰: امروز آقای دکتر امینی نخست‌وزیر بخبرنگار ما اظهار داشت که دولت امریکا مبلغی بایران بعنوان کمک بلاعوض میپردازد و یک وام نیز برای انجام کارهای کنونی سازمان برنامه در اختیار این سازمان میگذارد. آقای نخست‌وزیر اظهار داشت که دیروز ساعت ۴ بعد از ظهر آقای هولمز سفیر کبیر آمریکا، باتفاق برن رئیس اصل چهار در ایران، در کاخ نخست‌وزیری حضور یافت ‌و تصمیم دولت آمریکا را در این مورد اطلاع داد. خبرنگار مادر باره جریان کمک بلاعوض آمریکا سؤال کرد و آقای نخست‌وزیر پاسخ داد که این کمک جنبه استثنائی دارد.

۴. روزنامه شرق

شمار ۳۸۵۹، سال ۱۸، دوشنبه ۱۹ آبان ۱۳۹۹: شکست دونالد ترامپ در انتخابات آمریکا، واکنش مقامات و مسئولان را در‌ پی داشت. صفحه توییتر انگلیسی دفتر مقام معظم رهبری در واکنش به شکست ترامپ در انتخابات نوشت: «اوضاع در ایالات‌متحده و آنچه آنها خود در مورد انتخابات می‌گویند یک نمایش است! این نمونه‌ای از چهره زشت لیبرال‌دموکراسی در ایالات‌متحده است. صرف‌نظر از نتیجه، یک چیز کاملا واضح است، سقوط قطعی سیاسی، مدنی و اخلاقی رژیم ایالات‌متحده». رئیس‌جمهور نیز در جلسه روز گذشته ستاد هماهنگی اقتصادی دولت، به نتیجه انتخابات ریاست‌جمهوری آمریکا اشاره کرد و گفت: «دولت آینده آمریکا از فرصت پیش‌آمده برای جبران اشتباهات گذشته استفاده کند.

می‌بینیم که هرچه متن‌ها جدیدتر می‌شوند، نشانه‌های معیارشدگی آنها نیز بیشتر می‌شوند؛ مثلاً در متن شمار ۱ از هیچ علامت سجاوندی استفاده نشده است، در متن ۲ از دو علامت (یک پرانتز و یک خط تیره که کاربرد دومی معلوم نیست)، در متن ۳ از پنج علامت (سه نقطه و دو ویرگول)، و در متن شمار ۴ از ۱۶ علامت (پنج نقطه، پنج ویرگول، دو جفت گیومه نقل قول، دو دونقطه، و یک علامت تعجب) استفاده شده است. با جدیدتر‌شدن متن‌ها به تعداد علائم سجاوندی آنها اضافه می‌شود و هم استفاده از آنها نقش‌مندتر و صحیح‌تر می‌شود. بعداً خواهیم دید که استفاد نظام‌مند و دقیق از علائم سجاوندی فقط پردازش متن را برای انسان ساده‌تر نمی‌کند بلکه پردازش آن برای ماشین را نیز، مثلاً در ترجم ماشینی تسهیل می‌کند.

در مورد مسئل جدا یا سرهم‌نوشتن حرف‌های اضافه و پیش‌وندهای فعلی و واژه‌های مرکب با دو گرایش متفاوت مواجه هستیم، در معیارسازی خودا

  راهنمای خرید:
  • همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
  • ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
  • در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.