پاورپوینت کامل نقش ویرایش در معیارسازی و پردازش ماشینی خط و زبان فارسی ۸۶ اسلاید در PowerPoint
توجه : این فایل به صورت فایل power point (پاور پوینت) ارائه میگردد
پاورپوینت کامل نقش ویرایش در معیارسازی و پردازش ماشینی خط و زبان فارسی ۸۶ اسلاید در PowerPoint دارای ۸۶ اسلاید می باشد و دارای تنظیمات کامل در PowerPoint می باشد و آماده ارائه یا چاپ است
شما با استفاده ازاین پاورپوینت میتوانید یک ارائه بسیارعالی و با شکوهی داشته باشید و همه حاضرین با اشتیاق به مطالب شما گوش خواهند داد.
لطفا نگران مطالب داخل پاورپوینت نباشید، مطالب داخل اسلاید ها بسیار ساده و قابل درک برای شما می باشد، ما عالی بودن این فایل رو تضمین می کنیم.
توجه : در صورت مشاهده بهم ریختگی احتمالی در متون زیر ،دلیل ان کپی کردن این مطالب از داخل فایل می باشد و در فایل اصلی پاورپوینت کامل نقش ویرایش در معیارسازی و پردازش ماشینی خط و زبان فارسی ۸۶ اسلاید در PowerPoint،به هیچ وجه بهم ریختگی وجود ندارد
بخشی از متن پاورپوینت کامل نقش ویرایش در معیارسازی و پردازش ماشینی خط و زبان فارسی ۸۶ اسلاید در PowerPoint :
در اینجا ابتدا بهاختصار تعریفی برای هریک از اصطلاحات «ویرایش»، «معیار»، «معیارسازی» و «پردازش ماشینی» عرضه میداریم، سپس از تفاوت متنهای علمی و خبری با متنهای ادبی سخن میگوییم، بعد به چگونگی تحول ویرایش در متنهای خبری فارسی اشاره میکنیم و نهایتاً به بحث اصلی خود میپردازیم.
به یاد استاد احمد حب علی موجانی
مقدمه
در اینجا ابتدا بهاختصار تعریفی برای هریک از اصطلاحات «ویرایش»، «معیار»، «معیارسازی» و «پردازش ماشینی» عرضه میداریم، سپس از تفاوت متنهای علمی و خبری با متنهای ادبی سخن میگوییم، بعد به چگونگی تحول ویرایش در متنهای خبری فارسی اشاره میکنیم و نهایتاً به بحث اصلی خود میپردازیم و با انجام یک آزمایش ساده، نشان میدهیم که ویرایشِ متنهای خبری فارسی چه نقش مهمی در فعالیتهای پردازشی، مثلاً ترجم ماشینی متنها به زبان انگلیسی دارد. بحث دربار اهمیت مطالعات مربوط به پردازش زبان، و لزوم توجه به آنها برای تقویت هرچه بیشتر زبان فارسی از مباحث پایانی این مقاله است.
ویرایش
حسین معصومیهمدانی دربار اهمیت زبان علم در فارسی بهدرستی چنین گفته است (۱۳۸۲): «یکی از بختهای ما ایرانیان این است که زبان ملی و زبان علمیمان یکی است. ملتهایی در جهان و در کشورهای اطراف ما هستند که یا بهحکم اوضاعو احوال تاریخی یا دانسته و به این گمان که اختیارکردنِ یک زبان اروپایی بهعنوان زبان علمی میتواند ایشان را در کار انتقال علوم و غلبه بر عقبماندگی علمی موفق کند، زبان ملی خود را برای کاربردهای روزمره نگاه داشتهاند و برای کاربردهای علمی، لااقل در سطوح دانشگاهی، یک زبان اروپایی را برگزیدهاند. زیانهای این گزینش به حدی است که بر فواید احتمالی آن میچربد…».
معصومیهمدانی در ادام مقال خود از فواید و اهمیت چنین اتفاق خجستهای در زبان فارسی سخن گفته و ضمن برشمردن شیوههایی برای تثبیت و تقویت این جنبه از زبان فارسی به نیکی از کسانی یاد کرده است که از ابتدای ورود علم جدید به ایران زبان فارسی را برای بیان مفاهیم علمی برگزیدند. با تأسیس فرهنگستانِ اول در سال ۱۳۱۴ نخستین گامها برای برنامهریزی زبانی در حوز واژهگزینی در مباحث علمی برداشته شد و پس از آن با شکلگیری نهادهایی چون مؤسس انتشارات فرانکلین در ۱۳۳۳ و بعدها مرکز نشر دانشگاهی در ۱۳۵۹، امرِ ویرایش نیز برای تثبیت و تقویت هرچه بیشتر این جنبه از زبان فارسی وارد میدان شد.
ویرایش عبارت است از انجام فعالیتهای گوناگونی چون یکدستکردن اصطلاحاتِ متن، یکدستکردن نشانههای سجاوندی و شیو ارجاعات در متن، تنظیم پاراگرافبندیها و اطمینانیافتن از رعایت دستور زبان معیار و دستور خط مصوب سازمان انتشاراتی در متن، و غیره و غیره، برای کمک به انتقال هرچه بهتر و دقیقتر اطلاعات از نویسنده یا مترجم به خواننده. اما نکتهای که حتی بسیاری از ویراستاران نیز بدان توجهی ندارند این است که ویرایش بیش از هر چیز، بخشی از یک برنامهریزی زبانی است که هدفش هرچه معیارترکردن زبان معیار است. اهمیت دو مفهوم «زبان معیار» و «برنامهریزی زبانی» در امر ویرایشِ متنهای علمی و خبری چنان زیاد است که هر تعریفی از ویرایش بدون توجه به آن دو مفهوم، تعریفی ناقص و ناتمام خواهد بود.
زبان معیار و معیارسازی زبان
زبانها مخصوصاً در جوامع بزرگ و پیشرفته، برحسب کاربردشان دارای تنوعات بسیاری هستند. اهل زبان بسته به موقعیت جغرافیایی خود یا بسته به ویژگیهای دیگری همچون سن و جنس و موقعیت اجتماعیشان دارای گونههای زبانی متفاوتی هستند؛ مثلاً در مورد زبان فارسی، گون فارسی مشهدی با گون فارسی اصفهانی تفاوت دارد، یا گون زبانی زنان با گون زبانی مردان در بسیاری موارد متفاوت است. همچنین اهل زبان بسته به رسمیبودن یا دوستانهبودن بافتی نیز که در آن سخن میگویند از سبکهای متفاوتی استفاده میکنند؛ مثلاً سبکی که آنها در خانه و میهمانیهای دوستانه بهکار میبرند متفاوت از سبکی است که در محیطهای رسمی همچون دادگاه و دانشگاه از آن استفاده میکنند. گونههایی از یک زبان که متناسب با بافت اجتماعی گفتار مورد استفاده قرار میگیرند، سبکهای مختلف آن زبان به شمار میروند (مدرسی ۱۳۶۸: ۱۸۵-۱۸۶؛ همچنین رک. سارلی۱۳۸۷: ۱۶-۱۷). اما در میان این گونهها و سبکهای متفاوت معمولاً فقط یکی گون معیار (standard) یا گون وجههدارِ (prestigious) زبان شمرده میشود. گون معیار به گون وجههداری اطلاق میشود که مورد قبول اکثر افراد جامعه است و از آن در نوشتار، اخبارِ رادیو و تلویزیون، احکام حکومتی، و کلی محیطهای رسمی استفاده میکنند. گون معیار همچنین همان گونهای است که غالباً در جوامع چندزبانه از آن بهعنوان زبان مشترک و میانجی استفاده میشود و گاه بدان زبان رسمی یا زبان ملی اطلاق میشود.
«معیارسازی» (standardization) هم به انتخاب یک گون زبانی بهعنوان گون معیار اطلاق میشود، و هم به آمادهسازی و تقویت گون معیار برای انجام هرچه بهتر وظایفی که بر عهده دارد. تدوین فرهنگهای لغت و کتابهای دستور، تهی واژهنامهها و واژگانها، و نگارش آثاری چون «غلط ننویسیم» (نجفی ۱۳۹۷؛ نیز رک. طبیبزاده ۱۳۹۷)، «فرهنگ املایی زبان فارسی» (صادقی و زندیمقدم ۱۳۹۸)، «راهنمای ویرایش» (سمیعی ۹۵؛ ۹۷)، «فرهنگ توصیفی دستور زبان فارسی» (طباطبایی ۱۳۹۵) و غیره، همه و همه فعالیتهایی در جهت هرچه معیارترساختن زبان فارسی محسوب میشوند. گاهی معیارسازی به شکل طبیعی و بهاصطلاح خودانگیخته است، و گاهی بهصورت آگاهانه. مثلاً تا پیش از نهضت مشروطه در ایران زبان فارسی بهصورت طبیعی و خودانگیخته و با سرعتی بسیار اندک مسیر معیارشدن را طی میکرد، اما طی این مسیر پس از نهضت مشروطه و بهویژه در دوران پهلوی اول و پس از تأسیس فرهنگستان نخست، بهصورت آگاهانه درآمد و مدام بر سرعت آن افزوده شد. البته جریان معیارسازی در مورد زبانهای زنده و پرکاربرد هیچگاه متوقف نمیشود، و چه در حالت خودانگیخته و چه در حالت آگاهانه، همواره وجود دارد و مراحل گوناگون را پشتسر میگذارد. تعیین ویژگیهای زبان و خط معیار از طریق تدوین دستورهای زبان و خط امکانپذیر است و چون چنین دستورهایی بهناگزیر تجویزی هستند، گون معیار نیز خواهناخواه و پس از اندکی، مبدل به گونهای برساخته میشود که جریان تحول آن اندکی کندتر از جریان تحول زبان گفتار است. ازاینرو میتوان و باید هر چند سال یکبار به تجدیدنظر در ویژگیهای متفاوت گون معیار پرداخت و از این طریق مانع از ثابتماندن گون معیار و دورشدن آن از جریان تحول کلّی زبان طبیعی گفتار شد.
پردازش زبانهای طبیعی و متنهای علمی و خبری
حوز پردازش زبانهای طبیعی (Natural Language Processing= NLP) که آغاز شکلگیری آن به سالهای ده پنجاه قرن بیستم بازمیگردد، محل تلاقی سه رشت گوناگون زبانشناسی و علوم رایانهای و هوش مصنوعی است. این حوزه به تعامل میان رایانه و زبان اختصاص دارد و به موضوعاتی میپردازد همچون تحلیل و پردازش خودکارِ دادههای انبوه زبانی با استفاده از کامپیوتر، درک گفتار، تولید گفتار، تبدیل متن به نوشتار، تبدیل نوشتار به متن، بازیابی اطلاعات از درون متن، تهی پیکرههای عظیم زبانی و ترجم ماشینی و غیره. به اعتقاد نگارند این سطور اولاً با توجه به پیشرفتهای روزافزون در حوز پردازش زبانهای طبیعی، دیری نخواهد گذشت که زبانهای زند جهان برحسب میزان پیشرفتهایشان در استفاده از فناوریهای جدید در حوز پردازش زبانهای طبیعی، به دو دست زبانهای اصلی و زبانهای پیرامونی تقسیم میشوند؛ ثانیاً معیارسازی آگاهان زبان از طریق برنامهریزیهای زبانی و مخصوصاً از طریق ویرایش، سبب میشود تا متنهای علمی و خبری خودبهخود دارای ویژگیهایی شوند که کار متخصصانِ حوزههای گوناگون در پردازش زبان را در انجام کارهای خود بسیار ساده کند. بدیهی است که اگر قرار باشد زبان فارسی در آینده در زمر زبانهای پیرامونی نباشد، باید از هماکنون به تقویت هرچه بیشتر آن در این مطالعات یاری رساند. با آزمایشی ساده میتوان نشان داد که معیارسازی زبان نوشتار از طریق ویرایش، میتواند دارای چه سهم مهمی در آمادهسازی زبان از حیث مباحث مربوط به پردازش زبان باشد.
متنهای علمی و خبری از حیث نقش (function) و گونه و نیز پردازش دارای تفاوتهای بسیاری با متنهای ادبی هستند. از حیث نقش، زبانِ متنهای علمی و خبری همواره دارای نقش ارجاعی (referential) هستند اما در متنهای ادبی نقش شاعرانه (poetic) اهمیت دارد؛ یعنی در متنهای خبری و علمی همواره به جهان بیرون از متن ارجاع داده میشود و از این طریق بر اطلاعات خواننده افزوده میشود، اما در متنهای ادبی و مخصوصاً در شعر آنچه اهمیت دارد خود زبان است و آرایههای گوناگون ادبی موجود در آن. از حیث گونه، متنهای علمی و خبری همواره به گون معیار و رسمی نگاشته میشوند و استفاده از هر گون دیگری در آنها معمول نیست، اما در متنهای ادبی از انواع گونهها و سبکها ممکن است استفاده شود. و بالاخره از حیث مسائل مربوط به پردازش زبانهای طبیعی نیز متنهای علمی و خبری بیشترین میزان آمادگی را برای متخصصان این قبیل مطالعات دارند، اما به متنهای ادبی به علت پیچیدگیهای سبکی و معنایی متعددشان، کمتر از این حیث پرداخته میشود. بنابراین کار ویراستارانِ متون علمی و خبری بیش از هر چیز به مسئل گون معیار مربوط میشود؛ آنان با افزودن بر صراحت و سادگی این متنها باعث افزایش نقش ارجاعی آنها میشوند، و با کاستن از تنوعات زبانی در آنها امکان پردازش هرچه سریعتر و دقیقتر آنها را افزایش میدهند.
بررسی نقش ویرایش در پردازش ماشینی متنهای ویراسته یا معیار
اگر بخواهیم زبان فارسی در آینده در زمر زبانهای پیرامونی قرار نگیرد، باید از هماکنون ازطریق معیارسازی و نیز از طریق انجام پژوهش و مطالعات هرچه بیشتر در حوز پردازش ماشینی، به تقویت آن یاری برسانیم. در اینجا با آزمایش سادهای نشان میدهیم که چگونه معیارسازی آگاهان زبان و مخصوصاً فعالیتهای ویرایشی، خودبهخود باعث تسهیل کار متخصصانِ پردازش زبان فارسی میشود.
چهار بند زیر را بهطور کاملاً تصادفی از چهار روزنامه فارسی که به فواصل ۵۰ تا ۶۰ سال از سال ۱۲۲۹ شمسی تا ۱۳۹۹ منتشر شدهاند برگزیدیم. این روزنامهها به فواصل ۵۰ تا ۶۰ سال از هم منتشر شدهاند و هر یک از بندهای زیر نیز بهطور میانگین شامل ۱۰۲ واژه است. دو متن اول مبین معیارسازی خودانگیخته و دو بند دوم مبین معیارسازی کموبیش آگاهانه هستند:
۱. روزنامچه اخبار دارالخلاف طهران [وقایع اتفاقیه]
شمار ۱، جمعه پنجم ربیعالثانی ۱۲۶۷هق/ ۱۸ بهمن ۱۲۲۹: کشتی بزرک دولت فرانسه که در شهر برست بود یکصد و هست عراده توپ در میانش بود یکنفر از توپچیان فشنک آتشبازی درست میکرد ناکاه باروطی که در آنجا بود آتش کرفت و خود آن توپچی و هشت نفر دیکر که نزدیک او بودند آتش کرفته هلاک شدند و ده دوازده نفر هم از تخته پاره زخم دار شدند
درین روزها در دریاهای اطراف مملکت انکلیس و فرانسه طوفان زیاد شده و بسیار ضرر بکشتیها خورده است ازجمله یک کشتی در سمت مغرب ولایت انکلیس بسنک خورده و غرق شد و مالالتجاره که در آن بود سی پنجهزار پوند پول انکلیس بود که هفتاد هفت هزار تومان پول ایران باشد و همه تلف شد.۲
۲. حبلالمتین (تهران)
شمار ۱، صفح ۲-۳، ۱۵ ربیعالاول ۱۳۲۵هق/ ۹ اردیبهشت ۱۲۸۵هش: تا کنون هر گونه حوادث و وقایع که نتیجه آنها افتتاح مجلس شورای ملّی بود واقع میشد (انقلاب) میگفتیم اما پاره واقعات که این روزها بظهور رسیده و در بعضی اماکن سرزده و میزند باید آنهارا اختلال بگوئیم انقلاب – مبارزت و ستیزه است که فیما بین دولت و ملت واقع میشود و اختلال عبارتاست از اغتشاش و هرجومرجی که باغوا واغفال دولت و دولتیان ظاهر میشود و فائده اختلال برای دولت آنستکه انقلاب و مشاجره با دولت توقیف گردیده خلق بجان یکدیگر افتاده دولتیانرا آسوده میگذارند و حکومت از ضعف و سستی خلاص شده محکم و پایدار میگردد
۳. روزنام اطلاعات
شمار ۱۰۶۴۹، سال ۳۶، شانزده آبان ۱۳۴۰: امروز آقای دکتر امینی نخستوزیر بخبرنگار ما اظهار داشت که دولت امریکا مبلغی بایران بعنوان کمک بلاعوض میپردازد و یک وام نیز برای انجام کارهای کنونی سازمان برنامه در اختیار این سازمان میگذارد. آقای نخستوزیر اظهار داشت که دیروز ساعت ۴ بعد از ظهر آقای هولمز سفیر کبیر آمریکا، باتفاق برن رئیس اصل چهار در ایران، در کاخ نخستوزیری حضور یافت و تصمیم دولت آمریکا را در این مورد اطلاع داد. خبرنگار مادر باره جریان کمک بلاعوض آمریکا سؤال کرد و آقای نخستوزیر پاسخ داد که این کمک جنبه استثنائی دارد.
۴. روزنامه شرق
شمار ۳۸۵۹، سال ۱۸، دوشنبه ۱۹ آبان ۱۳۹۹: شکست دونالد ترامپ در انتخابات آمریکا، واکنش مقامات و مسئولان را در پی داشت. صفحه توییتر انگلیسی دفتر مقام معظم رهبری در واکنش به شکست ترامپ در انتخابات نوشت: «اوضاع در ایالاتمتحده و آنچه آنها خود در مورد انتخابات میگویند یک نمایش است! این نمونهای از چهره زشت لیبرالدموکراسی در ایالاتمتحده است. صرفنظر از نتیجه، یک چیز کاملا واضح است، سقوط قطعی سیاسی، مدنی و اخلاقی رژیم ایالاتمتحده». رئیسجمهور نیز در جلسه روز گذشته ستاد هماهنگی اقتصادی دولت، به نتیجه انتخابات ریاستجمهوری آمریکا اشاره کرد و گفت: «دولت آینده آمریکا از فرصت پیشآمده برای جبران اشتباهات گذشته استفاده کند.
میبینیم که هرچه متنها جدیدتر میشوند، نشانههای معیارشدگی آنها نیز بیشتر میشوند؛ مثلاً در متن شمار ۱ از هیچ علامت سجاوندی استفاده نشده است، در متن ۲ از دو علامت (یک پرانتز و یک خط تیره که کاربرد دومی معلوم نیست)، در متن ۳ از پنج علامت (سه نقطه و دو ویرگول)، و در متن شمار ۴ از ۱۶ علامت (پنج نقطه، پنج ویرگول، دو جفت گیومه نقل قول، دو دونقطه، و یک علامت تعجب) استفاده شده است. با جدیدترشدن متنها به تعداد علائم سجاوندی آنها اضافه میشود و هم استفاده از آنها نقشمندتر و صحیحتر میشود. بعداً خواهیم دید که استفاد نظاممند و دقیق از علائم سجاوندی فقط پردازش متن را برای انسان سادهتر نمیکند بلکه پردازش آن برای ماشین را نیز، مثلاً در ترجم ماشینی تسهیل میکند.
در مورد مسئل جدا یا سرهمنوشتن حرفهای اضافه و پیشوندهای فعلی و واژههای مرکب با دو گرایش متفاوت مواجه هستیم، در معیارسازی خودا
- همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
- ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
- در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.
مهسا فایل |
سایت دانلود فایل 