پاورپوینت کامل پایگاه داده های زبان فارسی در اینترنت ۴۵ اسلاید در PowerPoint
توجه : این فایل به صورت فایل power point (پاور پوینت) ارائه میگردد
پاورپوینت کامل پایگاه داده های زبان فارسی در اینترنت ۴۵ اسلاید در PowerPoint دارای ۴۵ اسلاید می باشد و دارای تنظیمات کامل در PowerPoint می باشد و آماده ارائه یا چاپ است
شما با استفاده ازاین پاورپوینت میتوانید یک ارائه بسیارعالی و با شکوهی داشته باشید و همه حاضرین با اشتیاق به مطالب شما گوش خواهند داد.
لطفا نگران مطالب داخل پاورپوینت نباشید، مطالب داخل اسلاید ها بسیار ساده و قابل درک برای شما می باشد، ما عالی بودن این فایل رو تضمین می کنیم.
توجه : در صورت مشاهده بهم ریختگی احتمالی در متون زیر ،دلیل ان کپی کردن این مطالب از داخل فایل می باشد و در فایل اصلی پاورپوینت کامل پایگاه داده های زبان فارسی در اینترنت ۴۵ اسلاید در PowerPoint،به هیچ وجه بهم ریختگی وجود ندارد
بخشی از متن پاورپوینت کامل پایگاه داده های زبان فارسی در اینترنت ۴۵ اسلاید در PowerPoint :
۱۳
از اوایل سال ۱۳۷۲، کار ایجاد پایگاه داده هایی برای زبان
فارسی در پژوهشگاه علوم انسانی آغاز، و تا سال ۱۳۷۸ دو مرحله (فاز) آن اجرا شد؛
و مرحله سوم که مهم ترین فاز یعنی گسترش و افزایش حجم داده ها و دگرگونی اساسی
در نرم افزار و ایجاد امکانات نوین شبکه ای برای ارائه خدمات و اطلاعات آن در
شبکه جهانی اینترنت بود بهدلیل نبود منابع مالی، چند سالی از اجرا بازماند تا
اینکه با کمک مالی وزارت ارتباطات و فناوری اطلاعات از سال گذشته اجرای فاز سوم
طرح آغاز شد و به تازگی به پایان رسید.
۱. پایگاه داده های زبانی
امروزه دیگر کسی درباره لزوم بنیادنهادن بررسی های زبانی و زبان شناختی بر
داده های واقعی و مستند تردیدی ندارد. پیکره زبانی هرچه گسترده تر و متنوع تر
باشد، معتبرتر و سودمندتر خواهد بود. گستردگی و تنوع پیکره در شکل های سنتی،
محدودیت های بسیاری را در پی دارد. هنگامی که حجم پیکره از مرزی می گذرد،
سامان دهی و بهره گیری از آن مشکل و سپس ناممکن می شود. گوناگونی داده ها گرچه
در بیشتر بررسی ها اهمیت بسیار و نقش تعیین کننده می یابد، بازهم مشکل را
پیچیده تر می سازد.
از سوی دیگر، بسیاری از فعالیت های علمی در حوزه زبان،
ادبیات و زبان شناسی، به داده های مشابهی نیاز دارند که هر یک برای خود تکه ای
یا گوشه ای از گستره زبان را دربر می گیرند و به کار می برند. چه بسا پیکره های
مشابه یا دارای همپوشی فراگیر که بدون آگاهی از وجود دیگری و با صرف وقت و
هزینه زیاد به وجود آمده و پس از بهره برداری به کناری نهاده شده اند. ایراد
دیگری که اغلب بر این داده های پراکنده وارد است، داشتن ناراستی های فراوان
به دلیل یکبار مصرف بودن آنها است؛ چراکه کمتر فرصتی برای آزمودن، ویراستن و
پیراستن آنها فراهم می شود. بالأخره، باتوجه به ماهیت ایستای اینگونه پیکره ها،
حتی اگر بخواهیم از آنها در طرح های دیگری بهره بگیریم، پس ازگذشت مدتی، کهنه و
شاید بی اعتبار به شمار آیند.
هدف از ایجاد پایگاه داده های زبان فارسی، فراهم کردن
پیکره ای مطلوب به دور از نارسایی است. پیکره ای که با وجود حجم عظیمی
ازداده های زبانی با گستردگی و گوناگونی های بسیار، ساختاری به سامان و منطقی
داشته باشد تا امکان هر گونه جست وجو و دستیابی سریع به آگاهی های مورد نیاز را
در هر زمان فراهم سازد. چنین پیکره ای می تواند همواره روزآیند شود و پاسخگوی
نیاز همه پژوهندگان زبان فارسی و کاربران گوناگون در همه زمینه های نظری و
کاربردی باشد.
۲. ویژگی های پایگاه
۲ـ۱. گستره زبانی
زبان فارسی، مفهومی بسیار وسیع دارد و می تواند دربرگیرنده
همه گونه های گفتاری، نوشتاری، سبکی و کاربردی این زبان در تمامی دوران های
تحول آن باشد. برای نزدیک شدن به این دریای داده ها لازم است آن را به
محدوده هایی بخش کنیم و به تدریج و طی مراحلی منظم آنها را پوشش دهیم.
در نخستین مرحله با توجه به نیازهای گوناگون پژوهشی و
کاربردی، از طیف دوران های تاریخی زبان فارسی، برش فارسی معاصر برگزیده شد.
همین برش نیز که به طور قراردادی از آغاز قرن چهاردهم خورشیدی تا امروز را دربر
می گیرد، خود گونه های بسیاری دارد؛ ازجمله: گونه رسمی نوشتاری یا به اصطلاح
فارسی معیار و گونه گفتاری آن، گونه های ادبی، سبکی و حرفه ای فارسی، گونه های
محاوره ای و عامیانه آن، و گونه هایی که متغیرهای زبانی و اجتماعی دیگری مانند
سن، جنس، سواد و تحصیل، طبقه اجتماعی، و محیط های مختلف ارتباطی، عامل تمایز
آنها به شمار می روند.
۲ـ۲. منابع گردآوری داده ها
با توجه به گونه های یادشده، بایسته است که با روش هایی
متفاوت و مناسب، داده های مورد نیاز فراهم و در درون حافظه رایانه سازماندهی
شود. برای نمونه، از گونه هایی که به شکل نوشتاری وابسته اند، با استفاده از
متن های معتبر و با رعایت معیارهای مختلف نمونه گیری می شود و هیچ گونه محدودیت
و امساکی درمورد آثار مهم ادبی و نویسندگان سرشناس و به ویژه صاحب سبک و
تأثیرگذار اعمال نمی شود. تاکنون گردآوری، درون داد و سامان دهی داده ها در چند
مرحله انجام شده است و بازهم ادامه خواهد یافت:
۱. ابتدا فهرست های مفصلی از همه منابع مهم نظم و نثر فارسی
فراهم شد. این فهرست ها به طور جداگانه برای آثار شعری، داستانی، غیرداستانی،
نمایشنامه و فیلمنامه، ادبیات کودکان، نشریه های ادواری و مجلات علمی، تخصصی و
ادبی فراهم شد. عناوین آثاری که در این فهرست ها قرار گرفتند، بیش از
یک هزاروپانصد مورد شد که پس از بررسی و کنارنهادن موارد مشابه، بیش از پانصد
عنوان برای درون داد به پایگاه داده ها برگزیده شد. می توان ادعا کرد که
نمونه های برگزیده، نماینده ای واقعی از زبان فارسی معاصر به شمار می رود.
فهرست کامل ۱۵۰۰ متن مهم نظم و نثر ادبیات معاصر ایران و
انواع دیگر متون زبانی شامل:
ــ ۴۵۲ اثر داستانی و غیرداستانی نثر
ــ ۲۴۹ اثر شعری از شاعران معاصر
ــ ۸۴ عنوان مجله و نشریه علمی، ادبی و تخصصی
ــ ۳۱۱ عنوان نمایشنامه
ــ ۸۰ عنوان فیلمنامه
ــ ۲۰۰ عنوان ادبیات کودکان
ــ چندین عنوان روزنامه و نشریه خبری، همه پسند و متنوع
ــ برخی از کتاب های درسی و دانشگاهی و دبیرستانی
ــ برخی از کتاب های دبستانی
ــ نامه های اداری و بخشنامه ها
ــ مجموعه ای از قوانین و مقررات
ــ نشریه ها و جزوه های پراکنده، پوسترها، دیوارنوشته ها و
مانند اینها
۲. فهرستی با بیش از ۵۰۰ اثر از میان آثار بالا برای تایپ
دستی برگزیده شد.
۳. بیش از ۳۰۰ متن، در مجموع بیش از ۲۴۰۰۰ صفحه که به بیش
از ۵ میلیون واژه می رسد، تایپ شد.
۴. متن های دیگری شامل کتاب و مقاله های تخصصی با نزدیک به
۰۰۰ر۰۰۰ر۱۰ واژه گردآوری شده که دردست تبدیل، ویرایش و درون داد است.
۵. بیش از ۲۰ ساعت گفتار پیوسته مربوط به محاوره عادی
افراد، برنامه های رادیویی و تلویزیونی بر روی نوار ضبط شد.
۶. متن های گفتاری از نوارها بر روی کاغذ پیاده سازی شد.
۷. متن های یادشده با بیش از۰۰۰ر۱۰۰ واژه تایپ شد.
۸. بخش های مشخصی از متن های تایپ شده با بیش از سه میلیون
واژه ویرایش دوباره شد.
۹. بخش های برگزیده از متون ویرایش شده برچسب دهی دستوری و
معنایی شد. (این کار، ادامه دارد.)
۱۰. متن های زیر با روش های گوناگون به صورت الکترونیکی
فراهم شد:
ــ متن۱۲ واژه نامه مختلف
ــ همه متن های روزنامه همشهری از سال ۱۳۷۵ تا آغاز سال
۱۳۸۲ (روی هم ۳۴۵ مگابایت با فرمت HTML و شامل تعداد ۱۹۰۲۰۶ مقاله و ۶۳ میلیون
واژه)
ــ همه متن های روزنامه همشهری شش ماهه آغازین سال ۱۳۸۲
(روی هم ۶۳ مگابایت و بیش از ۰۰۰ر۲۵۰ر۶ واژه). این بخش به شکل موضوعی جداسازی و
دسته بندی شده است. البته از متن های روزنامه ای تنها نمونه هایی با نزدیک به
۲۸ میلیون واژه برگزیده شده و به پایگاه داده ها درون داد شده است.
همان گونه که دیده می شود، مجموع متن های گردآوری شده، حدود
۰۰۰ر۰۰۰ر۸۴ واژه می شود که تاکنون تنها ۳۶ میلیون واژه از آن به درون پایگاه
وارد
- همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
- ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
- در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.
مهسا فایل |
سایت دانلود فایل 