پاورپوینت کامل گزارشی از فعالیت های مرکز کامپیوتری علوم اسلامی و تولید بازی های اسلامی ۱۲۰ اسلاید در PowerPoint


در حال بارگذاری
10 جولای 2025
پاورپوینت
17870
2 بازدید
۷۹,۷۰۰ تومان
خرید

توجه : این فایل به صورت فایل power point (پاور پوینت) ارائه میگردد

 پاورپوینت کامل گزارشی از فعالیت های مرکز کامپیوتری علوم اسلامی و تولید بازی های اسلامی ۱۲۰ اسلاید در PowerPoint دارای ۱۲۰ اسلاید می باشد و دارای تنظیمات کامل در PowerPoint می باشد و آماده ارائه یا چاپ است

شما با استفاده ازاین پاورپوینت میتوانید یک ارائه بسیارعالی و با شکوهی داشته باشید و همه حاضرین با اشتیاق به مطالب شما گوش خواهند داد.

لطفا نگران مطالب داخل پاورپوینت نباشید، مطالب داخل اسلاید ها بسیار ساده و قابل درک برای شما می باشد، ما عالی بودن این فایل رو تضمین می کنیم.

توجه : در صورت  مشاهده  بهم ریختگی احتمالی در متون زیر ،دلیل ان کپی کردن این مطالب از داخل فایل می باشد و در فایل اصلی پاورپوینت کامل گزارشی از فعالیت های مرکز کامپیوتری علوم اسلامی و تولید بازی های اسلامی ۱۲۰ اسلاید در PowerPoint،به هیچ وجه بهم ریختگی وجود ندارد


بخشی از متن پاورپوینت کامل گزارشی از فعالیت های مرکز کامپیوتری علوم اسلامی و تولید بازی های اسلامی ۱۲۰ اسلاید در PowerPoint :

در گفت وگو با دکتر بهروز مینایی: رئیس بنیاد ملی بازی های رایانه ای

لطفاً در خصوص مرکز کامپیوتری نور و پیشینه تولید نرم افزارهایی در زمینه علوم اسلامی توضیح بفرمایید.

ما از سال ۶۷ شروع به کار کردیم. آن زمان تازه کامپیوتر وارد قم و در واقع ایران شده بود و کامپیوترهای رده های PC اولین کامپیوترهایی بود که وارد ایران شد. ما چندتایی از آنها را با هزینه های شخصی خریداری کردیم. دوستان قبل از اینکه مرکز تأسیس شود، با یک تلاش پیگیر روی معجم موضوعی بحار کار کرده بودند که ده جلد است. البته بعد از اینکه آیت الله خامنه ای در اولین سال رهبری شان قبول کردند که کل هزینه کامپیوتری شدن بحارالانوار را بدهند، موضوعات از ده جلد به کل مجلدات تبدیل شد و روی همه آنها کار شد. شاید سابقه کارهای موضوعی ما قبل از کارهای الفاظ مان باشد. آغاز کار به این صورت بود که دوستان بیشتر چکیده گیری از موضوعات احـادیـث بـحارالانوار می کردند و پس از فیش برداری، این فیش ها را کامپیوتری می کردند. یک کار هم روی رجال کتب اربعه و سلسله اسناد کتاب های رجالی انجام شد و نقطه آغازین شروع کار مرکز نور که آن زمان اسم آن نور نبود، از اینجا شروع شد. سال ۷۰ـ۷۱ که می خواستیم در نمایشگاه Gtex که یک نمایشگاه IT در امارات متحده عربی بود شرکت کنیم، دو موضوع پیش آمد: یکی اینکه اسم محصول انتخاب کردیم که نور بود و بعداً هم به نام مرکز نور تبدیل شد و همچنین کارهایی که در زمینه فقه و حدیث انجام شده بود را با موضوعات قرآنی ارائه کردیم؛ چون آنجا در محیطی قرار می گرفتیم که اهل تسنن هم بودند. کار اول ما قرآنی نبود و بعداً به کارهای قرآنی پرداختیم و قرآن با تفسیر المیزان و معجم الفاظ قرآن در یک دیسکت عرضه شد که برای اولین بار ما در آنجا حضور خوب و جدی داشتیم؛ به طوری که برای تهیه دیسکت نور که در یک دیسکت ۴۴/۱ مگابایتی قرآن را با تفسیر عرضه کرده بودیم، صـف تشکیل می شد. در ابتدای کار به دلیل اینکه مشکل حافظه داشتیم و حجم کارهای ما خیلی زیاد بود، یک روش فـشرده سازی ابداع کردیم که تا به حال از این روش جایی استفاده نشده بود. این روش یک روش کد کردن و زیپ کردن اطلاعات بود. چون هاردهای آن زمان از ۲۰ مگابایت یا ۴۰ مگابایت فراتر نمی رفت. حال آن که فضایی که ما برای درست کردن حجم سنگینی مثل بحارالانوار و وسائل الشیعه و کتب اربعه نیاز داشتیم خیلی بیشتر از اینها بود. ما مجبور بودیم به شیوه های خاصی اطلاعات را فشرده کنیم و آن اطلاعات فشرده در بازار به صورت دیسکت بین مسلمانان پخش می شد. و توانستیم مجموعه معجم الفاظ بحار را در ۱۵ دیسکت ۴۴/۱ مگابایتی عرضه کنیم و حدوداً ۲۰ مگابایت شد و این کار مهمی بود، چون بحار ۱۳ میلیون کلمه داشت و ما توانستیم سیزده میلیون کلمه را با همه قدرت جست وجویی که دارد، با تمام ایندکس ها، تمام کارهایی که برای یک جست وجوی لفظی خیلی سریع لازم است در ۲۰ مگابایت خلاصه کنیم که در نوع خود، کار بدیعی بود و بعداً شرکت هایی مثل مایکروسافت یا شرکت های خارجی دیگری هم که در دبی نماینده داشتند، اظهار تعجب کردند و می گفتند اینها را به صورت یک الگو یا فرمول مطرح کنید که ما پیگیری نکردیم. معمولاً قدرت عرضه ما مثل قدرت تولید ما نبود. قدرت تولید خیلی خوبی داشتیم و واقعاً هم حوزه در زمینه آوردن IT در حوزه علوم اسلامی و پردازش متون اسلامی خیلی جلوتر از دانشگاه بود. آن هم به علـت وجـود نـیروهای نسبتاً قوی ای بود که در اثر انقلاب فرهنگی دانشگاه را رها کرده بودند و به حوزه آمده بودند و بچه های مستعد خود حوزه هم به اینها ملحق شده و یک محیط همکاری خوبی بین آنها به وجود آمده و اینها بنیانگذار حرکتی در حـوزه شـدنـد کـه بـعدها شرکت هایی مثل نور، یاسین و شرکت های دیگری که در زمینه عرضه پایگاه های اطلاعاتی که می توانند به محققان و پژوهشگران کمک کنند، به وجود آمدند.

در معجم های موضوعی نیمی از کارها توسط ماشین و نیمی توسط انسان انجام می شود. به عبارتی اصل موضوع برداری توسط انسان های خبره انجام می شد، بدین ترتیب که یک متن و یک پاراگراف توسط یک محقق خوانده می شد و بعد عصاره آن متن با یک عبارت غیرجمله ای و به صورت خلاصه وار مطرح می شد که بیانگر چیست و چه مطلبی را مطرح می کند؟ مثلاً حدیثی راجع به دلاوری حضرت علی(ع) در جنگ خیبر بود، در قلعه خیبر را کند یا فضیلت حضرت علی(ع.) بعد کم کم از خود آن عصاره یک نمایه هایی استخراج می شد. حالا این اسامی ممکن است که در جای دیگری عناوین دیگری داشته باشند. مـثـلاً تـحـت عـنـوان »فضل علی« یا »حرب خیبر«، اینها نـمـایه گذاری می شد و بعد از این نمایه ها یک سری کلمات کلیدی انتخاب می شد مثلاً »علی«، »جنگ«. اینها تک تک کلیدواژه می خورد و این کلیدواژه ها در حقیقت مدخل ورودی کار محققین بود و این یک کار کاملاً مفهومی بود. لازم نیست که در متن این لفظ خاص به کار برده شود؛ در حقیقت این برداشت مـحـقـق بـود. ایـن کارها یک مقدار سلیقه ای بود، چون با پس زمینه ای که محققق داشت تنظیم می شد. در زمینه های فلـسـفه نیز کتب فلسفی تقریباً رایج حوزه و همچنین کتب تخصصی قبلی و منطق و کلام و همین طور در زمینه کتب فقهی که معمولاً در حوزه کاربرد دارد، مثل رسائل، المکاسب، کفایه و لمعه و بعداً هم مستمسک مرحوم حکیم، جواهر و شرایع نیز یک سری کارهای چکیده برداری و موضوع زنی و ایجاد یک فـضـای مـنـاسـب تحقیقاتی و فیش برداری ها توسط دست برداشته شد. بعدها همه این روندها ماشینی شد و الان تمام فیش برداری ها ماشینی است. اوایل اطلاعات در کامپیوترهای کومودور انجام می شد و بعد یک بُردی طراحی شده بود که کومودور به فرمت های IBM و فرمت هایی که سازگار با IBM بود، تبدیل می کرد. چون کامپیوترهای IBM بسیار گران بودند و بالای ۶۰۰ الی ۷۰۰ هزار تومان قیمت داشتند؛ (زمانی بود که قیمت زمین در قم بیشتر از هشت هزار تومان نبود.) به عبارتی قیمت یک کامپیوتر خیلی گران بود. اما خوب کومودور ارزان تر بود و از اینها برای تایپ استفاده می شد. بعداً که یک هیأت مــدیــره انــتــخــاب شـد، هـمه اینها به صورت منسجم و برنامه ریزی سالانه و پنج ساله برای این مرکز مطرح شد که ما در چه افق هایی می خواهیم حرکت کنیم و حرکت صرفاً به یک کتاب حدیث ختم نشد و تمام کتاب های حدیث، فقهی، اصولی و مـنطقی در دستور کار ما قرار گرفت و از همه اینها تعبیر معجم های لفظی یا کتابخانه های الکترونیکی، در دستور کار قرار گرفت و تقریباً می شود گفت که الان اکثر قریب به اتفاق کتاب های علوم اسلامی به صورت یک کتابخانه دیجیتال، البته نمی گویم تحت وب، درآمده است. شکل اینترنتی آن در سال ۸۸ به وجودآمد من این را باید اذعان کنم که در زمینه رفتن به سمت وب به دلیل اینکه بستر استفاده وب در ایران ضعیف اسـت، دیر حرکت کردیم، ولی در زمینه نرم افزارهای تحت ویـنـدوز بـرگ بـرنـده همیشه دست ما بود؛ حتی نسبت به کشورهای اسلامی دیگر مثل: مصر، کویت و امارات متحده عربی ما جلوتر بودیم. ان شاءالله قصد داریم تمام معجم های موضوعی و حتی لفظی را داخل فضایی مانند ویکی مدیا، ویکی پدیا و… ببریم که دائماً اطلاعات توسط پژوهشگرها زیاد شود و بـخصوص در حوزه هایی که سلیقه ای است و دیدگاه های پــژوهــشـگـران ممکن است تأثیری در نوع برداشت از حدیث داشته باشد، یک مجمعی درست شود و این مــعـجم هـا مـثلاً در سـایـت های ویکی نور که در دستور کارمان قرار گرفتند، مـی توانند راه گـشـا باشند. اگر بخواهیم از لحاظ موضوعی حوزه ها را تقسیم بندی کنیم، یک حوزه کارمان در قرآن و تفسیر بود که قـرآن و تـفـسـیـر جـز اولین کارهای خروجی مرکز در سطح بین المللی بود. حوزه دیگر حدیث بود؛ بخصوص احادیث شیعه که تجمیع احادیث شیعه و سنی جدیداً در دستور کار قرار گرفته است. در ابتدا تفاسیر اهل سنت مدنظر نبود، بعد در نورالانوار ۳ یا جامع التفاسیر نور ملحق شد. تقریباً هر آنچه در کتاب های شیعه داشتیم کتاب های اهل سنت را هم ضمیمه کـردیم؛ چـون یک محقق معمولاً می خواهد در کل فضای اطلاعات علوم اسلامی کار کند. نورالانوار ۱ فقط تفسیر المیزان را داشت، نورالانوار ۲ حدود ۹ عنوان تفسیر بود که مجموعاً تفاسیر مورد استفاده شیعه به زبان های فارسی و عربی بودند؛ تـفـسـیـر نـمـونـه، تـفسیر مجمع البیان، تفسیر امام حسن عـسکری(ع)، تفسیر علی بن ابراهیم قمی و تفسیر فرات کوفی. ۹ عنوان تفسیر بود که این عنوان ها ۸۶ جلد تفسیر می شد. نورالانوار ۲ سال ها مورد استفاده بود. هنگامی که برای تحصیل به آمریکا رفته بـودم، تـنها منبعی که برای تبلیغ در اختیار من بود همین نورالانوار ۲ بود. کارهای تبلیغی من آنجا خیلی بیشتر از ایران بود. به طور کلی طلبگی ما خیلی قوی تر از اینجا بود. اینجا بیشتر جنبه فنی داشت، اما آنجا چون دیگر کمتر کسی در دسترس بود، ما هم آستین ها را بالا زدیم و یک مقدار به عنوان مبلغ علوم اسلامی فعالیت کردیم. هیچ منبعی هم همراه خودم نبرده بودم، فقط همین سی دی جامع التفاسیر نور و جامع الاحادیث یا نور ۲ بود که اینها خیلی مورد استفاده بود. ولی خوب در ضمن کار و برداشت از اینها، نقص های اینها خیلی به چشم می خورد یا ملموس احساس می شد که وقتی برگشتم سعی کردیم که در جامع التفاسیر نور این نقص ها را بـرطـرف کــنـیم. در هـمـیـن جامع التفاسیر نور تا اندازه ای توانستیم قابلیت های بیشتری را در اختیار محققان قرار بدهیم. پس می شود گفت زمینه دوم کاری حدیث بود، بعد فقه و اصول. یک کتابخانه اصول در سال ۷۸ تکمیل شد و بعد از آن، هم کنار آن معجم کتاب های فقهی را در دستور کار قرار دادیم که اولین مــعــجم، مـعـجم الفاظ فقه بود که حدود ۲ـ۳ هزار جلد کتاب داشت که الان این مجموعه خیلی غـنـی تر شده است. در زمینه فلسفه و منطق هم در تراجم کتاب شناسی کار کردیم. البته باید اذعان کنیم که همه ترجمه ها مربوط به کتاب های شیعه است؛ الذریعه شیخ آقا بزرگ تهرانی و اعیان الشیعه سیدمحسن امین بیشتر محور کار بودند. اکنون چند کتاب دیگر هم کنارش زمینه شـده، از جـمله کارهای آقای سبحانی. در زمینه کتاب های تـاریـخـی هم با همکاری گروه تاریخ که اینجا داشتیم، در نورالسیره ۱ سعی کردیم مجموع کتاب های تاریخ اسلام را در یک جایگاه جمع کنیم. البته ۴ـ۵ کتاب اولیه تاریخ بیشتر در نورالسیره ۱ مطرح بود، اما از همین ۴ـ۵ تا مثل تاریخ سیره ابن هـشام یا تاریخ طبری، کار جدیدی بـود. حـالا نـمـی گـویم چـکـیـده گـیـری سنگین، بلکه یک نمایه گذاری بر متن بود؛ یعنی فراغنی سازی متون تاریخی. متون تاریخی مطالعه شده بود و روی اینها یک نمایه خورده بود؛ مثلاً این قسمت راجع به جنگ، این قسمت راجع به زمان ها یا قیافه ها و نمایه های روی متن خورده. از این نمایه ها فهرست تهیه شد شاید بیشتر از صد و چند فهرست روی کتاب های تاریخی مطرح شد که نور سیره ۲ می شود گفت که حدود ۴۰۰ جلد کتاب تاریخی است و روی ایـن کـتـاب هـای تـاریـخی انواع و اقسام رویکردها و کلیدواژه های تحقیقاتی زده شده بود که اینها یک مجموعه نسبتاً خوبی بود. در کنار آن نرم افزارهای چندرسانه ای آمد. مثلاً فرض کنید تصاویر تمام نقشه هایی که در همه جاهای مـختلف هست، سلسله انصاب اشخاص به صورت درختی مطرح شد. البته ایـنـجـا صوت مطرح نبود، اما در کتاب های مجموعه های قـرآنـی مـان صوت و فیلم و انیمیشن نیز یک نقشی بـازی می کرد؛ با این هدف که از این رسانه های جدید هم استفاده شود تـا بـتـوانـد کـار غنی تر دنبال شود و تقریباً حالت دانشنامه الکترونیکی خوبی از کارها مطرح شد.

زمینه دیگری که می شود گفت غیر از اینها بود، موضوع نـهج البلاغه و همین طور کتاب های ادعیه و زیارت در یک مجموعه بود که بیشتر مورد نیاز هم محققان بسیار پیشرفته و هم افراد عادی جامعه بود و یک رویکرد جدید از مفاتیح و دعا و زیارت مطرح شد که در نورالجنان سال ۷۸ اولین نسخه آن را آوردنـد و نـسـخه های بعدی که غنی تر شده و بعد صحیفه سجادیه و مفاتیح همراه با صوت کار شد.

آیا ادبیات فارسی هم در کارهای مرکز گنجانده شده است؟

ادبیات فارسی تقریباً از سال ۷۹ در دستور کار مرکز قرار گرفت و اولین کار ادبیات ما مثنوی بود که شامل متن و صوت بود که استاد آهی و آقای نوری، ۶ دفتر آن را کامل خواندند. بعد از آن، شاهنامه در سال ۸۰ـ۸۱ آمد که به ۳ یا ۴ زبان در دو سی دی ترجمه شد.

در مورد زبان های دیگر چطور؟ کاری در این زمینه ها انجام شده است؟

ما از سال ۷۶ یک کتابخانه فقط انگلیسی از تمام کتاب هایی که معمولاً یک پژوهشگر دانشگاهی که در رشته علوم اسلامی نیاز دارد، تقریباً با حدود ۲۰۰ جلد عرضه کردیم. در حقیقت می خواستیم بگوییم که توان ما فقط فارسی و عربی نیست، بلکه در کتاب های انگلیسی هم توانایی داریم. لذا اولین معجم لفظی انگلیسی که چند تا فهرست نسبتاً جالب هم داشت و موضوعات آن در کتاب های دینی ۵ـ۶ عنوان بیشتر نبود؛ قرآن، مجموعه کارهای ادبیات شکسپیر، انجیل، عهد عتیق را از کتابخانه های اینترنتی پیدا کردیم. در کنار آن یک مجموعه ۲۰۰ عنوانی که رشته کلام فلسفه مورد نیازشان هست به سه زبان کار کردیم؛ گرچه قرآن در جامعه تفاسیر نور به ۲۹ زبان ترجمه شده، اما کل برنامه به ۳ زبان فارسی، عربی و انگلیسی همیشه در دستور کار ما بوده است.

البته یک برنامه ای را من فراموش کردم که مطرح کنم. من سـال ۷۶ درس های خارج را تازه شروع کرده بودم که وارد دانشگاه هم شدم. البته از سال ۶۵ تا ۶۹ در رشته ریاضی کاربردی در کامپیوتر لیسانس گرفتم. سال ۷۴ با وجود اوج کارها در مرکز نور وارد رشته مهندسی نرم افزاری دانشگاه علم و صنعت شدم و هدف من این بود که یک کار جالبی را در زمینه رجـال انـجـام دهم و ایـده ای را مـطـرح کـردم که فراتر از پـردازش های متنی و موضوعی روی کارها بود، و اینکه آیا می توان از هوش ماشین برای غنی تر کردن کارهایی که روی متن انجام می شود، استفاده کرد؟ یک سمیناری را در سال ۷۳ در قم بــا ایـن عنوان که آیا می شود از هوش مصنوعی در پایگاه های اطلاعاتی علوم اسلامی استفاده کرد یا نه؟ برگزار کـردیم. تـقـریـبـاً مجموعه اساتیدی که در ایران در هوش مصنوعی دستی در کار داشتند دعوت شدند و در موضوعاتی چـون: یـادگیری ماشین، شبکه های عصبی، الگوریتم های ژنـتـیـک و تـخـصـص هـای مختلف سخنرانی کردند. دکتر کارالوکس از دانشگاه تهران، دکتر میرزایی و دکتر قاسم ثانی، دکتر بیگی و دکتر بدیع حضور داشتند و نظرات خیلی خوبی ارائه کردند. بعد من در پروژه فوق لیسانسم خواستم ببینم که آیا می توانیم یک فقیه یار طراحی کنیم؛ یعنی یک کامپیوتر در خدمت فقیه قرار بگیرد و بتواند یک سری کمک هایی را به صورت هوشمندانه در اختیار او قرار بدهد؛ همین طور که هوش مصنوعی به کمک طبیب یا پزشک رفته یا در علم شیمی مورد استفاده قرار گرفته یا در تکنولوژی آموزشی با شخصی سازی آموزش، کمک های فراوانی کرده است؛ مثلاً روش یاد دادن زبان پاسکال یا درس شیمی مخصوص یک دانشجو بر طبق همان درجه هوشی اش. با تست هایی که از آن شخص می گیرد متوجه می شود که درجه هوش یا دریافت های قبلی شخص این مـیزان بوده و بعد طبق آن، یک برنامه ریزی آموزشی برای شخصی می کند. از سی سال گذشته در این زمینه خیلی کارها انجام شده، اما کارهای موفق خیلی قوی، روی علوم خاصی انـجـام شـده بـود. از سال ۱۹۹۸ میلادی به بعد یک زمینه داده کاوی و بعد متن کاوی به وجود آمد که از انبوه اطلاعات سنگینی که در یک جایگاه یا مخزن وجود دارد الگوهایی را کشف کنیم و از این الگوها با یک پیش بینی وضعیت آینده یا تـوصـیـف وضـعـیـت جـاری مـان یـا قـوانین پنهانی که بین ویژگی های داده های سیستم وجود دارد، استفاده کنیم.لطفاً موضوع داده کاوی در زمینه علوم اسلامی را کمی بیشتر توضیح بفرمایید.

نـقـطه شروع من در استفاده سیستم های خبره از پروژه کـارشـنـاسـی ارشـد شروع شد. با این هدف که آیا می توان سیستم های قانون مند یا روش مند Rule Base را به کمک فقیه بیاوریم یا نه؟ سیستم هایی که مبتنی بر قانون کار می کنند، اما قانون را خود ماشین اعمال می کند و نیازی نیست که ما همه حالت ها را از قبل به آن گفته باشیم و خود ماشین می تواند یک نوع استنتاج داشته باشد و کافی است به آن مقدمات را بدهیم. در بخش اول تحقیقم یک نوع امکان سنجی انجام شد که آیا اصلاً می شود هوش مصنوعی را در فقه به کار گرفت یا نه؟ که دیدیم بله می شود به عنوان یک کمک یار مطرح شود. سپس حدود ۶ـ۷ زیر سیستم در این زمینه در نظر گرفتیم. قسمت های مشکل کار ادبیات و درک متن توسط ماشین بود. درایه و رجال قسمت ریاضی گونه و ساده تر ـ شبیه مثلثات نسبت به جبر ـ بود که قوانین اش منضبط تر و ساده تر بود. ما در قسمت رجال یک پیاده سازی داشتیم و مجموعه کارهایی که در مرکز در زمینه رجال در ۸ـ۹ سال انجام شده بود و تمام تحقیقاتی که آیت الله شبیری زنجانی در زمینه رجال داشت و معجم اسناد کتاب های اربعه مورد استفاده شیعه و همین طور وسائل الشیعه را سعی کردیم در یک جا جمع کنیم. در حقیقت کار اصلی، علاوه بر اسـتنتاج(این حدیث صحیح یا ضعیف است یا قوی) تمام تحقیقاتی که این بزرگان انجام داده بودند، بخصوص همه کارهایی که آقای خوئی در معجم رجال خودش کرده بود و تمام آن زحمت هایی که کتاب های ثمانیه رجال هست، مثل: رجال کشی، رجال ابن غزائلی تا آخرین سطح آن که برای آقای حلی بود، فهرست رجال نجاشی و اینها هم بود. تمام جاهایی که راجع به یک راوی قضاوت کرده بود که این آقا ثقه است یا ضعیف؟ تمام این حالت ها سعی شد که در یک حالت استانداری درست شود. همچنین تمام سلسله شیخ و شاگردها از همدیگر، راویـون و مـرویون، یافتن طبقه راوی و اینکه این شخص می تواند از آن شخص روایت بکند یا اینکه ممکن است در این سند سقمی اتفاق افتاده باشد، مشکلاتی که در بازیابی اسناد وجود داشت مثل اینکه گاهی وقت ها مرجع به صورت ضمیر هست مثل عنه، در نظر گرفته شد.

آیا دستگاه این را به صورت هوشمند متوجه می شود؟

یک قسمتی توسط انسان صورت گرفته بود، ولی فرض کنید مرجع ضمیرها یا یک روایتی معلق بر روایت قبلی گفته شده بود، توسط ماشین انجام شد. اما خود مبنا که این شخص ضعیف است یا نه را ما تعریف کردیم. ما اسم آن را گذاشتیم: »سیستم یافتن هویت راویان«. یک راوی به اسامی مختلف آمده است. مثلاً محمد بن ابی امیه هشت عنوان مختلف دارد. گاهی وقت ها ابن ابی امیه، گاهی وقت ها محمد بن ابی امیه و بیاع الصابری و یا حتی کنیه آن ابن ابی زیاد هم ذکر شده است که باید این اسامی مختلف برای یک نفر را به یک هویت برگردانیم و چند هویت در نظر نگیریم که اصطلاحاً به آن توحید مختلفات می گویند. یک سیستم تمیز مشترکات نیز داریم که یک عنوان برای چند نفر است؛ مثل ابن سنان که هم عنوان است برای محمد بن سنان که شاگرد امام هشتم(ع) و روی آن خیلی شک اسـت، –آقـای خـوئـی کـامـلاً تـضعیفش می کند ولی امام خمینی(ره) ایشان را تقویت می کند و می گویند ایشان جزء اصحاب سِر است–، یک شخص دیگر هم به نام عبدالله بن سنان که شاگرد امام صادق(ع) و ثقه است و همه او را قبول دارند و یا لفظ محمد بن یحیی که محمد بن یحیی شش تا داریم لفظ احمد بن محمد، احمد بن محمد بن عیسی، احمد بن محمد خالق برقی واحمد بن محمدهای دیگر. یافتن اینکه این شـخـص کـدام یـک از احـمـد بـن محمدهاست، ماشین از روش های یادگیری های تقویتی که ما از او تقلید می کنیم، کمک می گیرد. اما در اصل خود سیستم یک سیستم مبتنی بر قانون است که کار اصلی آن تشخیص صحت و ثقم حـدیـث است. ما قوانین علم رجال را برای ماشین تعریف کردیم. گفتیم که اگر در سلسله سند یک آدم ضعیف بود نتیجه تـابع اخس مقدمات است؛ یعنی اینکه این روایت تضعیف می شود یا اگر همه ثقه بودند و یک نفرشان سنی است، این می شود موثق؛ مثل روایتی که در آن سکویی وجود داشته باشد. تـمام این قوانین آنجا گذاشته شده و خود ماشین می تواند استدلال کند. اگر مبنای شخصی راجع به مثلاً محمد بن سنان قوت بود می تواند به سیستم بگوید و سیستم با توجه به مبنای شخص، استنباط کند که این سند قوی است یا ضعیف.

به عبارتی خود سیستم نمی تواند این کار را بکند که مثلاً فلان راوی ثقه است یا نه؟

نـه، در واقع علم رجال علمی است که خود مجتهد هم نمی تواند در مورد شخص قضاوت کند و باید مدرک داشته باشد. ما مدارک توثیق و تضعیف را همان کتاب ثمانیه رجال گرفتیم. یعنی آنچه را که نجاشی گفته است ثقه است ما گفتیم ثقه است یا شیخ در فهرست و رجال گفته. یک جاهایی هست که بین اینها تضاد پیش می آید مثلاً کسی گفته قوی است و یکی گفته ضعیف، –مثل همین محمد بن سنان که محمد بن سنان کسی است که بعضی ها تقویتش کردند و بعضی ها تضعیف– شخص در آخر باید یک مبنایی را راجع به این شخص انتخاب کند. این دیگر وابسته به مبنای مجتهد است. این سیستم خودش فقیه نیست، بلکه فقیه یار است. ما هم در آنجا تأکید می کنیم که این سـیـسـتم نـمـی خـواهـد جـایـگـزیـن فـقیه شود و تنها یک یـادآوری کـننده برای فقیه می باشد؛ چون بسیاری از جاها هستند که مبنای اصولی با مبنای فقهی فرق می کند. در اصول یک مبنا داریم و در فقه مبنایی دیگر. ممکن است فراموش کنیم چه مبنایی داشتیم یا اینکه مشمول احتیاط شویم. استاد ما آقای سیدکاظم حائری یا شاید آقای هاشمی شاهرودی، از قول آقای صدر نقل می کردند که وقتی مبانی تکملیه المنحاج را آقای خویی به آقای صدر می دهد، ایشان این کتاب را از ابتدا تا انتها مطالعه می کند و صدها حاشیه می زند که این مبنای شما در ایـنجا با مبنای اصولی تان منافات دارد و آنجا یک چیز دیگری گفتید که بعد آقای خویی می گوید که ای کاش من این کتاب را مـنتشر نکرده بودم. حال اگر ماشین در اختیار ایشان بود، می توانست مبانی را راحت از ابتدا در اختیارش قرار دهد یا اگر یک جایی راجع به یک شخص مبنا عوض شد، متوجه شود. حالا تمام فتاوایی که مبتنی بر این مبنای رجالی یا اصولی بود بـاید همه عوض شود؛ خوب این عوض کردن کار ساده ای نیست. در حالی که اینها را ماشین می توانست در کمتر از یک ثانیه همه را برای شما مشخص کند. خلاصه ما می توانیم از ماشین به عنوان یک کمک خیلی خوب استفاده کنیم و به طور کلی اگر بخواهیم مسئله را باز کنیم، اگر ماشین بتواند درک متن داشته باشد و درک متن هم نه به این معنا که درک آدمی را داشته باشد یا پروسه تفکر را یا آنچه را که در ذهن انسان همراه با عاطفه است به ماشین نسبت بدهیم، بلکه ماشین بتواند قوانین صرف و نحو را متوجه شود با توجه به اینها بفهمد که مسند و مسندالیه چیست و آنها را تشخیص داد؛ ولو به صورت اجمالی و کلی، کار بسیار ساده تر می شود. بعد هم یک مقدار زیادی از کارهایی که از قبل در خصوص موضوع برداری انجام داده بودیم را به اینها ضمیمه کردیم. مثلاً حکم وجوب برای زکات فطر یا در فقه یک درخت واره ای درست کردیم که همان پنجاه و دو باب فقهی را شامل می شود و بعد تمام این متصل می شود به کل متونی که مثلاً مربوط به شیخ طوسی است؛ البته ما همه کتاب ها تا زمان شیخ طوسی را به صورت درختواره تنظیم کردیم و این درخت واره به متن متصل است. اگر ماشین بتواند این درک متن را داشته باشد کلمه را تشخیص بدهد و از حالت های فعل سوم شخص به مصدر یا پیراسته کلمه تبدیل کند و به ریشه برگرداند، بعد مسند و مسندالیه و قوانین نحو را هم متوجه شود، خودش می تواند ارتباط متن را با آن درختواره برقرار کند که این کار را انسان باید طی ۱۲ـ۱۳ سال انجام دهد یا ممکن است کمتر از چند ماه تصحیحات انجام شود، در حالی که توسط ماشین می توان در ظرف یک روز تمام این ارتباطات را برقرار کرد. ما همین کار را در مورد اعراب گذاری متن بحارالانوار انجام دادیم. با توجه به ۸۰ جلد اعراب گذاری خوبی که در کتب اربعه و وسائل الشیعه و مستدرک الوسائل داشتیم، تا ۸۹ درصد متن احادیث بحار اعراب گذاری شد.

شما برای این کار چه اسمی در نظر گرفته اید؟

ما این را اعراب گذاری یا حرکه گذاری ماشینی می گوییم. الان در بیشتر کارهایی که در موتور جست وجوهای قوی انجام مـی شـود، بـه ایـن صـورت اسـت کـه کلـمـه ای که شما در جست وجوی آن هستید ریشه آن را تبدیل می کند و بعد تمام مشتقات مربوط به آن را هم بیان می کند. این پیراسته سازی خودکار کلمه را پیاده کردیم و ضمیمه کارها شده و سعی داریم که نمایه گذاری بر متن، یافتن کلمات کلیدی و خلاصه کردن متن توسط ماشین انجام شود و بعد متون مشابه می تواند مشاهده شود و یافتن اینکه این متن حدیث از چه جهت لفظی و از چه جهت معنایی بررسی شده است؛ زیرا ما با داشتن این مجموعه غنی از مترادفات و درخت واره ای از کلمات آن متن که اصطلاحاً به آن گنجواژه یا تزا روس یا Word net می گویند، خواهیم توانست یک حجمی که توسط آدمی انجام شده، را تسریع دهـیم. چـنـین کاری را که ماشین انجام می دهد اگر آدمی می خواست انجام دهد، احتیاج به زمان و نیرو بسیار زیادی داشت. من اگر بخواهم داده کاوی را در یک جمله برایتان تعریف کنم، داده کاوی عبارتست از: فرآیند یافتن الگوها و در دیتای بسیار حجیمی که لزوماً ساختار خاصی بر آن حاکم نیست و بی ساختار است یا ممکن است ساختار داشته باشد و آن الگوها مـعمولاً الگوهایی هستند که مورد علاقه و نیاز شماست یا می خواهید بر اساس آن یک سری تصمیم بگیرید. می توان وظایف اصلی را که در داده کاوی انجام می شود به سه دسته تقسیم کرد: دسته اول، یک سری برچسب داریم که مشخص می کنیم که چند گروه یکسان داریم. دوم، جایی که شما اطلاع قبلی از متن ندارید. داده کاوی از متن معمولاً در همه رشته ها هست و بیشترین کاربرد آن در تجارت و IT است. فرض کنید در بازار بورس یک سری اطلاعات حجیم وجود دارد. عکس هایی که از ماهواره گرفته می شود، برای پیدا کردن الگوها در آنجا استفاده می شود. در برنامه های نظامی نیز مورد استفاده قرار می گیرد. بنابراین دسته دوم را می توان خوشه بندی نامید. سوم، یافتن ارتباط مخفی که ممکن است بین داده ها وجود داشـتـه بـاشـد. ایـنـهـا بـیـشـتر در حوزه تجارت بود. البته نرم افزارهایی مثل یاهو و گوگل از سال ۱۹۹۹ و ۲۰۰۰ شروع به اسـتـفاده از داده کاوی در حوزه متن کردند. آنها با توجه به متن های سنگینی که داشتند یک شاخه ای از داده کاوی به نام Web mining مطرح شد که Web mining ب ه سه شعبه Web Content mining و Web usage mining و Web Structure mining تـقسیم بندی می شود که Web usage mining در نحوه کاربری اینترنت و وب بیشتر مورد استفاده بود که کاربران وب چه نوع رفتارهایی دارند؟ به عبارتی، چه جاهایی، چه دنباله هایی را پی گیری می کنند؟ اینها در تجارت الکترونیک خیلی مورد استفاده قرار می گیرد. یک شاخه ای که بخصوص بعد از آمدن وب ۲ مطرح شد، وبلاگ ها و ویکی ها هستند که نحوه تولید اطلاعات در وب یا ساختاری که وب دارد به چه شکلی است؟ چون وب یک ساختار گرافیکی خیلی سنگین دارند. اینها را سعی کردند خوشه بندی کنند. با Web content mining محتوای وب را بیایند و ببینند که داخل صفحات چه هست که بیشتر موتورهای جست وجو از این دارنـد اسـتـفـاده مـی کـنـنـد. هـر سـه تـای اینها بخصوص Web content mining می تواند در شاخه های علوم اسلامی مورد استفاده قرار بگیرد و شاخه های مورد استفاده آن هم بیشتر در همین مشابه یابی، خلاصه گیری، یافتن کلمات کلیدی، فراوری درخت های موضوعی و ترجمه ماشینی است که ماشین بتواند بیاید در خدمت ترجمه از یک زبان به زبان دیگر. مثلاً از زبان مبدأC به زبان مقصد مورد استفاده قرار بگیرد که این کار در ستور کار ما هست. الان گوگل نسبت به زبان عربی و فارسی همین روند را استفاده می کند. از این روش های آماری که متون اعلان شده، متون ترجمه شده مشکل که در اختیارش هست را با هم مرتبط می کنند و با توجه به آن جمله جدیدی که مطرح می شود سعی می کند که بهترین مشابه را برای این مطلب در بین متون قبلی استفاده کنند. با توجه به اینکه یک پـشـتـوانه غنی ای از اطلاعات قبلی شما وجود دارد، از آن تاریخچه استفاده می کند و بهترین پیشنهاد را در اختیار آن کسی که می خواهد متن را ترجمه کند، قرار می دهد. البته اصولاً کارهای مبتنی بر هوش و داده کاوی هیچ کدام قطعی نیستند و احتمالی و تخمینی هستند. هرچه اطلاعات پشتوانه قوی تر باشد، این کار به واقع نزدیک تر است.

به نظر می رسد که ترجمه های گوگل خیلی ضعیف است. نظر جنابعالی چیست؟

بله، همین طور است. چون متن فارسی و انگلیسی سنگین و قوی وجود ندارد و ساختارسنگینی نیست؛ یعنی مثلاً در یک حوزه خاص نه یک حوزه عمومی مثل فلسفه یا ادبیات یا کلام، بیشتر متون موجود را با ترجمه اش جمله به جمله به هم مرتبط می کند. بعد جمله جدید که به وجود آمد، ماشین مشابه قبلی این جمله را پیدا کند و بیابد که کجاها به این جمله شبیه تر است و با توجه به این، از ترجمه های قبلی خبره استفاده کرده و بهترین ترجمه را پیشنهاد می دهد.

الان شما می خواهید در زمینه علوم اسلامی بین زبان عربی و فارسی چنین کاری را انجام دهید؟

بله. در دستور کارمان هست. البته قدم های اولیه آن، داشتن سـاختارهای موازی است. و تنظیم کردن این ساختارها کار ساده ای نیست و زمان بر است. الان نزدیک به یک میلیارد و چهارصد میلیون کلمه صحیح عربی در متون ما هست و نزدیک به چهارصد میلیون کلمه صحیح فارسی داریم. بر حسب کلمه بیان می کنیم چون واحد آن کلمه است. ما می خواهیم این ساختارهای موازی را در حوزه زبان فارسی و انگلیسی ایجاد کنیم. در شورای عالی اطلاع رسانی و دفتر نور تهران روی یک میلیون جمله در حوزه ادبیات کار را شروع کردیم که ان شاءالله تا مهر آینده به نتیجه می رسد و یک ساختار یک میلیون جمله ای خواهیم داشت که ترجمه جملات به صورت سلیس در اختیار هست. الان شاید دقت گوگل در حوزه فارسی کمتر از ۳۰ـ۴۰ درصد باشد. اما بین زبان ژاپنی و انگلیسی دقت خیلی بالایی دارد و در حوزه عربی خیلی بهتر از فارسی است. بین عربی وانگلیسی این مقدار قابل توجه تر است. بین انگلیسی و فرانسه بسیار غنی است؛ به دلیل ساختارهای موازی خیلی سنگین تری که در اختیارشان هست. با توجه به این پشتوانه مرکز و مجمع کارسنگینی که در اختیار ما هست، مرکز می تواند یک منبعی برای یک حرکت جدید باشد. البته در آغاز راه هستیم. در شروع کارمان در سال ۸۹، به دنبال یافتن متون مشابه و خلاصه متون و اعراب گذاری خودکار و هدف یافتن کلمات کلیدی بود که این گونه کارها در طی یک سال جواب نمی دهد و به طور کلی چنین ساختارهایی کار زمان بری هستند.

با توجه به صحبت های حضرتعالی این گونه استنباط می شود که یک فرد می تواند با مراجعه به اینترنت، یک متنی را بدهد و بعد اعراب گذاری شده بگیرد؟

بله. تاکنون با توجه به متن هایی که بوده، بالای ۹۰ درصد اعـراب گـذاری ما کار می کند و اعراب گذاری ماشینی یافتن احادیث مشابه، با دقت نسبتاً خوبی مشغول به کار است. البته گفتن همین که با چه درصد دقتی کار می کند احتیاج به ماشین و ارزیابی سنگینی دارد. ما به دنبال برنامه ای برای معیارهای ارزیابی یک بازیاب متن هستیم که هنوز این کار را عرضه نکردیم و در دستور اولیه کاری مان وجود دارد که ان شاءالله کم کم انجام می شود.

در اینترنت عرضه می شود؟

اگـر ایـنـهـا عـرضه شود از طریق وب خواهد بود. همه برنامه های موضوعی و رجال ما به سمت وب شدن می رود که رجال و احادیث را شروع به تحلیل و طراحی کردیم که چگونه آنها را به وب انتقال دهیم یا اینکه کتابخانه دیجیتالی را به وب بردیم، آن هم با حدود ۱۵ هزار جلد که مجموعه کارهایی است که در نور وجود داشته است. در کتابخانه دیجیتالی نور کارهای لفظی به وب وارد شدند، ولی کارهای موضوعی و کارهای دیگر را باید ان شاءالله در قدم های بعد وارد کنیم. متن کاوی به عنوان شاخه ای از داده کاوی، می تواند کمک خوبی نه تنها برای ما در حوزه بازیابی بهتر باشد بلکه می تواند کمک خوبی برای محقق و کسی که می خواهد در حوزه پژوهش قوی تر و غنی تر از ماشین استفاده کند، باشد.

بعضی از متن ها و عبارت ها Regular یا قاعده مند نـیستند؛ مثلاً کلماتی که در عربی به آنها سماعی می گویند و از هیچ قانونی تبعیت نمی کنند. این گونه متن ها را چگونه می توان داده کاوی کرد؟

مشکلی که ما الان در عربی در حوزه اسامی جامد داریم همین است. یعنی شاید ۵۰ درصد کلمات اسم باشند و خیلی از اسم ها جامد هستند و هیچ قاعده ای ندارد. فقط سماعی یا شنیدنی است. اگر بخواهیم در محصولات سماعی یک کار غنی پردازش متن وجود داشته باشد، باید از آن کارهایی که توسط آدمی از قبل انجام شده کمک بگیریم و اگر بخواهیم از حوزه قانون فقط به قانون های متن تکیه کنیم، کار ما خیلی عقب می ماند. ما باید از محصولات قبلی و متونی که توسط خبره ها تصحیح شدند استفاده کنیم و روش های آماری را با روش های Rule base یا روش مند ترکیب کنیم تا موفق شویم و بدون اسـتـفـاده از تـکنیک های آماری موفقیت چندانی نخواهیم داشت.

آیا منظورتان از روش های آماری این است که یک عبارتی که بیشترین استفاده از آن شده باشد را پیدا کنیم؟

بله. یعنی ما ببینیم که این کلمه در متون قبلی به چه شکلی آمده، با چه کلماتی آمده، می توان آن را با حالت های قبلی رفع ابهام کرد یا نه.

منظورتان همان History یا مجموعه غنی است که

  راهنمای خرید:
  • همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
  • ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
  • در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.