فایل ورد کامل پایگاه KID – یک الگوریتم سریع و کارآمد برای کاوش متن استفاده شده برای تولید یک خودکار یک پایگاه داده حاوی اطلاعات ژنتیکی آنزیم ها
توجه : به همراه فایل word این محصول فایل پاورپوینت (PowerPoint) و اسلاید های آن به صورت هدیه ارائه خواهد شد
این مقاله، ترجمه شده یک مقاله مرجع و معتبر انگلیسی می باشد که به صورت بسیار عالی توسط متخصصین این رشته ترجمه شده است و به صورت فایل ورد (microsoft word) ارائه می گردد
متن داخلی مقاله بسیار عالی، پر محتوا و قابل درک می باشد و شما از استفاده ی آن بسیار لذت خواهید برد. ما عالی بودن این مقاله را تضمین می کنیم
فایل ورد این مقاله بسیار خوب تایپ شده و قابل کپی و ویرایش می باشد و تنظیمات آن نیز به صورت عالی انجام شده است؛ به همراه فایل ورد این مقاله یک فایل پاور پوینت نیز به شما ارئه خواهد شد که دارای یک قالب بسیار زیبا و تنظیمات نمایشی متعدد می باشد
توجه : در صورت مشاهده بهم ریختگی احتمالی در متون زیر ،دلیل ان کپی کردن این مطالب از داخل فایل می باشد و در فایل اصلی فایل ورد کامل پایگاه KID – یک الگوریتم سریع و کارآمد برای کاوش متن استفاده شده برای تولید یک خودکار یک پایگاه داده حاوی اطلاعات ژنتیکی آنزیم ها،به هیچ وجه بهم ریختگی وجود ندارد
تعداد صفحات این فایل: ۲۸ صفحه
چکیده :
پیش زمینه: مقدار اطلاعات بیولوژیکی در دسترس به سرعت رو به افزایش بوده و تمرکز تحقیقات بیولوژیکی از بخش های مجزا به سمت شبکه ها و حتی پروژه های بزرگتر کشانده شده که هدف آن ها تجزیه و تحلیل، مدلسازی و شبیه سازی شبکه های بیولوژیکی و همچنین مقایسه در سطح بالای ویژگی های سلولی می باشد. بنابراین ضروری است تا اطلاعات بیولوژیکی به آسانی در دسترس باشد. به هر حال، بیشتر اطلاعات در تحقیقات انجام شده به صورت غیرساختاری بوده و به این خاطر روش هایی برای استخراج نظامند اطلاعات، مستقیما از تحقیقات اولیه می بایست توسعه یابد.
توضیحات: در اینجا ما الگوریتم داده کاوی را برای استخراج اطلاعات جنبشی همانند KM, Ki, kcat و غیره و همچنین اطلاعات مربوطه همانند نام آنزیم ها، تعداد EC، لیگاندها، ارگانیسم ها، مناطق، PH و دما نشان می دهیم. با استفاده از این قوانین و رویکرد بر پایه واژه نامه، این امکان وجود دارد تا به اندازه ۵۱۴۳۹۴ پارامتر جنبشی ۱۳ دسته (KM, Ki, kcat, kcat/KM, Vmax, IC50, S0.5, Kd, Ka, t1/2, pI, nH,، فعالیت های خاص، Vmax/KM) از حدود ۱۷ میلیون مطالب نتتشر شده، استخراج کرده و آن ها را با داده های دیگر خلاصه مطالب دیگر ترکیب کنیم.
تایید دستی تقریبا ۱۰۰۰ نتایج انتخاب شده تصادفی، موارد فراخوانی شده بین ۵۱% و ۸۴% و محدوده دقیق ۵۵% تا ۹۶% را نشان داده که بستگی به فهرست های جستجو شده دارد.
نتایج در پایگاه داده ذخیره شده و توسط KID” یا پایگاه داده جنبشی” از طریق اینترنت در دسترس می باشد.
نتیجه گیری: الگوریتم نشان داده شده، اطلاعات مهمی را ارائه می دهد و کمکی به شتاب بخشیدن تحقیقات و تجزیه و تحلیل مورد نیاز برای روش های بیولوژی سیستم های امروزی می باشد. پایگاه های داده حاصل شده از تجزیه و تحلیل چکیده مقاله های منتشر شده می تواند کمک ارزشمندی در حوزه جنبش های بیولوژیکی و شیمیایی باشد. این فرایند کاملا بر مبنای داده کاوی و همچنین تکمیل پایگاه داده ایجاد شده می باشد.
این پایگاه داده از سایت http://kid.tu-bs.de در دسترس است. کد مبدا الگوریتم تحت مجوز مجوز دولتی GNU ایجاد شده و بنا به درخواست محققان در دسترس قرار می گیرد.
عنوان انگلیسی:
Database KID – an algorithm for fast and efficient text mining used to automatically generate a database containing kinetic information of enzymes
~~en~~ writers :
Stephanie Heinen1, Bernhard Thielen2,3 and Dietmar Schomburg*4
Background: The amount of available biological information is rapidly increasing and the focus of biological research
has moved from single components to networks and even larger projects aiming at the analysis, modelling and
simulation of biological networks as well as large scale comparison of cellular properties. It is therefore essential that
biological knowledge is easily accessible. However, most information is contained in the written literature in an
unstructured way, so that methods for the systematic extraction of knowledge directly from the primary literature have
to be deployed.
Description: Here we present a text mining algorithm for the extraction of kinetic information such as KM, Ki, kcat etc. as
well as associated information such as enzyme names, EC numbers, ligands, organisms, localisations, pH and
temperatures. Using this rule- and dictionary-based approach, it was possible to extract 514,394 kinetic parameters of
۱۳ categories (KM, Ki, kcat, kcat/KM, Vmax, IC50, S0.5, Kd, Ka, t1/2, pI, nH, specific activity, Vmax/KM) from about 17 million PubMed
abstracts and combine them with other data in the abstract.
A manual verification of approx. 1,000 randomly chosen results yielded a recall between 51% and 84% and a precision
ranging from 55% to 96%, depending of the category searched.
The results were stored in a database and are available as “KID the KInetic Database” via the internet.
Conclusions: The presented algorithm delivers a considerable amount of information and therefore may aid to
accelerate the research and the automated analysis required for today”s systems biology approaches. The database
obtained by analysing PubMed abstracts may be a valuable help in the field of chemical and biological kinetics. It is
completely based upon text mining and therefore complements manually curated databases.
The database is available at http://kid.tu-bs.de. The source code of the algorithm is provided under the GNU General
Public Licence and available on request from the author.
$$en!!
- همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
- ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
- در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.
مهسا فایل |
سایت دانلود فایل 