فایل ورد کامل شبکه های عصبی مصنوعی و تشخیص گفتار دیاستولیک: شناسایی بهترین عملکرد از پارامترهای MFCC و مطالعه یک رویکرد مستقل سخنران


در حال بارگذاری
10 جولای 2025
پاورپوینت
17870
3 بازدید
۷۹,۷۰۰ تومان
خرید

توجه : به همراه فایل word این محصول فایل پاورپوینت (PowerPoint) و اسلاید های آن به صورت هدیه ارائه خواهد شد

این مقاله، ترجمه شده یک مقاله مرجع و معتبر انگلیسی می باشد که به صورت بسیار عالی توسط متخصصین این رشته ترجمه شده است و به صورت فایل ورد (microsoft word) ارائه می گردد

متن داخلی مقاله بسیار عالی، پر محتوا و قابل درک می باشد و شما از استفاده ی آن بسیار لذت خواهید برد. ما عالی بودن این مقاله را تضمین می کنیم

فایل ورد این مقاله بسیار خوب تایپ شده و قابل کپی و ویرایش می باشد و تنظیمات آن نیز به صورت عالی انجام شده است؛ به همراه فایل ورد این مقاله یک فایل پاور پوینت نیز به شما ارئه خواهد شد که دارای یک قالب بسیار زیبا و تنظیمات نمایشی متعدد می باشد

توجه : در صورت مشاهده بهم ریختگی احتمالی در متون زیر ،دلیل ان کپی کردن این مطالب از داخل فایل می باشد و در فایل اصلی فایل ورد کامل شبکه های عصبی مصنوعی و تشخیص گفتار دیاستولیک: شناسایی بهترین عملکرد از پارامترهای MFCC و مطالعه یک رویکرد مستقل سخنران،به هیچ وجه بهم ریختگی وجود ندارد

تعداد صفحات این فایل: ۲۷ صفحه


بخشی از ترجمه :

نتیجه گیری 

   در این مقاله ما کاربرد شبکه‌های عصبی مصنوعی را در یک مدل ASR مستقل از گوینده، مطالعه کردیم. علاوه بر این، چند بازشناسنده گفتار متکی به گوینده مبتنی بر شبکه عصبی را برای کاربران مبتلا به اختلال ‌تکلم، ارائه دادیم و به طور مفصل نتایج را مقایسه کردیم. هدف، تعیین بهترین مجموعه از ویژگی‌های اصلی MFCC است که بتوانند ویژگی‌های آوایی را نمایش دهند؛ که این نمایش می‌تواند به وسیل یک سیستم ASR مبتنی بر شبکه عصبی طراحی شده برای اشخاص مبتلا به اختلال‌ تکلم، استفاده شود. نرخ بازشناسی کلمه و دقت ارزیابی مدل‌های ASR پیشنهادی، مورد بررسی قرار گرفتند. نمونه‌های گفتاری اشخاص گنگ برای هر یک از سطوح مختلف اختلال ‌تکلم، به وسیل سیستم‌های ASR مستقل از گوینده پیشنهادی، به طور جداگانه ارزیابی شدند. داده‌های گفتاری افراد مورد ارزیابی، برای آموزش بازشناسنده‌های گفتار مستقل از گوینده، به حساب نیامدند. این محروم سازی داده‌های گفتاری افراد مورد ارزیابی، تعمیم‌پذیری مدل‌های پیشنهادی را تصویب می‌کند.

   نتایج نشان می‌دهد که ۱۲ ضریب اصلی کپسترم، می‌تواند به عنوان بهترین مجموعه از ویژگی‌های آوایی MFCC به منظور آموزش یک سیستم ASR مبتنی بر شبکه عصبی، انتخاب شود. WRR مدل ASR مستقل از گوینده آموزش دیده با ۱۲ ضریب اصلی کپسترم، به میانگین ۳۸/۶۸ درصدی رسید. این مدل هم-چنین برای گفتار گویندگان سالم پیش‌بینی نشده، WRR 07/98 درصدی، ارائه داد. بیش ترین WRR برای مدل‌های ASR متکی به گوینده، ۹۵ درصد بود.                  

عنوان انگلیسی:Artificial neural networks as speech recognisers for dysarthric speech: Identifying the best-performing set of MFCC parameters and studying a speaker-independent approach~~en~~

۶ Conclusions

In this paper we studied the application of ANNs in an SI ASR model for individuals with dysarthria. In addition, several SD ANN-based speech recognisers for users with dysarthria were provided, and the results were compared in detail. The purpose is to investigate and to ascertain the best MFCC-based feature set that can represent dysarthric acoustic features; the representation is then used by an ANN-based SI ASR system designed for individuals with dysarthria. The performance of the proposed ASR models was measured in terms of word recognition rate and accuracy of evaluation. Speech samples of the subjects with speech disabilities were evaluated by the proposed SI ASR systems for each dysarthric severity level separately. The speech data of the evaluation subjects were not included for the training of the SI speech recognisers. This exclusion of speech data of the evaluation subjects allows the generalisability of the proposed models to be evaluated. The results show that mel cepstrum with 12 coefficients can be selected as the best set of MFCC acoustic features in order to train an ANN-based ASR system for speakers with dysarthria. The WRR of the dysarthric SI ASR model, trained with mel cepstrum including 12 coefficients achieved an average of 68.38%. It also produced 98.07% WRR for the speech of unanticipated speakers without speech disabilities. The highest WRR of speaker-dependent ASR models was 95%.

$$en!!

  راهنمای خرید:
  • همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
  • ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
  • در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.