فایل ورد کامل بهبود بالای تشخیص هویت گوینده و تائید آن با ترکیبی از اطلاعات فاز و MFCC
توجه : به همراه فایل word این محصول فایل پاورپوینت (PowerPoint) و اسلاید های آن به صورت هدیه ارائه خواهد شد
این مقاله، ترجمه شده یک مقاله مرجع و معتبر انگلیسی می باشد که به صورت بسیار عالی توسط متخصصین این رشته ترجمه شده است و به صورت فایل ورد (microsoft word) ارائه می گردد
متن داخلی مقاله بسیار عالی، پر محتوا و قابل درک می باشد و شما از استفاده ی آن بسیار لذت خواهید برد. ما عالی بودن این مقاله را تضمین می کنیم
فایل ورد این مقاله بسیار خوب تایپ شده و قابل کپی و ویرایش می باشد و تنظیمات آن نیز به صورت عالی انجام شده است؛ به همراه فایل ورد این مقاله یک فایل پاور پوینت نیز به شما ارئه خواهد شد که دارای یک قالب بسیار زیبا و تنظیمات نمایشی متعدد می باشد
توجه : در صورت مشاهده بهم ریختگی احتمالی در متون زیر ،دلیل ان کپی کردن این مطالب از داخل فایل می باشد و در فایل اصلی فایل ورد کامل بهبود بالای تشخیص هویت گوینده و تائید آن با ترکیبی از اطلاعات فاز و MFCC،به هیچ وجه بهم ریختگی وجود ندارد
تعداد صفحات این فایل: ۱۴ صفحه
بخشی از ترجمه :
در این مقاله روش تشخیص هویت گوینده مستقل از متن با ترکیب MFCC و اطلاعات فاز جدیداً تعریف شده را پیشنهاد کردیم. آزمایشات تشخیص هویت گوینده روی پایگاه داده NTT انجام شد که از داده های جملات ادا شده در مد سرعت نرمال/ آهسته/ سریع توسط ۳۵ گوینده ژاپنی تشکیل می شود. اطلاعات فاز جدید پیشنهاد شده sin}،cos } کارایی تشخیص هویت از اطلاعات فاز اصلی برای کلیه مدهای گفتاری را به طور قابل ملاحظه ای بهبود بخشید. با ترکیب MFCC و اطلاعات فاز، در مقایسه با MFCC ، برای مدهای گفتار نرمال، آهسته و سریع، نرخ کاهش خطای ۲ ۵۲، ۶ ۵۵ و ۲ ۵۹ درصدی بدست آوردیم. با ترکیب GMM مبتنی بر MFCC، HMM مبتنی بر MFCC، و GMM مبتنی بر فاز، نرخ های درست ۴ ۹۹ درصد، ۹ ۹۸ درصد، و ۹ ۹۸ درصد برای مدهای گفتاری نرمال، سریع و آهسته بدست آوردیم. نتایج بدست آمده بهترین عملکرد را در مقایسه با نتایج سایر محققین و پژوهشگران برای این پایگاه داده نشان می دهد.
جهت تشریح پایداری و توانمندی اطلاعات فاز برای تشخیص هویت گوینده، از اطلاعات فاز جدید sin}،cos } در تصدیق هویت گوینده نیز استفاده گردید. آزمایشات ترکیبی، نرخ خطای برابر ۰۱۸ درصد برای مدهای گفتاری نرمال، ۰۳۷ درصد برای سریع و ۰۷۱ درصد برای آهسته نشان دادند. نتایج بدست آمده، نرخ کاهش خطای درحدود ۵۰ درصد درمقایسه با [۱۹] را نشان می دهند.
عنوان انگلیسی:High improvement of speaker identification and verification by combining MFCC and phase information~~en~~
For text-dependent speaker recognition, different types of speaker models have been studied. Hidden Markov models (HMM) have become the most popular statistical tool for this task. The best results have been obtained using continuous density HMM (CHMM) for modeling the speaker characteristics. For the text-independent task, the temporal sequence modeling capability of the HMM is not required. Therefore, one state CHMM, also called a Gaussian mixture model (GMM), has been widely used as a speaker model. The use of GMM for modeling speaker identity is motivated by the fact that the Gaussian components represent some general speaker-dependent spectral shapes and the capability of Gaussian mixtures to model arbitrary densities. Further, we proposed a novel method by combining speaker-specific GMM and speaker-adapted HMM [1]. Several studies have indicated a large effort to directly model and incorporate the phase into the recognition process [2, 3]. The importance of phase in human speech recognition has been reported in [4, 5]. Especially, the phase may be important for speaker recognition, because it may convey the source information. However, in conventional speaker recognition methods based on MFCC, it only utilizes the magnitude of the Fourier Transfrom of the time-domain speech frames. This means that the phase component is ignored. The MFCC captures the speaker-specific vocal tract information. Feature parameters extracted from excitation source characteristics are also useful for speaker recognition [6, 7, 8, 9]. We proposed a speaker identification method using phase information which was integrated with MFCC-based GMM [10] by using speech database consisting of normal speaking modes. In this paper, we propose an improved method and evaluate it by using speech database consisting of normal, fast and slow speaking modes. To improve the speaker identifi- cation performance, the MFCC-based GMM is expanded to a combination of MFCC-based GMM and MFCC-based HMM, and it is integrated with both the original and new phase information. Speaker verification [11, 12] is the other important issue of speaker recognition which is even more successful in commerical systems than speaker identification. The speaker verification task is to decide whether or not an unlabelled voice sample belongs to a specific reference speaker. For GMM-based speaker verification, the likelihood of claimed speaker model given the speech segment is used. Therefore, we expect that the phase information is also effective for speaker verification. In this paper, the new phase information is used to perform speaker verification using the same experimental setup for speaker identification.
$$en!!
- همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
- ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
- در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.
مهسا فایل |
سایت دانلود فایل 