فایل ورد کامل شناسایی گوینده در گفتار نجوایی: تحقیق در مورد ویژگی های تیمبرل و اندازه فاصله KNN
توجه : به همراه فایل word این محصول فایل پاورپوینت (PowerPoint) و اسلاید های آن به صورت هدیه ارائه خواهد شد
این مقاله، ترجمه شده یک مقاله مرجع و معتبر انگلیسی می باشد که به صورت بسیار عالی توسط متخصصین این رشته ترجمه شده است و به صورت فایل ورد (microsoft word) ارائه می گردد
متن داخلی مقاله بسیار عالی، پر محتوا و قابل درک می باشد و شما از استفاده ی آن بسیار لذت خواهید برد. ما عالی بودن این مقاله را تضمین می کنیم
فایل ورد این مقاله بسیار خوب تایپ شده و قابل کپی و ویرایش می باشد و تنظیمات آن نیز به صورت عالی انجام شده است؛ به همراه فایل ورد این مقاله یک فایل پاور پوینت نیز به شما ارئه خواهد شد که دارای یک قالب بسیار زیبا و تنظیمات نمایشی متعدد می باشد
توجه : در صورت مشاهده بهم ریختگی احتمالی در متون زیر ،دلیل ان کپی کردن این مطالب از داخل فایل می باشد و در فایل اصلی فایل ورد کامل شناسایی گوینده در گفتار نجوایی: تحقیق در مورد ویژگی های تیمبرل و اندازه فاصله KNN،به هیچ وجه بهم ریختگی وجود ندارد
تعداد صفحات این فایل: ۲۶ صفحه
بخشی از ترجمه :
چکیده
شناسایی گویشور از گفتار نجوایی، در زمینه ی علوم قانونی و بسیاری دیگر از کاربرد ها، دارای اهمیت بسیار زیادی می باشد. گفتار نجوایی از نظر مشخصات، نسبت به گفتار عادی تغییرات زیاد و مهمی را دارد. ازین رو وظیفه ی شناسایی با استفاده از این گفتار دشوار می شود. این مقاله، روش استفاده از ویژگی های طنین با عملکرد خوب از طریق روش انتخاب هیبریدی ( ترکیبی) و تاثیر معیار های فاصله ای مورد استفاده در کلاسیفایر KNN بر روی صحت شناسایی را ارائه می کند. نتایج استفاده از ویژگی های طنین با ویژگی های MFCC مقایسه شده است ؛ صحت مورد اول از روش دوم بیشتر می باشد. کلاسیفایر KNN با محتمل ترین تابع فاصله برای دیتابیس گفتار نجوایی مانند Euclidean و City-block با یکدیگر مقایسه شده اند. ترکیب ویژگی های طنین و کلاسیفایر KNN با تابع فاصله ی City Block ، بیشترین صحت شناسایی را برای ما ایجاد کرد.
– جمع بندی
ما از توصیف کننده های صوتی با عملکرد در الگوریتم انتخاب ترکیبی استفاده کردیم تا بتوانیم گفتار عادی و نجوایی را تشخیص دهیم . مشخص شد که ویژگی های انتخاب شده از نظر توانایی تشخیص بین گویشور های مختلف، مناسب هستند. تحلیل همبستگی نیز نشان داد که ویژگی ها برای یک گویشور مشابه و برای گویشور های مختلف متفاوت هستند. نتایج با ترکیب ویژگی های طنین با نام های نرخ عبور صفر، افت، بی نظمی، شفافیت و میزان تندی و فرکانس Mel در سه حالت تمرین و تست محاسبه شده اند، یعنی حالت ) خنثی – خنثی ) نجوا – نجوا و ) خنثی – نجوا . اما، هدف ما تمرین خنثی و تست نجوا برای شناسایی می باشد. ویژگی های طنین % افزایش در صحت شناسایی را در مقایسه با ویژگی های MFCC برای گویشور با شرایط خنثی – نجوا ایجاد کردند.
دومین مجموعه از آزمایش ها نیز با هدف پیدا کردن تابع فاصله ی بهتر در میان توابع اقلیدسی و بلوک شهری انجام شد. صحت با استفاده از تابع فاصله ی بلوک شهری % در مقایسه با فاصله ی اقلیدسی بیشتر می باشد. صحت با استفاده از K=3 ، فاصله ی بلوک شهری و ویژگی های طنین با افزایش تعداد گویشور ها مشاهده می شود. صحت نیز با افزایش دیتابیس ، کمتر می شود. اما، کاهش در صحت به صورت نسبی کمتر می باشد که این موضوع نشان دهنده ی این است که ویژگی های طنین، به اندازه ی کافی قوی می باشند ( جدول )
عنوان انگلیسی:Speaker identification of whispering speech: an investigation on selected timbrel features and KNN distance measures~~en~~
Abstract
Speaker identification from the whispered speech is of great importance in the field of forensic science as well as in many other applications. Whispered speech shows many changes in the characteristics to its neutral counterpart. Hence the task of identification becomes difficult. This paper presents the use of only well-performing timbrel features selected by Hybrid selection method and effect of distance measures used in KNN classifier on the identification accuracy. The results using timbrel features are compared with MFCC features; the accuracy with the former is observed higher. KNN classifier with most probable distance function suitable for a whispered database like Euclidean and City-block are also compared. The combination of timbrel features and KNN classifiers with city block distance function have reported the highest identification accuracy.
Conclusion
We have selected well-performing audio descriptors only by using Hybrid selection algorithm for speaker identification with neutral and whispered speech. The selected features are found good in terms of the discrimination ability from their inter-correlation. The correlation analysis also confirmed the intra-speaker similarity and interspeaker dissimilarity with respect to their feature vector values. The results with a combination of timbrel features namely zero-crossing rate, roll-off, irregularity, brightness, roughness, and Mel-frequency cepstral coefficient (MFCC) are compared in three training and testing modes of speech i.e. neutral–neutral, whisper–whisper, and, neutral whisper. However, neutral training and whispered testing for speaker identification is targeted. Timbrel features reported 6% increase in identification accuracy compared to MFCC features for 35 speakers with neutral-whisper condition.
The second set of experiments aimed to find better distance function among Euclidean and City-block. Accuracy by using City-block is found 6% more compared to Euclidean distance at similar conditions. Accuracy using k=3, City-block distance and, timbrel features is observed with increasing number of speakers. Accuracy decreases with increasing database. However, decrease in accuracy is relatively lower which proves that timbrel features are robust enough (Table 8).
$$en!!
- همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
- ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
- در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.
مهسا فایل |
سایت دانلود فایل 