فایل ورد کامل شناسایی خودکار سن و جنس گوینده با استفاده ازسطح ترکیب اطلاعات صوتی و عروضی


در حال بارگذاری
10 جولای 2025
پاورپوینت
17870
2 بازدید
۷۹,۷۰۰ تومان
خرید

توجه : به همراه فایل word این محصول فایل پاورپوینت (PowerPoint) و اسلاید های آن به صورت هدیه ارائه خواهد شد

این مقاله، ترجمه شده یک مقاله مرجع و معتبر انگلیسی می باشد که به صورت بسیار عالی توسط متخصصین این رشته ترجمه شده است و به صورت فایل ورد (microsoft word) ارائه می گردد

متن داخلی مقاله بسیار عالی، پر محتوا و قابل درک می باشد و شما از استفاده ی آن بسیار لذت خواهید برد. ما عالی بودن این مقاله را تضمین می کنیم

فایل ورد این مقاله بسیار خوب تایپ شده و قابل کپی و ویرایش می باشد و تنظیمات آن نیز به صورت عالی انجام شده است؛ به همراه فایل ورد این مقاله یک فایل پاور پوینت نیز به شما ارئه خواهد شد که دارای یک قالب بسیار زیبا و تنظیمات نمایشی متعدد می باشد

توجه : در صورت مشاهده بهم ریختگی احتمالی در متون زیر ،دلیل ان کپی کردن این مطالب از داخل فایل می باشد و در فایل اصلی فایل ورد کامل شناسایی خودکار سن و جنس گوینده با استفاده ازسطح ترکیب اطلاعات صوتی و عروضی،به هیچ وجه بهم ریختگی وجود ندارد

تعداد صفحات این فایل: ۳۵ صفحه


چکیده :

هدف این مقاله شناسایی رویکرد سنی و جنسی خودکار که ترکیبی ازهفت روش مختلف در هر دو سطح صوتی وعروضی (زبر زنجیری) به منظور بهبود پایه ی عملکرد است , میباشد.سه زیر سیستم پایه عبارت اند از: (۱) مدل مخلوط گوسی (GMM) میتنی بر ویژگی های فرکانس ضریب شریک (MFCC) ، (۲) دستگاه پشتیبانی بردار (SVM) مبتنی بر بردار میانهGMM (3) SVM مبتنی بر۴۵۰ بعد ویژگی های سطح گفته ها که شامل جمله های صوتی، عروضی و اطلاعات کیفی صدا ها میباشد.علاوه بر این، ما چهار زیر سیستم دیگر را پیشنهاد میکنیم:(۱) svm مبتنی بر ,UBM که ازاحتمال مرکزی Bhattacharyya استفاده میکند (۲)بازنمایی پراکنده مبتنی بر UBM (3) SVM مبتنی براحتمال حداکثر رگرسیون خطی GMM و ماتریس (MLLR) (4) SVM بر اساس ضرایب بسط چند جمله ای و ویژگی های عروضی سطح هجا که در بخش مربوط به سخنرانی ابراز شده اند.
به منظور تجزیه و تحلیل زیر سیستم :حد فاصل زیر و بمی صدا، انرژی حوزه زمان،دامنه فرکانس انرژی ساختارو سازه هارمونیک برای هر هجا (تقسیم با استفاده ازاطلاعات انرژی در بخش سخنرانی صدا) در نظر گرفته شده است.این چهار زیر سیستم به منظور دستیابی به نتایج رقابتی در طبقه بندی گروه های سنی و جنسی متفاوت پیشنهاد گردیده است.برای بهبود کلی عملکرد طبقه بندی، تلفیقی از این هفت زیر سیستم در سطح امتیاز نشان داده شده است.در مقایسه با پایه ی سیستم SVM(3)، “سیستم پایه ی پیشنهاد شده توسط کمیته چالش”، منجر به ۵.۶ بهبود مطلق دقت , در مسائل مربوط به سن و۴۲ در مسائل مربوط به جنسیتی در مجموعه توسعه گردید.. ما در مجموعه ی آزمون نهایی،به ۳.۱ و ۳.۸ بهبود مطلق دست یافتیم.

واژه های کلیدی: تشخیص سن | تشخیص جنسیت | ویژگی های زبرزنجیری | درجه و اوج| ساختارهای هارمونیک | سازه | گسترش چند جمله ای | حداکثراحتمال رگرسیون(بازگشت) خطی | احتمال ابر بردار پیشین وزنی UBM | GMM| SVM| بازنمایی پراکنده | همجوشی و ادغام سطح امتیاز

عنوان انگلیسی:

Automatic Speaker Age and Gender Recognition Using Acoustic and Prosodic Level Information Fusion

~~en~~ writers :

Ming Li, Kyu J. Han, Shrikanth Narayanan

The paper presents a novel automatic speaker age and gender identification approach which
combines seven different methods at both acoustic and prosodic levels to improve the baseline
performance. The three baseline subsystems are (1) Gaussian mixture model (GMM) based on
mel-frequency cepstral coefficient (MFCC) features, (2) Support vector machine (SVM) based
on GMM mean supervectors and (3) SVM based on 450-dimensional utterance level features
including acoustic, prosodic and voice quality information. In addition, we propose four subsystems: (1) SVM based on UBM weight posterior probability supervectors using the Bhattacharyya
probability product kernel, (2) Sparse representation based on UBM weight posterior probability
supervectors, (3) SVM based on GMM maximum likelihood linear regression (MLLR) matrix
supervectors and (4) SVM based on the polynomial expansion coefficients of the syllable level
prosodic feature contours in voiced speech segments. Contours of pitch, time domain energy,
frequency domain harmonic structure energy and formant for each syllable (segmented using
energy information in the voiced speech segment) are considered for analysis in subsystem (4).
The proposed four subsystems have been demonstrated to be effective and able to achieve competitive results in classifying different age and gender groups. To further improve the overall
classification performance, weighted summation based fusion of these seven subsystems at the
score level is demonstrated. Experiment results are reported on the development and test set of
the 2010 Interspeech Paralinguistic Challenge aGender database. Compared to the SVM baseline system (3), which is the baseline system suggested by the challenge committee, the proposed
fusion system achieves 5.6% absolute improvement in unweighted accuracy for the age task and
۴.۲% for the gender task on the development set. On the final test set, we obtain 3.1% and 3.8%
absolute improvement, respectively.

Keywords: Age recognition | Gender recognition | Prosodic features | Pitch | Harmonic structure | Formant | Polynomial expansion | Maximum likelihood linear regression | UBM weight posterior probability supervectors | GMM | SVM | Sparse representation | Score level fusion

$$en!!

  راهنمای خرید:
  • همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
  • ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
  • در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.