فایل ورد کامل تحقیق مدل سازی و روش ها و استاندارهای سیگنال صحبت و کدر کم تاخیر LD-CELP 50 صفحه در word


در حال بارگذاری
10 جولای 2025
پاورپوینت
17870
4 بازدید
۷۹,۷۰۰ تومان
خرید

توجه : به همراه فایل word این محصول فایل پاورپوینت (PowerPoint) و اسلاید های آن به صورت هدیه ارائه خواهد شد

 فایل ورد کامل تحقیق مدل سازی و روش ها و استاندارهای سیگنال صحبت و کدر کم تاخیر LD-CELP 50 صفحه در word دارای ۵۰ صفحه می باشد و دارای تنظیمات در microsoft word می باشد و آماده پرینت یا چاپ است

لطفا نگران مطالب داخل فایل نباشید، مطالب داخل صفحات بسیار عالی و قابل درک برای شما می باشد، ما عالی بودن این فایل رو تضمین می کنیم.

فایل ورد فایل ورد کامل تحقیق مدل سازی و روش ها و استاندارهای سیگنال صحبت و کدر کم تاخیر LD-CELP 50 صفحه در word  کاملا فرمت بندی و تنظیم شده در استاندارد دانشگاه  و مراکز دولتی می باشد.

توجه : در صورت  مشاهده  بهم ریختگی احتمالی در متون زیر ،دلیل ان کپی کردن این مطالب از داخل فایل ورد می باشد و در فایل اصلی فایل ورد کامل تحقیق مدل سازی و روش ها و استاندارهای سیگنال صحبت و کدر کم تاخیر LD-CELP 50 صفحه در word،به هیچ وجه بهم ریختگی وجود ندارد


بخشی از متن فایل ورد کامل تحقیق مدل سازی و روش ها و استاندارهای سیگنال صحبت و کدر کم تاخیر LD-CELP 50 صفحه در word :

بخشی از فهرست مطالب فایل ورد کامل تحقیق مدل سازی و روش ها و استاندارهای سیگنال صحبت و کدر کم تاخیر LD-CELP 50 صفحه در word

– مقدمه    
فصل ۱:بررسی و مدل سازی سیگنال صحبت    
۱-۱ –معرفی سیگنال صحبت    
۱-۲- مدل سازی  پیشگویی خطی    
۱-۲-۱- پنجره کردن سیگنال صحبت    
شکل (۱-۴): نمایش چند پنجره معروف    
۱-۲-۲- پیش تاکید سیگنال صحبت    
۱-۲-۳- تخمین پارامترهای LPC    
فصل۲:روش ها و استاندارهای کدینگ صحبت    
۲-۱- مقدمه    
۲-۲- روشهای کدینگ    
۲-۲-۱- کدرهای شکل موج    
۲-۲-۲- کدرهای صوتی (Vocoders)    
۲-۲-۳- کدرهای مختلط    
الف- کدرهای مختلط حوزه فرکانس    
– کدینگ زیر باندی و تبدیل تطبیقی    
ب) کدرهای مختلط حوزه زمان    
فصل ۳:کدر کم تاخیر LD-CELP    
۳-۱- مقدمه    
۳-۲- بررسی کدر کم تاخیر LD-CELP    
۳-۲-۱- LPC  معکوس مرتبه بالا    
۳-۲-۲-فیلتر وزنی شنیداری    
۳-۲-۳- ساختار کتاب کد    
۳-۲-۳-۱- جستجوی کتاب کد    
۳-۲-۴- شبه دیکدر    
۳-۲-۵-پست فیلتر    
مراجع    

بخشی از منابع و مراجع فایل ورد کامل تحقیق مدل سازی و روش ها و استاندارهای سیگنال صحبت و کدر کم تاخیر LD-CELP 50 صفحه در word

۱- Panos E. Papamichalis, “Practical Approaches to Speech Coding “, Prentice-Hall    Inc. ,

۲-B.S. Atal & R.Remde “A new model of LPC excited for producing natural-sounding    speech at low bit rates”, Proc.ICASSP pp.614-617  ۱۹۸۲

۳-Jason P. Woodard , “Digital Speech Coding” , Mini-Thesis ,    Department of      Electronics & Computer Science, University of Southampton, Jun

۴-J.Makhoul “Linear Prediction: A Tutorial Review ” Proc. IEEE,vol 63,    No.4,pp.561-580  Apr

۵- Kondoz A.M,” Digital Speech , Coding of low bit rate communication Systems”,   Chichester Wiley

۶- Chen,Cox & Lin,”A Low-Delay CELP Coder for the CCITT 16 kb/s Speech Coding     Standard”,IEEE Jour. On Selected Area in Comm.,vol.10,no.5 ,June

۷- L.Hanzo,A.Somerville & Jason P. Woodard, “Voice Compression and    Communication”,IEEE series on Digital & Mobile,

۸- Schroeder & Atal ,”Code-Excited linear Prediction (CELP):High quality speech at        very low bit rates”,IEEE,ICASSP,pp.937-940,

۹- ITU,”Coding of Speech at 16 kbps using Low-Delay Code Excited Linear                                                                                                           Prediction “, ITU (CCITT) Recommendation G.728,

۱۰- ITU,” G.728 Annex G , 16 kbps Fixed Point specification “, 11/

مقدمه

امروزه در عصر ارتباطات و گسترش روزافزون استفاده از شبکه های تلفن ،موبایل و اینترنت در جهان ومحدودیت پهنای باند در شبکه های مخابراتی ، کدینگ و فشرده سازی صحبت امری اجتناب ناپذیر است . در چند دهه اخیر روشهای کدینگ مختلفی پدیدآمده اند ولی بهترین و پرکاربردترین آنها کدک های آنالیزباسنتز هستند که توسط Atal & Remedeدر سال ۱۹۸۲ معرفی شدند [۲] . اخیرا مناسبترین الگوریتم برای کدینگ صحبت با کیفیت خوب در نرخ بیت های پائین و زیر ۱۶ kbps ، روش پیشگویی خطی باتحریک کد (CELP) می باشد که در سال ۱۹۸۵ توسط Schroeder & Atal معرفی شد [۸] و تا کنون چندین استاندارد مهم کدینگ صحبت بر اساس CELP تعریف شده اند

در سال ۱۹۸۸ CCITT برنامه ای برای استانداردسازی یک کدک ۱۶ kbps با تاخیراندک و      کیفیت بالا در برابر خطاهای کانال آغاز نمود و برای آن کاربردهای زیادی همچون شبکه PSTN ،ISDN ،تلفن تصویری و غیره در نظر گرفت . این کدک در سال ۱۹۹۲ توسط Chen et al.    تحت عنوان LD-CELP معرفی شد[۶] و بصورت استاندارد G.728 در آمد[۹] و در سال ۱۹۹۴ مشخصات ممیز ثابت این کدک توسط ITU ارائه شد[۱۰] . با توجه به کیفیت بالای این کدک که در آن صحبت سنتزشده از صحبت اولیه تقریبا غیرقابل تشخیص است  و کاربردهای آن در شبکه های تلفن و اینترنت و ماهواره ای در این گزارش به پیاده سازی این کدک می پردازیم

در فصل اول به معرفی وآنالیز سیگنال صحبت پرداخته می شود و در فصل دوم روش ها و استانداردهای کدینگ بیان می شوند . در فصل سوم کدک LD-CELP را بیشتر بررسی می کنیم و در فصل چهارم شبیه سازی ممیز ثابت الگوریتم به زبان C را بیان می نمائیم. ودر پایان در فصل ۵ به نحوه پیاده سازی بلادرنگ کدکG.728 بر روی پردازنده TMS320C5402 می پردازیم

فصل ۱:بررسی و مدل سازی سیگنال صحبت

۱-۱ –معرفی سیگنال صحبت

صحبت در اثر دمیدن هوا از ریه ها به سمت حنجره و فضای دهان تولید می‏شود. در طول این مسیر در انتهای حنجره، تارهای صوتی[۱] قرار دارند. فضای دهان را از بعد از تارهای صوتی ، لوله صوتی[۲]  می‏نا مند که در یک مرد متوسط حدود cm 17 طول دارد . در تولید برخی اصوات تارهای صوتی کاملاً باز هستند و مانعی بر سر راه عبور هوا ایجاد نمی‏کنند که این اصوات را اصطلاحاً اصوات بی واک [۳]  می‏نامند. در دسته دیگر اصوات ، تارهای صوتی مانع خروج طبیعی هوا از حنجره می‏گردند که این باعث به ارتعاش درآمدن تارها شده و هوا به طور غیر یکنواخت و تقریباً پالس شکل وارد فضای دهان می‏شود. این دسته از اصوات را اصطلاحاً باواک[۴]  می‏گویند

فرکانس ارتعاش تارهای صوتی در اصوات باواک را فرکانس Pitch و دوره تناوب ارتعاش تارهای صوتی را پریود Pitch می‏نامند. هنگام انتشار امواج هوا در لوله صوتی، طیف فرکانس این امواج توسط لوله صوتی شکل می‏گیرد و بسته به شکل لوله ، پدیده تشدید در فرکانس های خاصی رخ می‏دهد که به این فرکانس های تشدید فرمنت[۵]  می‏گویند

از آنجا که شکل لوله صوتی برای تولید اصوات مختلف، متفاوت است پس فرمنت ها برای اصوات گوناگون با هم فرق می‏کنند. با توجه به اینکه صحبت یک فرآیند متغییر با زمان است پس پارامترهای تعریف شده فوق اعم از فرمنت ها و پریود Pitch در طول زمان تغییر می‏کنند به علاوه مد صحبت به طور نامنظمی از باواک به بی واک و بالعکس تغییر می‏کند. لوله صوتی ، همبستگی های زمان-کوتاه  ، در حدود ۱ ms ، درون سیگنال صحبت را در بر می‏گیرد. و بخش مهمی از کار کدکننده های صوتی مدل کردن لوله صوتی به صورت یک فیلتر زمان-کوتاه می‏باشد. همان طور که شکل لوله صوتی نسبتاً آهسته تغییر می‏کند، تابع انتقال این فیلتر مدل کننده هم نیاز به تجدید[۶] ، معمولاً در هر ۲۰ms یکبارخواهد داشت

در شکل (۱-۱ الف) یک قطعه صحبت باواک که با فرکانس ۸KHz نمونه برداری شده است  دیده می‏شود. اصوات باواک دارای تناوب زمان بلند به خاطر پریود Pitch هستند که نوعاً   بین ۲ms تا ۲۰ms می‏باشد. در اینجا پریود Pitch در حدود ۸ms یا ۶۴ نمونه است. چگالی طیف توان این قطعه از صحبت در شکل (۱-۱ ب) دیده می‏شود[۳]

اصوات بی واک نتیجه تحریک نویز مانند لوله صوتی هستند و تناوب زمان- بلند اندکی را در بر دارند ، همانگونه که در شکل های (۱-۱ ج) و (۱-۱ د) دیده می‏شود ولی همبستگی زمان کوتاه به خاطر لوله صوتی در آنها هنوز وجود دارد

بطورکلی سیگنال صحبت  دارای افزونگی[۷] زیادی است  که ناشی از عوامل ذیل هستند

ـ وابستگی های زمان-کوتاه  : این وابستگی ها عمدتاً به کندی تغییرات صحبت با زمان و ساختار

نسبتاً منظم فرمنت ها مربوط می‏شوند

ـ وابستگی های زمان- بلند : که عمدتاً از طبیعت نیمه متناوب اصوات با واک و تغییرات آرام پریود Pitch ناشی می‏شوند

ـ‌تابع چگالی احتمال صحبت : علیرغم پیچیدگی آماری صحبت می‏توان آن را با توابع چگالی احتمال شناخته شده تقریب زد. شکل لوله صوتی و مد تحریک آن به صورت نسبتاً آرام تغییر می‏کند و بنابراین صحبت را می‏توان به صورت شبه ایستان در دوره های کوتاه زمانی   (حدود ۲۰ms) در نظر گرفت و با یک  فرآیند تصادفی ارگادیک در یک قطعه زمانی کوچک   مدل نمود و طیف مشخصی برای آن در این قطعه زمانی بدست آورد

علاوه بر افزونگی های فوق عامل مهم دیگری که کاهش نرخ داده سیگنال صحبت را ممکن  می سازد، طبیعت غیر حساس گوش انسان نسبت به بسیاری از ویژگیهای این سیگنال می‏باشد

۱-۲- مدل سازی  پیشگویی خطی

روش کدینگ پیشگویی خطی (LPC[1])  مبتنی بر مدل تولید صحبت در کد کننده های صوتی می‏باشد که در اینجا در شکل (۱-۲) نشان داده شده است. برای استفاده از مدل لازم است که معلوم شود سیگنال با واک است یا بی‏واک و اگر با واک است پریود Pitch مجاسبه گردد. تفاوت اصلی بین LPC و سایر کدکننده های صوتی  در مدل کردن لوله صوتی است. در تحلیل LPC ، لوله صوتی به صورت یک فیلتر دیجیتال تمام قطب در نظرگرفته می‏شود.[۴,۱]

که در آن p مرتبه فیلتر است. اگر S(n) خروجی فیلتر مدل صحبت  و e(n) تحریک ورودی باشد، معادله فوق را در حوزه زمان به صورت زیر می‏توان نوشت

به عبارت دیگر هر نمونه صحبت به صورت ترکیب خطی از نمونه های قبلی قابل بیان است و این دلیل نام گذاری کدینگ پیشگویی خطی (LPC) می‏باشد

۱-۲-۱- پنجره کردن سیگنال صحبت

روش LPC هنگامی دقیق است که به سیگنالهای ایستان[۱] اعمال شود، یعنی به سیگنالهایی که رفتار آنها در زمان تغییر نمی‏کند. هر چند که این موضوع در مورد صحبت صادق نیست، اما برای اینکه بتوانیم روش LPC را بکار ببریم، سیگنال صحبت را به قسمت های کوچکی بنام   “فریم” تقسیم می‏کنیم که این فریم ها شبه ایستان هستند. شکل (۱-۳) مثالی از قسمت بندی سیگنال صحبت را نشان می‏دهد. این قسمت بندی با ضرب کردن سیگنال صحبت  S(n) ، در سیگنال  پنجره W(n) انجام می‏شود

[۱]  Stationary

[۱]  Linear Predictive Coding

[۱]  Vocal Cords

[۲] Vocal Tracts

[۳] Unvoiced

[۴] Voiced

[۵] Formant

[۶]  Update

[۷]  Redundancy

  راهنمای خرید:
  • همچنین لینک دانلود به ایمیل شما ارسال خواهد شد به همین دلیل ایمیل خود را به دقت وارد نمایید.
  • ممکن است ایمیل ارسالی به پوشه اسپم یا Bulk ایمیل شما ارسال شده باشد.
  • در صورتی که به هر دلیلی موفق به دانلود فایل مورد نظر نشدید با ما تماس بگیرید.