بخش درک گفتار
Download
Report
Transcript بخش درک گفتار
ارائه دهنده :ویدا مهدی راده فر
استاد راهنما :آقای دکتر توحید خواه
نیمسال اول 88-89
oمقدمه
oساختار مدل :بخش تولید گفتار
بخش درک گفتار
oمقایسه با مدل DIVA
oبه دست آوردن اطالعات گفتارBabbling :
Imitation
oنتیجه گیری
محدودیت عملکرد سیستم های بازشناس ی و تلفیق گفتار فعلی
عدم توجه به مراحل پردازش عصبی تولید و درک گفتار
هدف این مطالعه :ارائه یک مدل عصبی پیاده سازی شده
کامپیوتری با استفاده از شبکه عصبی ،دارای قابلیت تقلید از
پردازش های تولید و درک گفتار انسان
8
phonemic map - Phonetic map –
motor plan map - primary
motor map - articulation
برای سیالب تکرار شونده حالت phonemicباعث فعالیت یک
نرون در نقشه phoneticمی شود.
فعال شدن حالت های حس ی auditoryو
somatosensoryو حالت طرح حرکت()motor plan
بواسطه نقشه phonetic
برای سیالب غیر تکرار شونده ،ابتدا طراحی حرکت و سپس
motor plan
Motor plan
هماهنگی زمانی حرکت آرتیکوالتورها
Motor execution
دریافتی
Primary motor map
کنترل و تصحیح طرح حرکت بوسیله فیدبکهای
تشخیص واقعی
هر حرکت گفتار
فعال کردن واحدهای موتوری و حرکت آرتیکوالتور
آیتم گفتارتولید شده با حالتsomatosensory وauditory مقایسه فیدبک
آموزش دیدهsomatosensory وauditory
motor plan تصحیح
high-low, front-back, rounded-unrounded : v سه پارامتر
labial, apical, dorsal, exact closing position : c چهار پارامتر
motor plan نرون برای نقشه11
Primary motor map نرون برای110
auditory نرون برای نقشه11
somatosensory نرون برای نقشه38
ساختار مدل محاسباتی نورال بیس
Auditory receptors –
auditory map phonetic map - phonemic map
Directions Into Velocities of Articulators
:شباهت ها
feedforward وfeedback مسیرهای کنترلی
SOM شبکه های
imitation وbabbling روش آموزش
:تفاوتها
motor execution وmotor planning ادغام
phonetic نقشه
مدل تولید گفتار:DIVA
اطالعات در نگاشت ها به صورت مقادیر وزنی اتصاالت نرون ها
است که در طول آموزش تنظیم می شوند.
دو مرحله آموزش:
Babbling
Imitation
بررس ی آیتم های گفتار بدون در نظر گرفتن زبان شناس ی آنها
تولید رندوم آیتم های گفتار
گوش دادن به آیتم ها از طریق فیدبک auditiry
تنظیم وزن های بین نقشه های حس ی و motor planبوسیله نقشه
phonetic
اطالعات مستقل از زبان
یادگیری رابطه حس ی -حرکتی مجرای صوتی و کنترل عصبی آن یعنی رابطه بین
حالت های motor planو حالت های auditoryو
somatosensory
شامل دو آموزش حالت های vocalicو syllabic
مجموعه آموزش ی vocalicشامل 1076حالت
مجموعه آموزش ی syllabicشامل 279آیتم آموزش ی
حاالت حرکتی برای VCو CVبر اساس پارامترهای زیر تعیین می شود:.
دو پارامتر vocalic
حرکات آرتیکوالتور
موقعیت بسته شدن در حروف بی صدا
استفاده از شبکه خود سامانده
تنظیم وزن ها بین نرون های الیه جانبی و نرون الیه مرکزی به
روش Hebbian
phonetic map (15*15 neurons)
تنظیم وزن های بین نقشه phoneticو phonemic
اطالعات به دست آمده از imitationوابسته به زبان است.
مدل در طول آموزش یاد می گیرد که نرون هایی با ویژگی های phonemicمتفاوت را به حالت
های حس ی متناسب آنها وصل کند.
:Phone region نرونی در این ناحیه قرار دارد که مقدار
وزنی اتصال آن با نرون متناظر در نقشه ، phonemicباالی 0.95باشد.
پردازش آیتم آکوستیک خارجی
تخمین motor plan
Positions of all auditory patterns of vocalic training
آموزش 20مدل مختلف
20 شنونده مجازی
:Measured discrimination تخمین فاصله نرونها در
نقشه phonetic
:Calculated discrimination بر اساس احتمال شناسایی
با تشکراز توجه شما