پاورپوینت بررسي روش انسان در تشخيص صحبت و شبيه سازي آن
فرمت فایل: پاورپوینت قابل ویرایش تعداد اسلاید: 76
قسمتی از پاورپوینت :
مطالب
شناخت انسان و سيگنال صحبت
سيستم استخراج ويژگي
سيستم بازشناسي
آزمايشها
محدوديتهايي که روشهاي موجود ايجاد ميکنند
غير قابل تفسير
مبتني بر مدل (معمولا HMM)
وابسته به اطلاعات زباني
بدون قابليت کشف صداهاي جديد
مبتني بر نظريه احتمال هستند که شواهد زيادي نشان ميدهند که انسان بر مبناي اين نظريه کار نميکند
پيوند غير طبيعي با سطوح بالاتر زباني مانند کلمه و گرامر و نيز مبتني بودن بر مدل زباني
خلاصه: همه مشکلات از بالا به پايين حل ميشوند (ما راه حل را کشف ميکنيم و به کامپيوتر ميدهيم)
سيگنال صحبت فازي است
در مثال بعد ميبينيم که حرف «ي» ميتواند بهجاي حرف «ن» بهکار رود.
به عبارت ديگر «ي» و «ن» بودن مفهومي فازي است که داراي اشتراک ذاتي است.
نکته: ولي ميتوان (امکان دارد) «ي» را به عنوان «ن» پذيرفت.
س: احتمال اينکه کسي «ي» را مانند «ن» بگويد چقدر است؟
مشکل مبهم بودن همه چيز
اگر همهچيز داراي ابهام است پس ما چگونه ميتوانيم صحبت بدون معني را 100٪ تشخيص دهيم؟
تشخيص صحبت بدون معني،با وجود نويز سفيد، به همراه صداهاي ناشناخته (مثل بوق ماشين)، با قطعيت؟
کداميک را انتخاب ميکنيد؟
تاسي را بياندازيم و اگر 6 نيامد 60 ميليون تومان.
اميد رياضي = 50
قطعا 40 ميليون تومان
اميد رياضي = 40
انسان قطعيت را دوست دارد (+ مثالي از تفاوت احتمال با تفکر انسان).
تفسير ما از فازي بودن سيگنال صحبت
واجها مجموعههايي فازي هستند.
اما در سيگنال صحبت بخشهايي هستند که آنها را شيء ميناميم و اين اشياء با قطعيت قابل تميز هستند. (الزام)
همچنين اشيائي هستند که تفاوت کمي با هم دارند مانند «م» و «ن» که در آنها دقيق نميشويم. (امکان)
«م» و «ن» مجموعههايي فازي هستند (امکان) ولي گذر آنها به واج «آ» کاملا متمايز است (الزام).
مطلوبات در مورد بخش استخراج ويژگي
استخراج ويژگيها در 200ms تا چيزي که بتوان با قطعيت راجع به آن حرف زد وجود داشته باشد.
مبتني بر ويژگيهاي شنيداري و بخشبندي بر اساس اشياء
يک دليل براي اينکه توانايي صحبت کردن پس از توانايي شنيدن شکل ميگيرد اين است که کودکان به زبان خودشان حرف ميزنند ولي به زبان خودشان نميشنوند.
داراي دقتي مشابه انسان نسبت به مقدار ويژگيها
داراي استحکام بيشتر در مقابل نويز