اگر كامپيوترها قادر به تشخيص زبان گفتاري انسان باشند، شايد روزي بتوانيم براي وارد كردن دستورات و فرمانها از صدا و دستورات گفتاري به جاي صفحه كليد استفاده كنيم. اما اينكه كامپيوتر بتواند گفتار انسان را بخوبي تشخيص دهد، امري بسيار سخت به نظر ميرسد، چراكه زبان محاورهاي تفاوت بسيار زيادي با زبان نوشتاري داشته و تنوع زبان گفتاري و اينكه هر زباني هم داراي لهجههاي متفاوتي است، خود معضل ديگري است.هماكنون با سرمايهگذاري موسسه VERDIKT تحت نظارت شوراي تحقيقاتي نروژ، پروفسور اسوندسن از دانشگاه NTNU نروژ و همكارانش در حال تست رويكرد ابداعي ـ ابتكاري براي خلق نسل بعدي تكنولوژي تشخيص گفتار هستند. محققان نروژي نشان دادهاند كه اساس توليد گفتار در همه زبانها يكسان است. به اين ترتيب اين تكنولوژي بدون اتكا به دادههاي گفتاري هر زبان قابل توسعه و به كار بردن براي تمرين ماشينهاست. محققان تحقيقاتشان را براساس مطالعه فونتيك يا مطالعه اصوات گفتار انسان انجام ميدهند. همچنين اطلاعات اضافي ديگري همچون دانش زبان و گويشهاي مختلفي را در بانك اطلاعاتي سيستم گنجاندند.تاكنون به منظور تشخيص گفتار دو رويكرد متفاوت شايعتر از بقيه بوده است؛ هر دو براساس استفاده از دادههاي گفتاري و متون منبع، جهت آموزش به كامپيوتر براي تشخيص زبانهاي مختلف بنا شده است. يك رويكرد انتقال قوانين استنتاجي در مورد كلمات و صداها به كامپيوتر است. محققان معتقدند كه با آناليز بخش كوچكي از يك سخنراني ميتوان تعيين كرد، صداي خاصي كه با تشديد بين 750 تا 1200 هرتز تلفظ شده مربوط به حرف A است و اگر ميزان تشديد بين 350 تا 800 مگاهرتز باشد اين صدا مربوط به حرف U است. رويكرد دوم اين است كه آموزش به ماشين را فراموش كرده و با خوراندن نمونههاي مختلف آوايي و گفتاري بتوان از طريق مقايسه و نمونهبرداري كامپيوتر را قادر به تشخيص گفتار كرد. در ابتدا ماشين تمام پيشامدهاي صوتي محتمل را دريافت ميكند، در اين ميان احتمال تفسير رخدادهايي با فركانس بالاتر توسط ماشين و تفسير آن به صوت نمونه بيشتر است.گروه تحقيقاتي رويكردي را انتخاب كرد كه بين اين دو رويكرد سنتي قرار ميگيرد، آنها اطمينان زيادي به رويكرد آماري دارند، از طرفي نياز به توجه به الگوهاي قابل پيشبيني در گفتار در دنياي واقعي نيز وجود دارد. در سيستم جديد شاهد تركيبي از يادگيري دادهمحور و رويكرد مبتني بر قواعد هستيم. الگوهاي گفتار با توجه به فيزيولوژي، گويش، فرهنگ و سلامت افراد متفاوت بوده و همه اينها بر اصوات و توليد جملات تاثير ميگذارد. براي اينكه يك ماشين چگونگي درك اين گفتار را بياموزد بايد قادر به تشخيص شايعترين تغييرات و اختلافات بين گفتار و زبان باشد.
.: Weblog Themes By Pichak :.