دورية أكاديمية

Developing a Stress Prediction Tool for Arabic Speech Recognition Tasks.

التفاصيل البيبلوغرافية
العنوان: Developing a Stress Prediction Tool for Arabic Speech Recognition Tasks.
Alternate Title: بر في الكلمات لأنظمة تطوير أداة لتمييز مواضع الن على الكلام العربي ّ ف الآلي ّ التعر (Arabic)
المؤلفون: Alsharhan, Eiman, Alnajem, Salah
المصدر: Scientific Journal of King Faisal University, Humanities & Management Sciences; 2021, Vol. 22 Issue 2, p119-125, 7p
مصطلحات موضوعية: SPEECH perception, PROSODIC analysis (Linguistics), AUTOMATIC speech recognition, NATURAL language processing, SPEECH, COMPUTATIONAL complexity, PERFORMANCE standards
Abstract (English): Developing natural language processing applications for Arabic must consider the different linguistic characteristics found in speech and translate those characteristics to script in order to reduce computational complexity and therefore reduce the word error rate (WER). Suprasegmental features are fundamental properties of speech that can enhance the performance of many natural speech processing applications. The present study considered stress as a prosodic feature comprising the prominence of syllables in speech by developing a tool that generated phonetic transcriptions and predicted the stress position. The generated transcription was used to create the phonetic dictionary necessary for developing an automatic speech recognition (ASR) system. This tool had to be accurate, linguistically motivated, and applicationally useful; therefore, the effectiveness of the generated stress-marked phonetic dictionary was tested by comparing the performance of a standard fixed dictionary-based system with that of one using the automatically generated dictionary. The research reported a 5.6% reduction in WER when using a dictionary with stress markers attached to each phone in the stressed syllable and a 3.5% reduction in WER when using a dictionary with stress markers assigned only to stressed vowels. These results encourage future studies to employ prosodic features of speech when developing different speech processing applications. [ABSTRACT FROM AUTHOR]
Abstract (Arabic): الخصائص اللغويّة ب تطوير تطبيقات المعالجة الآليّة للغة العربيّة مراعاة يتطل المختلفة الموجودة في الكلام، وترجمة تلك الخصائص الكلاميّة كتابيًّا، من أجل تقليل عتبر ُ التّعقيد الحسابيّ، وبالتالي تقليل معدّل الخطأ في التعرّف على الكلمات. ت الخواصّ الكلاميّة فوق القطعيّة -كالنبر- من الخصائص الأساسيّة للكلام، والتي يمكنها بدورها أن تعزّز أداء العديد من تطبيقات المعالجة الآليّة للكلام. تستهدف قوم بتقسيم الكلمة إلى المقاطع التي تتكوّن منها، وتمييز َ الدّراسة الحاليّة تطوير أداة ت المقاطع المنبورة بشكل آليّ، وسيتمّ استخدام مخرجات هذه الآلة في بناء القاموس الصّوتيّ اللازم لتطوير نظام التعرّف التلقائيّ على الكلام العربيّ. يجب أن تكون هذه الآلة دقيقة ومبنيّة على أسس لغويّة صحيحة حتّى تكون مفيدة تطبيقيًّا، ولاختبار ة الآلة المطوَّرة قامت الدّراسة بتطوير أنموذجين ّ فعاليّة ودق مختلفين لبرنامج التعرّف الآليّ على الكلام العربيّ بهدف مقارنة أدائهما. يَستخدِمُ الأنموذجُ الأوّل في بناء النّموذجِ الصّوتيّ للنّظام القاموسَ الصّوتيّ الأساس يّ)بدون نبر(، بينما يعتمد د آليًّا باستخدام الأداة التي قمنا ب َّ الأنموذج الثاني على القاموس المول تطويرها. تشير د آليًّا على الاستخدام التقليديّ للقاموس ّ النتائج إلى تفوّق استخدام القاموس المول الصوتيّ، وذلك بتخفيض معدّل الخطأ في التعرّف على الكلمات بنسبة) 5.6 ٪(عند تمييز كلّ محتويات المقطع المنبور، وتحسّن بنسبة) 3.5 ٪(عند استخدام القاموس الذي يميّز الح عتبَر هذه النتائج مشجّعة للقيام بدراسات ُ ركات المنبورة فقط. ت مستقبليّة تقوم بتوظيف المميّزات العروضيّة للكلام عند تطوير تطبيقات معالجة الكلام الآلية المختلفة. [ABSTRACT FROM AUTHOR]
Copyright of Scientific Journal of King Faisal University, Humanities & Management Sciences is the property of Association of Arab Universities and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)
قاعدة البيانات: Complementary Index
الوصف
تدمد:13196944
DOI:10.37575/h/lng/2323