Title: Implementation of an Arabic digit recognition system
Authors: Ahmed M S
Hagos E M
Issue Date: 1989
Citation: Implementation of an Arabic digit recognition system M S Ahmed and E M HagosThe Arabian journal for science and engineering المجلة العربية للعلوم والهندسة Univeristy of Petroleum and MineralsVol 14 no 1 (January 1989) p p 7991Ahmed M SHagos E M
Abstract: تم تنفيذ لتمييز الأعداد العربية لا يعتمد على المتحدث بل يستخدم طريقة مطابقة النماذج ولقد بني النظام على بارامترات LPC وعلى مقياس (كوش) للمسافة بين إطار وإطار وعلى طريقة ديناميكية لمعالجة الانبعاج لضبط بدايتي المنطوق المرجع مع المنطوق المختبر وحتى يكون النظام مستقلا عن المتحدث تستعمل عدة نماذج لكل كلمة وقاعدة أقرب مجاور كمعيار للاختيار ولقد كونت قاعدة للمعلومات بها ثمانون تكرارا لكل رقم وجمعت هذه التكرارات عن طريق تلفظ عشرين متحدث بكل رقم أربع مرات وأمكن الحصول على النماذج المرجعية باستخدام طريقة إحصائية على مكونات قاعدة المعلومات ولقد أجريت التجارب كما يلي 1تغيير عدد المتحدثين في مجموعة التدريب وعدد النماذج لكل رقم 2دراسة تأثير حجم الإطار الثابت والمتغير ولقد لوحظ أن عدد النماذج لكل كلمة يؤثر بشكل كبير على الآداء أما فيما يتعلق بثبات وتغيير حجم الإطار فإن الإطار متغير الحجم يقلل زمن التشغيل والتخزين إلا أن الأداء يكون سيئا في حالة الأرقام ذات الصوت المشابه
A speakerindependent Arabic digit recognition system is implemented that uses template matching The system is based upon the LPC parameters as features the cosh measure as frametoframe distance and the procedure of dynamic time warping for time alignment between the test and reference utterances To accommodate speaker independency it uses multiple templates per word and the kNN rule as the decision criterion Four utterances of each digit from each of twenty speakers are collected to form a data base of eighty replications for every word The reference templates are obtained from a statistical clustering analysis of this data base Experiments are conducted (1) by varying the number of speakers in the training data set and the number of templates per word and (2) considering fixed and variable size framing It is observed that a significant factor to improve the speaker independent performance is the number of templates per word A comparison of fixed and variable size framing showed that although the latter is capable of reducing the processing time and storage it yields poor performance in acoustically similar words
URI: http://172.16.0.14/Dspace/handle/123456789/3602
Appears in Collections:English Articles

Files in This Item:

There are no files associated with this item.

Number of visits :319
Number of Downloads :0
Login To Add Comment or Review

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.