استخدام خوارزميات تعلم الآلة لتصنيف همزتي الوصل والقطع

نوع المستند : المقالة الأصلية

المؤلفون

1 جامعة الطائف

2 قسم اللغة العربية، الکلية الجامعية بتربة، جامعة الطائف

3 قسم الرياضيات، برنامج علوم الحاسب بالکلية الجامعية بتربة، جامعة الطائف

المستخلص


ملخص:
في هذه الدراسة البحثية نستعرض مساهمة التقنية في تطور اللغة العربية لا سيما الرسم الصحيح لهمزتي الوصل والقطع.
وتهدف الدراسة بشکل خاص لبناء نموذج مصنف ذکي يعمل على تصنيف الکلمات العربية المبتدئة بحرف الألف، وتصنيف همزتها إلى همزة وصل أو همزة قطع من خلال استخدام تقنيات الذکاء الاصطناعي بصورة عامة، وخوارزميات تعلم الآلة بصورة خاصة من أجل تأسـيس معاييـر دقيقة وصحيحة فــي رسم همزتي الوصل والقطع.
واعتمدت الدراسة على تجميع الکلمات العربية المبتدئة بالهمزة، من خلال تصميم استبانة رقمية مهمتها تجميع أکبر قدر من الکلمات المبتدئة بالهمزة وتصنيفها لهمزتي وصل أو قطع وفقاً لقواعد النحو المتبعة في ذلک، تم نشر الاستبانة على الويب وتعبئتها بواسطة 50 متخصص في النحو بدرجات علمية متفاوتة، حيث بلغ عدد الکلمات المصنفة 400 کلمة، وبعد معالجة واستبعاد الکلمات المکررة وعددها 101 کلمة، وحصلنا على 299 کلمة صالحة لتطبيقها على نموذج المصنف، وبناءً على حجم ونوع البيانات المجمعة وآلية التصنيف المتبعة تم تطبيق خوارزميات تصنيف تتناسب مع العينة المجمعة مثل خوارزمية آلة دعم المتجه (SVM) وخوارزمية نايف بيز(NB) وخوارزمية الجار الأقرب (KNN) وذلک من خلال استخدام لغة Python ومکتبة (sk-learn).
بعد تدريب نماذج المصنفات المستخدمة وقياس دقة الخوارزميات تبين أن خوارزمية آلة دعم المتجه (SVM) قد حصلت على أعلى دقة للنموذج بنسبة 92% وهي نسبة مرتفعة وکافية لحل المشکلة.

الكلمات الرئيسية

الموضوعات الرئيسية