فاطمة القلال، ماهر الجوة ، لمياء هدريش بلغيث ، عبد المجيد بن حمادو – جامعة صفاقس، تونس
الملخـــــص
يندرج هذا العمل ضمن البحوث التي تهتم بالتحليل الآلي للنصوص باللغة العربية وتقدم هذه الورقة برنامجا آليا لتقليص الجمل وذلك بحذف التراكيب التي لا تحتوي على أفكار هامة مما يساعد في مرحلة ثانية على تكوين التلخيص الآلي. ولتحديد التراكيب التي يمكن إزالتها قمنا بعملية تلقين آلي باستعمال متن ساهم عدة لغويون في تحيينه. وتعتمد عملية التلقين على الخصائص اللغوية والنحوية وعلى الخصائص التطبيقية للتلخيص الآلي. تم الإعتماد لبرمجة هذا العمل على المحلل النحوي لجامعة ستانفورد وذلك لإعراب التراكيب والكلمات في الجمل المدونة باللغة العربية.
الكلمات الجوهرية: التقليص الآلي، التلخيص الآلي، التحليل النحوي، حذف التراكيب، التلقين الآلي
———————————————————————————————————————–
Automatic Compression of Arabic Sentences Based on Machine Learning
Abstract
Sentence compression is the task of producing a summary of a single sentence. The compressed sentence should be shorter, contain the important content from the original, and itself be grammatical. In this work we present the first attempt to build a system for Arabic sentence compression. The proposed method exploits a Stanford parser to perform syntactic analysis and used an annotated corpus as input for learning to predict if a phrases or a word can be reduced. The learning step takes in account syntactic and context criteria to expect a realistic learning situation.
Keywords: Automatic compression, automatic summarization, syntactic analysis, phrases reduction, machine learning