مبادرة "وَرَّاق" لحوسبة الكتب العربية

ساعدنا في تعليم الحاسوب كيف يقرأ كتب العربية

عن المشروع

مبادرة وَرَّاق هي مبادرة تهدف لحوسبة كتب العربية باستخدام تقنيات تعلم الآلة (Machine Learning).
أغلب الكتب العربية توجد على هيئة ملفات PDF مأخوذة من صور للكتاب، وهذا الأمر يشكل تحديا للحاسوب إذ لا يستطيع التعامل مع كتب بهذه الصيغة، فلا يمكنه مثلا البحث عن كلمة في كتاب بهذه الصيغة، كما لا يمكن للقاريء أن يقوم بنسخ ولصق أي جزء من الكتاب.
لتوضيح هذه المشكلة حاول أن تقوم بنسخ الكلمة الأولى في الجملة التالية


لم تستطع، صحيح؟ لأن هذا السطر ليس نصا ولكنه صورة. حل هذه المشكلة هو تحويل الكتاب إلى نص، وهذا أمر يمكن للحاسوب أن يتعلمه ولكنه يحتاج لمعلم وهذا المعلم هو أنت ! سيقوم موقعنا بعرض سطر من كتاب عليك، فتقوم بكتابة ما تراه من كلمات فيعرض عليك سطرا آخر وهكذا، وعندما نصل إلى عدد كاف من السطور سنستعملها لتعليم الحاسوب كيف يتعرف على حروف هذا الكتاب بنفسه باستخدام تقنيات تعلم الآلة. أجل! كل ما عليك فعله هو كتابة بعض السطور وسيتعلم منك الحاسوب. يمكنك أيضا اقتراح أو رفع كتب. هذه الطريقة يمكن أيضا استخدامها في حوسبة المخطوطات ولكن سبندأ بالكتب المطبوعة.

لماذا نحوسب الكتب ؟

  1. لنتمكن من البحث في هذه الكتب بشكل سريع
  2. لنتيح لضعيفي الإبصار الاستماع إلى ما في تلك الكتب (لا يستطيع الحاسوب قراءة الصور، فقط النصوص)
  3. لتسهيل عمل الباحثين في العلوم التراثية والعربية

شارك في العمل

لتشارك في العمل قم بتسجيل الدخول بحسابك على فيسبوك أو جوجل وسيمكنك المساهمة فورا برفع كتب وكتابة أسطر.

فريق العمل

Image

محمد طارق الحداد طالب دكتوراه في مجال الهندسة الطبية

محمد هو صاحب الفكرة، قام بكتابة النموذج الأولي للفكرة

Image

مصطفى عبد الرءوف طالب دكتوراه في مجال المعلوماتية الطبية

مصطفى هو المسئول عن جانب تعليم الآلة بالمشروع وليس هذا المشروع هو أول مشاريعه المهتمة بالمحتوى العربي فهو أيضا مؤسس مشروع الفهرست