حوار مع طه زروقي

taha_zerrouki.jpg

أولا ممكن تعطينا خلفية شخصية؟ عائلتك؟ دراستك؟ طبيعة و مكان عملك؟ مدينتك؟

طه زروقي مواليد 1978 من عائلة بسيطة، درست المعلوماتية في المعهد الوطني للمعلوماتية بالجزائر العاصمة منذ 1996، لأتخرج مهندسا سنة 2001، ثم واصلت مشوار تحضير الماجستير في نفس المعهد حتى 2005، وبعدها سجلت في الدكتوراه أيضا. تخصصي كان نظم المعلوماتية، و هو يهتم كثيرا بالبرمجة.

عملي الذي استرزق منه هو تدريب الحاسوب، للموظفين عادة، درّست الأكسل، و الأكسس، لكنني تخصصت في برامج إدارة المشاريع مثل برنامج MS-Project و برنامج Primavera Project Panner. كما أدرس أيضا إنشاء المواقع ببرمجتها بـPHP/MySQL أو إعداد المواقع باستعمال نظم إدارة المحتوى.

أسكن بلدة الخبوزية الصغيرة، وهي تبعد عن العاصمة مركز نشاطي بـ100 كلم، و منذ وصول الانترنت إلى البلدة النائية، صرت لا أتنقل إلا للعمل، و أقضي معظم أوقات الفراغ بين التطوير الحر، و تحضير الدكتوراه، و نشاطي في الكشافة الإسلامية الجزائرية.

كم مرة في الأسبوع تحتاج النزول للعمل في العاصمة؟ و هل قبل دخول الانترنت كنت تقطع هذه المسافة كلما أردت الوصول على الانترنت؟

عملي ليس دوريا، فإذا كان لدي عمل أقضي الأسبوع كله في العاصمة. لدي الآن الإنترنت في البيت، لكن سابقا كانت متوفرة في نوادي الإنترنت، كنت أتنقل للمدينة المجاورة حوالي سبعة أميال فقط.

متى دخلت الانترنت بلدتك؟

منذ نهاية سنة 2007، وصل الدفق العالي ADSL، من قبل ذلك كان الاتصال الهاتفي، لكنني لم أستعمله أبدا، و كنت أفضل النوادي في المدينة، ساعة كل يوم أو يومين.

ممكن تكلمنا أكتر عن نشاطك في الكشافة؟ هل اهتمامك بالكشافة هو السبب في الاسم المستعار Linuxscout؟

نعم، اخترته في وقت كنت أهتم بلينكس والكشافة. أنا نائب قائد فوج (مجموعة)تضم حاليا 100 منخرط، في بلدة تعداد سكانها 6000 نسمة، أسسنا فوجنا منذ 8 سنوات عام 2002، ونعمل على تنمية قدرات الأطفال من خلال التدريب على المهارات الكشفية، و متابعتهم خلال سنوات، نمارس الكثير من النشاطات خاصة الرحلات و الزيارات العلمية و المخيمات الصيفية و الدورات الرياضية و الاحتفالات الوطنية، و ننشر أخبار نشاطاتنا الكشفية على مدونة البلدة التي نشرف عليها أيضا، باعتبارها نشاطا إعلاميا محليا يغطي أخبار البلدة و أخبارنا.

من جهة أخرى، قمت بتصميم موقع كشافة البويرة (الولاية التي أقطن بها) منذ خمس سنوات و تصميم الموسوعة الكشفية التي تعد مرجعا للمهارات الكشفية و الوثائق التربوية. أقضي معظم أوقات فراغي في العمل الكشفي لاسيما في نهاية الأسبوع.

لماذا اخترت دراسة المعلوماتية؟

لم يكن لدينا أي شيء يربطنا بالتكنولوجيا والمعلوماتية آنذاك، وكنا نعرف عن الكمبيوتر من التلفزيون و خصوصا الرسوم المتحركة وكنت طموحا شغوفا بما هو جديد. ثم انخرطت في نادي الحاسوب مدة قصيرة فقط عندما كنت في الإعدادية، كان لديهم جهاز أمستراد فقط. و بعد النجاح في البكالوريا (الثانوية العامة)، نختار مجموعة من الشعب، ليتم توجيهنا حسب الرغبات و المعدل العام، وضعت المعلوماتية على رأس القائمة، بعدها بعض التخصصات الطبية، ثم لغة صينية، فتحصلت على الخيار الأول، وإلا لكنت الآن طبيبا أو مترجما للصينية.

ماذا يعمل والداك؟ هل لهما تأثير في اختيارك دراسة المعلوماتية؟

يعمل أبي معلم قرآن، وهو سبب شغفي بالمطالعة منذ الصغر، واخترت المعلوماتية في وقت دخل الحاسوب إلى شبابيك البريد، لذا يسألك الناس، هل ستعمل في مركز البريد عندما تتخرج. أما أمي فما تزال تتمنى لو أنني أصبحت طبيبا،

متى كانت بدايتك مع البرمجة؟ هل كانت بايثون من البداية؟

بدأت البرمجة سنة 1997 في المنهج الدراسي كطالب في المعلوماتية، وكانت أول لغات البرمجة التي نستعملها هي باسكال، ثم انتقلت إلى لغة سي، والتي أتقنها طبعا، لأنني صممت بها مشروع تخرجي. بعدها تعلمت لغة php لتصميم المواقع، ودرّستها في دورات تصميم المواقع. أما لغة بايثون فأول اتصال لي
بها كان عندما حاولت قراءة كود برنامج الدؤلي للتدقيق الإملائي، و جربتها لما لها من مزايا قرأت عنها، و أهم ما جذبني إليها دعمها التلقائي لليونيكود. كما أنني كنت أريد تجربة ما يتبادر إلى ذهني من خوارزميات، بدلا من الضياع وسط بنى البيانات وكيفية تنفيذها. كان ذلك عام 2006.

كم ساعة تقضيها قي البرمجة؟

في أوقات الإلهام قد أقضي سبع ساعات برمجة يوميا، لكنّ الصعب في التطبيقات التي أعمل عليها هي الخوارزميات، والتي تأخذ كل الوقت بلا برمجة.

متى كانت معرفتك بالبرمجيات الحرة مفتوحة المصدر؟

تعرفت على المصادر المفتوحة لما كنت طالبا حوالي سنة 2000، حينما بدأنا نسمع بنظام لينكس، و نحاول أن نفهم فلسفته الجديدة في التطوير، كان الأمر في البداية صعبا التقبل أن تصمم شيئا ثم تمنحه للآخرين، لكننا كنا نرى بالمقابل الكثير من المشاريع التي تنفّذ في المعهد، و من ثمّ تقبر وتموت. كما كنا نجد صعوبات في التعامل مع البرامج التجريبية. كما أنّ قرصنة البرامج شائعة عندنا فلا نكاد ندفع إلا ثمن قرص مضغوط للحصول على برنامج عالمي. لكن البرامج الأهم كانت كلها تحتاج إلى كراك، نحصل عليه بطرق غير مناسبة. لذا كان اهتمامنا بالمصادر المفتوحة يزداد باقتناعنا بنظام لينكس، وعاصرت في تلك الفترة الجهود الأولى لتعريب لينكس وتوفير الدعم الأساسي للغة العربية.

أول المشاريع التي شاركت فيها هو تقديم المساعدة اللغوية للدكتور جمال الدين زقور في تصميم لغة برمجة عربية سماها لغة زاي، وقد ساعدته في اختيار الكلمات المناسبة والمصطلحات وتوثيق ذلك بالأمثلة التطبيقية. كما أشرفت على القسم العربي لمجلة Linuxfocus.org وترجمت العديد من المقالات بها.

متى بدأ اهتمامك بمعالجة اللغة العربية؟

نحن ندرس المعلوماتية بالفرنسية، و كنا بعيدين جدا عن المعلوماتية باللغة العربية، لذا كان يدفعنا الفضول للسؤال، هل يمكن هذا بالعربية، و هل تستطيع العربية فعل ذاك، و كنت دائما أول من يطرح السؤال و يبحث عنه، و من ثم يجيب الآخرين، حتى صرت مرجعا للمعلوماتية باللغة العربية في وسط مفرنس، و من بدأت الاهتمام بمعالجة اللغة العربية، فاقترح علي الزملاء أن أساعد في لغة زاي سنة 1998. كما كنت أتابع أيضا برنامج التدقيق العربي مثل الدؤلي وبغداد، و وجدتني متورطا في الأمر، مع بداية تحسن برنامج هانسبال للتدقيق الإملائي سنة 2006، و لما بحثت عمن يعمل عليه وجدت الأخ محمد كبداني من المغرب قد وضع خطة واضحة لما نريد، فعملنا معا، لكنني كنت غير راض دائما بالبرنامج فعملت على تعديله، و أضفت خاصية إغفال التشكيل، و التي اعتمدت في البرنامج، و اقترحت الكثير من التعديلات التي لم تنشر بعد. و في مشروع آية سبل، كانت أهم مشكلة لدينا هي تصريف الأفعال لذا فكرت في عمل برنامج لذلك.

ما هي المشاريع أو البرمجيات التي شاركت فيها في الفترة السابقة؟

أهم مشروع عملت عليه هو آيةسبل، وهنا أعترف أنّ معظم العمل المفيد حاليا قام به الأخ محمد كبداني، ذلك أنّ تعديلاتي و مساهماتي لم ينشر معظمها. و عملت في نفس الوقت على برنامج تصريف الأفعال، و محاولة محلل صرفي مبني على الأوزان لم انتهي منه بعد. و شاركت في مشروع الكلمات المستبعدة مع التقنين العرب. و بالتوازي مع المدقق الإملائي، أطلقت قاموس المترادفات الخاص بأوبن أوفيس. و أطلقت مؤخرا برنامج تحليل صرفي خفيف (Arabic light Stemmer) أسميته تاشفين، و مكتبة قاعدية للتعامل مع العربية بلغة بايثون أسميتها PyArabic على غرار مكتبة أخينا خالد الشمعة Ar-PHP.

codesprint_day2_3.jpg
فريق العمل على الكلمات المستبعدة أثناء ماراثون البرمجة 2009 طه، ريهام، خالد الشمعة و مصطفى

هل تعمل بمفردك أم هناك فريق عمل؟

أعمل دائما في فريق افتراضي تربطه الإنترنت، فكنا اثنين في فريق آيةسبل ،لم نلتق وجها لوجه أبدا، و ساعدنا مطور هانسبال بالتوضيحات، و أحسن مشروع جماعي قمت به هو قطرب، أنا صممت الخوارزمية و مصطفى عمارة، نشرها على الويب، و عصام حمود صمم الشعار، و طاقم عيون العرب استضافها، و الأستاذ مروان البواب لم يبخل علينا بالإجابة عن الاستفسارات. مشروع الكلمات المستبعدة أنجزناه في لقاء التقنيين العرب، أما قاموس المترادفات فقد أعانني فيه بعض الكشافين في إدخال البيانات. يعني هذه كلها جهود مشتركة، لا ننسى أن نشكر من شارك فيها.

ما هو مشروعك القادم؟

أعمل حاليا على مشروع بسيط هو برنامج أدوات على الويب، يقدم خدمات يحتاجها المطور أو المستخدم في معالجة اللغة العربية، مثل حذف حركات نص، إعادة تركيب الكلمات (unshaping)، تنسيق الشعر العمودي، و غيرها. أعمل على استكمال دورة قطرب، أي تصريف الفعل والتعرف عليه، و قد توصلت إلى نتائج أولية تتعرف على الفعل المتصرف و تعيده إلى أصله مشكولا. وسأعمل على تجميع اللبنات المختلفة، قطرب، الكلمات المستبعدة، تاشفين للتحليل الخفيف، و المترادفات و الأضداد لبناء محلل صرفي عربي مفتوح المصدر.

في رأيك ما هي الأدوات أو البرمجيات الملح تطويرها لتحسين حالة المحتوى العربي على الويب؟

التوجه الحالي هو تطويع التكنولوجيا لخدمة حاجات البشر، و من ذلك نلاحظ ظهور الكثير من مواقع الخدمة الواحدة، و ينقصنا كثير من هذه الخدمات في العالم العربي سواء كخدمات أساسية أو كبدائل لبعض الخدمات العالمية، بسبب حجب بعض هذه الخدمات عن بعض الدول العربية. و هذه الخدمات على بساطتها مهمة، مثل اختصار الروابط، و تحويل الفيديو، و تبادل الرسائل القصيرة، و نظم الأسئلة.

و نحتاج لبعض الخدمات المميزة، التي يمكن أن تتميز كخدمات البحث في القرآن والأحاديث بشكل أفضل، و في الشعر، و القواميس. و هذه بعض الأدوات التيأعتقد أنّ تطويرها ملح:
  • التعرف الضوئي.
  • استخلاص النصوص العربية من ملف pdf.
  • بناء ويكي لجمع مفردات قاموس عربي شامل.
  • بناء ويكي للترجمة متعدد اللغات من العربية وإلى اللغات الرئيسية (الصينية، الألمانية، الفرنسية، وغيرها...) مثل ميدان.
  • دعم النصوص العلمية العربية، دعم الرياضيات العربية في محررات المعادلات.
  • دعم أسماء النطاقات العربية.
  • توفير موارد لسانية حرة لمطوري معالجة اللغة العربية.
  • توفير العديد من الخدمات على الخط، للمساعدة في تصميم المواقع.
  • توفير الكتب التراثية في صيغة بيانات مهيكلة موسومة.

من هو جمهور مستخدمي البرمجيات التي تطورها؟ قطرب؟ تاشفين؟ PyArabic؟

هذه البرامج التي أعمل عليها، موجهة أساسا للمطورين، الذين يفتقدون للخوارزميات المفيدة في التعامل مع العربية، لكنني أثبت فعالياتها من خلال وضع واجهة خاصة بعموم المستخدمين فمثلا قطرب مفيد لمتعلم اللغة العربية و معلمها أي المبتدئ و المتقدم. لكنه في الأساس موجه للمطورين، و أفكر في وضع تطبيق له على شكل لعبة تربوية إن شاء الله. و قد راج قطرب في شكليه الحاليين( الويب وعلى وندوز) كثيرا في المنتديات التربوية و اللغوية. و بلغ تحميل التطبيق على وندوز 1500 تنزيل منذ أكتوبر 2009. أما تاشفين و PyArabic و الكلمات المستبعدة فهي أساسا للمطورين .

ما هي المجتمعات و المجموعات التقنية التي تشارك فيها؟

أشارك في تقنيين عرب، عيون العرب، أعجوبة، عرب كرنش، corpuslist، و أدير بعض المجموعات الخاصة بمشروع آيةسبل، و مجموعة الباحثين الجزائريين في معالجة اللغة، و لا أحب المشاركة في المنتديات أو استقبال الرسائل واسعة الانتشار.

قرأت في حوار لك على موقع غيوم عن تبني المنظمة العربية للتربية و الثقافة و العلوم بعض المشاريع لبناء تطبيقات لغوية؟ هل ممكن تكلمنا أكتر عن المنظمة و ما تقدمه من دعم في هذا المجال؟

لقد سارت هذه المنظمة في الطريق الصحيح لدعم العربية من خلال المصادر المفتوحة، إذ دعمت مشروع نظام صرف الرائع، وأقامت اجتماعا لخبراء المحللات الصرفية. و بعدها نسّقت بين المشاركين لتنظيم مسابقة لاختيار المحلل الصرفي للمنظمة، و جرت المسابقة على مراحل، ومن ثم تم اختيار فريق من المغرب، لانجاز المحلل الصرفي، و قد صدرت نسخة رائعة منه، و أعتقد أن أهم ميزة فيها هي إمكانية تعديل البيانات دون تعديل الخوارزمية، و هي خطوة في الطريق الصحيح. و تنوي المنظمة حسب مصادر مطلعة وضع خطة سنوية للعمل على ترقية المعالجة الآلية للغة العربية، مشروع التشكيل الآلي، و تقديم مساعدات للباحثين.

هل ممكن أن ترشح لنا بعض المصادر للمطورين المهتمين بالعمل على معالجة اللغة العربية؟

ما التطورات التي تتمنى أن تراها في هذا المجال قريبا؟ و على المستوى البعيد؟

أرجو أن تتوفر في المصدر المفتوح الكثير من المزايا الموجودة في التطبيقات اللغوية التجارية، مثل التعرف الضوئي، و التحليل الصرفي و من ثم التحليل الدلالي، و مزيدا من دعم اليونيكود في مختلف الأجهزة و الأنظمة، ليصبح التعامل مع اللغات طبيعيا. أما بعيدا فأتمنى أن نثبت أنّ اللغة العربية أكثر اللغات تلاؤما مع الحاسوب، و أتمنى أن نعمل على إثبات ذلك.


طه زروقي من أعضاء تقنيين عرب و المشاركين في ماراثون البرمجة 2009. يمكنكم متابعة أخباره على مدونته.

|
صورة أحمد غربية

سعداء بوجودك

سعداء بوجودك معهنا يا طه.
أتمنى أن يتاح لنا اللقاء قريبا.

رابط قد يهمك: Computational Approaches to Arabic Script-based Languages http://www.arabicscript.org (بالإنجليزية)

و تقرير الورشة: http://www.arabicscript.org/W07/CAASL2-Proceedings.pdf

» |