English

هل يمكن الوثوق بالذكاء الاصطناعي بالعربية؟

English

هل يمكن الوثوق بالذكاء الاصطناعي بالعربية؟

لماذا لا تزال النماذج العالمية تتعثر في فهم العربية؟ وكيف تحولت الدقة إلى ميزة تنافسية للحلول المصممة للمنطقة؟

بقلم محمد الطاسان، المؤسس والرئيس التنفيذي لشركة OmniOps

اللغة العربية هي لغة الحكومات والشركات والمؤسسات في مختلف دول الخليج. وهي لغة العقود واللوائح والإفصاحات المالية والخدمات العامة. ومع تسارع تبني تقنيات الذكاء الاصطناعي في المنطقة، خصوصًا في ظل الاستثمارات الضخمة التي ترصدها دول مثل السعودية، بات كثيرون يفترضون أن التحدي اللغوي لم يعد مطروحًا كما كان في السابق.

فالنماذج الأكثر تقدمًا اليوم قادرة على إنتاج نصوص عربية تبدو سليمة وطبيعية ومقنعة إلى حد بعيد. لكن الطلاقة لا تعني بالضرورة الدقة. ففي قطاعات مثل البنوك والرعاية الصحية والخدمات القانونية والجهات الحكومية، قد تسيء أنظمة الذكاء الاصطناعي فهم المعنى الدقيق للنص العربي، رغم أن الإجابة التي تقدمها تبدو صحيحة تمامًا. وهنا تكمن إحدى أبرز مشكلات الذكاء الاصطناعي بالعربية اليوم، فالنموذج قد يبدو واثقًا وصحيحًا، بينما يكون مخطئًا في جوهر المعنى.

في اللغة العربية، قد تكفي حركة واحدة لتغيير المعنى بالكامل، فتحدد من قام بالفعل ومن وقع عليه، ومن يتحمل المسؤولية القانونية أو المالية. وبينما يستطيع المتحدث العربي عادة استنتاج المعنى الصحيح من السياق حتى في غياب التشكيل، لا تنجح النماذج دائمًا في ذلك بالدرجة نفسها.

وأظهرت دراسة نشرتها مجموعة ALPS عام 2026 أن عددًا من النماذج المتقدمة حقق نتائج قوية في فهم المقصود العام من النصوص العربية، لكنه واجه صعوبة أكبر في التعامل مع بعض التراكيب النحوية التي قد تحمل دلالات قانونية أو تشغيلية مهمة. ووصف الباحثون هذه الظاهرة بأنها حالة يفهم فيها النموذج الرسالة العامة للجملة، لكنه يخطئ في العناصر اللغوية التي تحدد معناها الدقيق.

وقد لا يكون لهذا النوع من الأخطاء أثر كبير في المحادثات اليومية، لكنه قد يغيّر المعنى بصورة جوهرية عندما يتعلق الأمر بالعقود أو الوثائق القانونية والمالية والتنظيمية. والمشكلة هنا ليست أن الذكاء الاصطناعي ينتج عربية ركيكة أو غير طبيعية، بل العكس تمامًا. فالنصوص التي يولدها تبدو متماسكة ومقنعة إلى درجة قد تخفي ما فيها من أخطاء بنيوية، وهو ما يجعل اكتشافها أكثر صعوبة، ويزيد من تبعاتها عندما تقع.

قبل أن يفهم الذكاء الاصطناعي عليه أن يقرأ

وتصبح المشكلة أكثر تعقيدًا عندما نغادر عالم النصوص الرقمية النظيفة إلى الواقع الفعلي الذي تعمل فيه المؤسسات.

ففي القطاعات الحكومية والمصرفية والصحية والقانونية، تعتمد المؤسسات على أرشيف ضخم من الوثائق التي لم تُصمم أصلًا لتتعامل معها الأنظمة الذكية. عقود قديمة جرى مسحها ضوئيًا بجودة متدنية، ونماذج مكتوبة بخط اليد، وملفات PDF قديمة تجمع بين العربية والإنجليزية في الوثيقة نفسها، وسجلات مالية تتجاور فيها الأرقام المكتوبة من اليسار إلى اليمين مع نصوص عربية تسير في الاتجاه المعاكس.

وغالبًا ما تواجه أدوات الذكاء الاصطناعي العامة صعوبة في التعامل مع هذا النوع من المحتوى بصورة دقيقة ومتسقة. ويبرز ذلك بشكل خاص في تقنيات التعرف الضوئي على النصوص (OCR)، التي لا تزال تمثل تحديًا حقيقيًا عند التعامل مع الوثائق العربية على نطاق واسع. فاللغة العربية بطبيعتها لغة متصلة تتغير فيها أشكال الحروف بحسب موقعها داخل الكلمة. وعندما يضاف إلى ذلك غياب التشكيل واختلاف المصطلحات بين البلدان والانتقال المستمر بين العربية والإنجليزية في بيئات العمل، تتضاعف درجة التعقيد بسرعة.

وأشارت مناقشات أكاديمية نظمها برنامج الدراسات الإسلامية في كلية الحقوق بجامعة هارفارد عام 2025 إلى أن تحويل الوثائق العربية الكلاسيكية والرسمية إلى نصوص رقمية لا يزال يعاني من معدلات دقة محدودة، وأن رقمنة الوثيقة لا تعني بالضرورة أنها أصبحت قابلة للمعالجة الآلية بصورة موثوقة. ولهذا السبب، لا يكون نموذج الذكاء الاصطناعي نفسه هو مصدر الخطر الرئيسي في كثير من الأحيان، بل تبدأ المشكلة في مرحلة أسبق بكثير. فإذا جرى تحويل العقود أو السجلات أو النماذج إلى صيغة رقمية بشكل غير دقيق، فإن حتى أكثر النماذج تقدمًا ستبني إجاباتها على بيانات معيبة منذ البداية.

وهنا يظهر نوع آخر من الوهم، إذ تبدو الإجابة دقيقة وواثقة، بينما تكون مبنية على معلومات أسيء قراءتها أصلًا. والنتيجة أن الخطأ ينتقل من الوثيقة إلى الملخصات والتوصيات والقرارات، ثم إلى مختلف العمليات التي تعتمد عليها المؤسسة، من دون أن يكون واضحًا دائمًا أين بدأ.

ولهذا تتعثر كثير من تطبيقات الذكاء الاصطناعي بالعربية، وغالبًا ما يحدث ذلك من دون مؤشرات واضحة، فالنظام يواصل إنتاج إجابات تبدو سليمة، لأنه صُمم للإجابة عن الأسئلة لا للتشكيك في جودة البيانات التي بُنيت عليها تلك الإجابات. وعندما يحدث ذلك، ينتقل الخطأ إلى كل ما يُبنى على تلك البيانات لاحقًا.

المشكلة أن النموذج يجيب دائمًا

صُممت النماذج اللغوية الكبيرة لتوليد الإجابات. وعندما يُطرح عليها سؤال، فإنها تميل إلى الإجابة بثقة وطلاقة وتفصيل، بغض النظر عن مدى صحة ما تقوله. وفي بعض الحالات، قد يكون هذا أكثر خطورة مما يبدو. فخطأ واضح في الترجمة يمكن اكتشافه بسهولة، أما سوء فهم بند داخل ملخص عقد، فقد يمر من دون أن يلفت انتباه أحد، لأنه لا يحمل أي إشارة واضحة تدعو إلى المراجعة أو التشكيك.

وأظهرت أبحاث قُدمت في مؤتمر معالجة اللغة العربية عام 2025 أن ما يُعرف بـ«الهلوسة» — أي إنتاج معلومات تبدو صحيحة لكنها مختلقة — كان أكثر شيوعًا من بعض أنواع الأخطاء الأخرى في النماذج التي جرى اختبارها. وقد أصبح هذا التحدي حاضرًا إلى درجة دفعت الباحثين إلى تطوير معايير وأدوات تقييم متخصصة لقياس هذه الظاهرة في المحتوى العربي والإسلامي. ويعكس إطلاق مبادرة IslamicEval 2025، وهي أول مبادرة بحثية مخصصة لرصد الهلوسة في المحتوى الإسلامي، إدراكًا متزايدًا بأن هذه المشكلة لم تعد نظرية. فالمؤسسات بدأت تواجهها بالفعل في الاستخدامات اليومية.

ولهذا لم يعد السؤال الأساسي بالنسبة للمؤسسات هو ما إذا كان النموذج قادرًا على إنتاج نص عربي، فمعظم النماذج الحديثة تستطيع ذلك. السؤال الأهم اليوم هو هل يعرف النموذج متى لا يعرف؟

ففي البيئات الحكومية والقانونية والتنظيمية وبيئات الأعمال، لا تُقاس جودة النظام بقدرته على الإجابة عن كل سؤال، بل بقدرته على إدراك حدود معرفته. ففي بعض الحالات، يكون الأنسب الإشارة إلى وجود غموض، أو إحالة الأمر إلى مراجعة بشرية، أو ببساطة الإقرار بأن المعلومات المتاحة لا تسمح بحسم النتيجة، بدلًا من تقديم إجابة تبدو واثقة لكنها قد لا تكون دقيقة.

لكن النماذج اللغوية صُممت أساسًا لإنتاج إجابات، لا للاعتراف بأنها لا تملك ما يكفي من المعلومات. ولهذا لا يكفي الاعتماد على النموذج وحده، بل يحتاج الأمر إلى ضوابط واضحة وآليات مراجعة وإشراف بشري يضمن أن تكون الموثوقية والدقة أولوية لا تقل أهمية عن سرعة إنتاج الإجابات.

لماذا تحتاج العربية إلى حلول صُممت لها؟

أظهرت نتائج معيار ALPS أن بعض النماذج المصممة خصيصًا للتعامل مع العربية تفوقت على نماذج عالمية أكثر تقدمًا في مهام مثل فهم الافتراضات الضمنية وتحليل السياق، وهي مجالات تلعب فيها البنية اللغوية العربية دورًا حاسمًا.

وتكشف هذه النتيجة حقيقة مهمة، وهي أن بناء ذكاء اصطناعي موثوق بالعربية لا يتحقق بمجرد استخدام نماذج أكبر أو أكثر تطورًا. فالأمر يتطلب قرارات مدروسة تبدأ من البيانات نفسها. بيانات تدريب تعكس الاستخدام الحقيقي للعربية، لا نصوصًا مترجمة عن الإنجليزية. وأنظمة قادرة على قراءة الوثائق العربية ومعالجتها بدقة. كما يستفيد من نماذج متخصصة صُممت لقطاعات محددة مثل القانون أو الرعاية الصحية أو الخدمات المالية، إلى جانب ضوابط تحد من ميل النماذج إلى تقديم إجابات تتجاوز حدود معرفتها الفعلية.

والمؤسسات التي تحقق أفضل النتائج اليوم ليست بالضرورة تلك التي تستخدم أكبر النماذج، بل تلك التي تبني أنظمة مناسبة مصممة بوضوح للمهام التي تريد إنجازها. وغالبًا ما يقوم هذا النهج على أربعة عناصر رئيسية:

  • أدوات قادرة على قراءة الوثائق العربية وتحويلها إلى بيانات يمكن للنموذج فهمها والتعامل معها بدقة.
  • بيانات تدريب مستمدة من الاستخدام الحقيقي للعربية في مختلف القطاعات والبلدان.
  • حلول وتطبيقات متخصصة لمعالجة مهام واضحة ومحددة، بدلًا من محاولة القيام بكل شيء.
  • وضع ضوابط وآليات مراجعة تقلل من الأخطاء والهلوسة، وتحد من الثقة الزائدة التي قد تبديها النماذج.

وغالبًا ما يؤدي هذا النهج إلى نتائج أكثر دقة، مع تقليل التكلفة التشغيلية والمخاطر المرتبطة باستخدام الذكاء الاصطناعي.

ما الذي يصنع الثقة؟

تستثمر السعودية اليوم في الذكاء الاصطناعي على نطاق يعد من بين الأكثر طموحًا في العالم، سواء على مستوى البنية التحتية أو تطوير الكفاءات أو الأطر التنظيمية أو تبني التقنيات الجديدة. لكن التحدي التالي لا يتعلق ببناء هذه الأنظمة فحسب، بل بضمان إمكانية الوثوق بها عند استخدامها بالعربية وعلى نطاق واسع داخل المؤسسات الحكومية والخاصة.

ويمكن التغلب على كثير من هذه التحديات من خلال بناء أنظمة تجمع بين معالجة متقدمة للبيانات العربية، وأطر حوكمة متخصصة، وإدارة أكثر انضباطًا للبيانات، إلى جانب اختيار نماذج لغوية محلية وعالمية مناسبة لكل استخدام. والأهم من ذلك أن هذا النهج يساعد المؤسسات على الاحتفاظ بقدر أكبر من السيطرة على النتائج، ويضع الأسس اللازمة للاعتماد على الذكاء الاصطناعي على المدى الطويل

لقد نجح الذكاء الاصطناعي التوليدي إلى حد كبير في حل مشكلة إنتاج نصوص عربية سليمة وطبيعية.

أما ما لم يُحل بعد، فهو الأهم: الثقة.

ففي البيئات التي لا تحتمل الخطأ، لن تكون الميزة التنافسية في إنتاج المزيد من الكلمات، بل في القدرة على معرفة متى يمكن الوثوق بها.

 

شكرا

يرجى التحقق من بريدك الالكتروني لتأكيد اشتراكك.