نماذج اللغة الكبيرة

كيف لآلةٍ لا تعرف معنى كلمة «حُبّ» أن تكتب فيه قصيدةً تُدمع العين؟ وكيف لبرنامجٍ لم يَخبُر العالم يوماً أن يشرح لك قوانين الفيزياء، ويترجم بين لغاتٍ لم يُدرَّس قواعدها، ويكتب شيفرةً برمجية تعمل من أول محاولة؟ المفارقة المربكة أنّ هذه النماذج لا «تفهم» شيئاً بالمعنى الذي نفهم به نحن، وإنما تُتقن لعبةً واحدةً بسيطةً إلى حدّ السذاجة: التنبّؤ بالكلمة التالية. ومع ذلك، من ركام هذا التنبّؤ المتكرر مليارات المرات، انبثق سلوكٌ بدا للعلماء أنفسهم أقرب إلى المعجزة منه إلى الهندسة. فكيف تحوّلت آلةٌ لا تجيد سوى تخمين ما يأتي بعد، إلى كائنٍ لغويٍّ يُحاورنا ويُجادلنا ويكاد يُقنعنا أنه يعي؟

لفهم هذا اللغز ينبغي أن نعود إلى الفكرة المؤسِّسة، وهي أقدم وأبسط مما يُظنّ. ففي عام 1948 طرح كلود شانون في ورقته المؤسِّسة لنظرية المعلومات تصوّراً بأنّ اللغة ذاتها يمكن نمذجتها احتمالياً، وأنّ كلّ حرفٍ أو كلمةٍ تحمل قدراً من «المفاجأة» يمكن قياسه. كانت تلك البذرة الأولى: أنّ النصّ ليس فوضى، بل نظامٌ إحصائيٌّ تحكمه احتمالاتٌ خفية. غير أنّ تحويل هذه الفكرة إلى آلةٍ تكتب وتفهم ظلّ عصيّاً عقوداً، حتى جاءت لحظة الانعطاف الكبرى عام 2017 بورقةٍ صدرت عن باحثين في جوجل حملت عنواناً يكاد يكون شعاراً: «الانتباه هو كلّ ما تحتاجه». لقد قدّمت هذه الورقة معمارية «المحوّلات» التي هجرت المعالجة المتسلسلة للكلمات واحدةً تلو الأخرى، لصالح آليةٍ تتيح للنموذج أن «ينتبه» إلى كلّ كلمةٍ في الجملة دفعةً واحدة، فيزن علاقتها بسائر الكلمات مهما بَعُدت. وهنا يكمن السرّ العميق: ليست العبرة بالكلمة في ذاتها، بل بشبكة العلاقات التي تنسجها مع جاراتها، فالكلمة الواحدة تتلوّن بمعناها من السياق الذي تَرِد فيه، تماماً كما تتبدّل دلالة كلمة «عين» بين الجاسوس والنبع والعضو الباصر.

ولكي تتعلّم الآلة هذه العلاقات، يُمرَّر عليها قدرٌ من النصوص يفوق كلّ تصوّر؛ مليارات الصفحات من الكتب والمقالات والمحادثات، تُفكَّك إلى وحداتٍ صغيرة تُسمّى «الرموز»، ويُطلب من النموذج مراتٍ لا تُحصى أن يُخمّن الرمز المحجوب التالي. وفي كلّ مرةٍ يُخطئ، تُعدَّل ملاييرُ من «الأوزان» الداخلية تعديلاً طفيفاً، حتى يصير تخمينه أدقّ فأدقّ. والمدهش أنّ كلّ كلمةٍ في هذا الفضاء تتحوّل إلى متجهٍ رقميٍّ في فضاءٍ متعدد الأبعاد، بحيث تتجاور الكلمات المتقاربة في المعنى وتتباعد المتنافرة؛ وقد كشفت أبحاث مبكّرة في هذا المجال أنّ العلاقات الدلالية تنطبع في صورةٍ هندسية مذهلة، حتى إنّ طرح متجه «رجل» من «ملك» وإضافة «امرأة» يقودك إلى موضع «ملكة» في ذلك الفضاء. لقد تعلّمت الآلة المعنى لا من تعريفٍ أُملي عليها، بل من المعاشرة الإحصائية للكلمات، مصداقاً لما قاله اللغوي البريطاني فيرث قبل سبعين عاماً: «تُعرَف الكلمة بصحبتها».

وهنا تبرز الظاهرة التي حيّرت العلماء حقاً، وهي ما يُسمّى «القدرات المنبثقة». فحين تتجاوز هذه النماذج حجماً معيناً من المعطيات، تطفو على السطح قدراتٌ لم يُبرمجها أحدٌ ولم تكن متوقّعة، كحلّ المسائل المنطقية أو الترجمة بين لغاتٍ نادرة. وقد وثّق باحثون من جوجل وستانفورد في دراسةٍ بارزة عام 2022 هذه الظاهرة، إذ بيّنوا أنّ بعض المهارات تظلّ غائبةً تماماً حتى يبلغ النموذج عتبةً حرجة من الحجم، ثم تظهر فجأةً كانبثاق الماء من الينبوع. غير أنّ الكاتب يرى أنّ هذا «الانبثاق» قد يكون أقلّ سحريةً مما يُروّج له؛ فالأرجح أنّنا لا نشهد ميلاد فهمٍ جديد، بل تجاوُزَ عتبةٍ إحصائية كانت القدرة كامنةً تحتها لكنها أضعف من أن تُرصد بمقاييسنا الخشنة. وهذا التمييز ليس ترفاً فلسفياً، بل هو جوهر الخلاف بين من يرى في هذه النماذج فجر وعيٍ آلي، ومن يراها مرايا إحصائيةً بالغة الصقل تعكس أنماط لغتنا دون أن تعيها.

شاطئ الجبيل ولا يكتمل تشريح هذه النماذج دون الوقوف عند مرحلةٍ ثانيةٍ غالباً ما تُغفَل في الحديث الشائع، وهي مرحلة «المواءمة». فالنموذج بعد تدريبه الأوّلي على ركام النصوص يكون أشبه بعقلٍ موسوعيٍّ فوضوي، يعرف كلّ شيءٍ ولا يُحسن قول أيّ شيء؛ يردّ على السؤال بسؤال، أو يستطرد في ما لم يُطلب منه. وهنا يتدخّل الإنسان مرةً أخرى عبر ما يُعرف بـ«التعلّم المعزّز من التغذية الراجعة البشرية»، إذ يُقيّم مدرّبون بشريون إجاباته ويُرتّبونها من الأفضل إلى الأسوأ، فتتعلّم الآلة تدريجياً كيف تكون نافعةً ومهذّبةً وأقلّ ضرراً. والمفارقة العميقة هنا أنّ ما نظنّه «ذكاءً» في النموذج هو في جزءٍ منه انعكاسٌ لأحكامٍ بشريةٍ نُقشت فيه نقشاً، حتى إنّ تحيّزات المُقيّمين وقيمهم الثقافية تتسرّب إلى سلوك الآلة من حيث لا يُحتسب؛ ومن هنا يرى الكاتب أنّ سؤال «من يُدرّب الآلة؟» لا يقلّ خطورةً عن سؤال «بأيّ بياناتٍ تُدرَّب؟»، إذ تنتقل عبر هذه المواءمة منظومةُ قيمٍ بأكملها، فيغدو النموذج ناطقاً بلسانٍ ليس محايداً كما يُوهمنا ظاهره.

شاطئ الجبيل ولعلّ أخطر مغالطةٍ يقع فيها المبهورون بهذه النماذج هي الخلط بين الطلاقة والفهم. فالنموذج اللغوي قد يكتب فقرةً محكمةً عن نظريةٍ علمية وهو لا يملك عنها تصوّراً، تماماً كببغاءٍ بليغٍ يردّد ما سمعه بإتقانٍ مذهل دون أن يدري معناه. وقد صاغت الباحثة إميلي بندر وزملاؤها هذا النقد في ورقةٍ مؤثّرة عام 2021 وصفت فيها هذه النماذج بأنها «ببغاوات عشوائية» تُعيد تركيب اللغة إحصائياً دون قصدٍ أو فهم. ومن هنا تنبع ظاهرة «الهلوسة»، حين يختلق النموذج معلوماتٍ ومراجع غير موجودة بثقةٍ تامة؛ والسبب أنه لا يميّز أصلاً بين الصدق والكذب، فهو لا يبحث عن الحقيقة بل عن الكلمة الأرجح إحصائياً. يرى الكاتب أنّ هذه ليست عيباً عَرَضياً يمكن ترقيعه، بل هي سمةٌ بنيوية ملازمة لطبيعة هذه الآلات؛ فمن صُمِّم ليُخمّن المُحتمَل لا ليتحقّق من الواقع، سيظلّ عُرضةً للخطأ مهما تعاظم حجمه، وهذا ما يُلزمنا بأن نتعامل معه بوصفه مساعداً يقظاً لا مرجعاً معصوماً.

غير أنّ هذه التحفّظات لا تنفي حقيقة التحوّل الجذري الذي أحدثته هذه النماذج في الاقتصاد والعمل. فقد بيّنت تجربةٌ ميدانية أجرتها جامعة هارفارد بالتعاون مع مجموعة بوسطن الاستشارية على مئات المستشارين المحترفين أنّ من استعانوا بنموذجٍ لغويٍّ أنجزوا مهامهم أسرع وبجودةٍ أعلى، لكنّ المفارقة أنّ المهامّ التي تقع خارج «حدود قدرة» النموذج كانت أداء مستخدميه فيها أسوأ ممن لم يستعينوا به أصلاً، مما يكشف أنّ الخطر الأكبر ليس في عجز الآلة، بل في ثقتنا العمياء بها حين تتجاوز حدودها. ووفق ما رصده مؤشر ستانفورد للذكاء الاصطناعي لعام 2025، فإنّ تبنّي هذه التقنية في المؤسسات قفز قفزةً واسعة، فيما تواصل كلفة تشغيل النماذج انخفاضها المتسارع حتى صارت في متناول الفرد بهاتفه. وتشير تقديرات المنتدى الاقتصادي العالمي في تقاريره عن مستقبل الوظائف إلى أنّ موجةً من الأدوار ستتبدّل لا أن تختفي فحسب، إذ تتوارى المهامّ الروتينية لصالح مهاراتٍ تحليليةٍ وإبداعيةٍ وإشرافية، وهو تحوّلٌ يفرض على المجتمعات إعادة تأهيلٍ واسعةً للقوى العاملة.

وللعرب في هذا السباق رهانٌ مزدوج لا يحتمل التأجيل. فاللغة العربية، على غناها وعمق تراثها، ما تزال ضعيفة التمثيل في البيانات التي تتغذّى عليها هذه النماذج مقارنةً بالإنجليزية، مما يجعل أداءها في فهم سياقاتنا وثقافتنا أدنى مما تستحقّ لغةٌ يتحدّث بها مئات الملايين. ومن هنا تتّضح حكمة ما ذهبت إليه رؤية السعودية 2030 من جعل الذكاء الاصطناعي والاقتصاد الرقمي ركيزةً للتحوّل، بل من السعي إلى بناء نماذج لغويةٍ عربيةٍ أصيلة تَعقِل ضادنا وتستوعب موروثنا؛ إذ إنّ من لا يُغذّي الآلة بلغته وقيمه يُسلّمها مرآةً تعكس غيره ولا تعكسه، ويظلّ مستهلكاً لتقنيةٍ تُفكّر بمنطق سواه. يرى الكاتب أنّ السيادة الحقيقية في هذا العصر لن تُقاس بمن يمتلك أكبر النماذج، بل بمن يصوغ منها ما يحرس هويته ويخدم خصوصيته الثقافية.

ولعلّ من أعمق المفارقات التي تكشفها هذه النماذج أنّ نجاحها قام على مبدأٍ يكاد يكون مهيناً للحدس البشري؛ فقد كان العلماء يظنّون لعقودٍ أنّ بناء آلةٍ تفهم اللغة يتطلّب تلقينها قواعد النحو والصرف والمنطق صراحةً، طبقةً فوق طبقة. لكنّ ما حدث كان نقيض ذلك تماماً: لم يُلقَّن النموذج قاعدةً نحويةً واحدة، وإنما تركناه يستنبط بنية اللغة من تكرارها، فإذا به يُتقن من قواعد العربية والإنجليزية ما يعجز عن صياغته صراحةً أعتى النحاة. وهذا ما يسمّيه بعض الباحثين «المرارة العظمى» في تاريخ هذا الحقل، وهو الدرس القاسي بأنّ الطرائق العامة التي تستثمر القدرة الحسابية الضخمة تتفوّق دائماً على الطرائق التي نحقن فيها معرفتنا البشرية المُسبقة. يرى الكاتب أنّ في هذا الدرس تواضعاً معرفياً عميقاً ينبغي أن نتمثّله؛ فالآلة لم تَعِنا، بل عَلَّمتنا أنّ كثيراً مما نحسبه قواعد صارمة للّغة ليس إلا أنماطاً إحصائيةً تختبئ خلف ستارٍ من الاصطلاح، وأنّ الفهم البشري نفسه قد يكون أقلّ قاعديةً وأكثر إحصائيةً مما تُمليه علينا كبرياؤنا.

وإذا أردنا أن نخلص إلى ركائز عملية، فإنّ التعامل الرشيد مع هذه النماذج يقوم على ثلاث: أولاها إتقان فنّ السؤال، إذ إنّ جودة المُخرَج رهينةٌ بدقة المُدخَل، فمن يُحسن صياغة طلبه يحصد جواهر، ومن يُهملها يُغرَق بالركاكة. وثانيتها التحقّق الدائم، فلا يُؤخَذ ما يقوله النموذج مأخذ المُسلَّمات، بل يُعرَض على ميزان المراجعة لا سيما في الأرقام والأسماء والوقائع. وثالثتها فهم الحدود، أي إدراك متى يكون النموذج في ميدان قوّته ومتى يتهاوى خارجه، فالعارف بحدود أداته أقدر على الإفادة منها. وهذه الركائز الثلاث تنقل الإنسان من موقع المنبهر السلبي إلى موقع الشريك الناقد الذي يُسخّر الآلة ولا تُسخّره.

وفي الأفق تلوح أسئلةٌ أعمق من السؤال التقني. فحين تصير الآلة قادرةً على إنتاج لغةٍ لا تكاد تتميّز عن لغة الإنسان، يتزعزع شيءٌ في فهمنا لذواتنا؛ إذ طالما حسبنا اللغة حصننا الأخير الذي يميّزنا عن سائر الكائنات، فإذا بآلةٍ تقتحمه بلا وعيٍ ولا قصد. لكنّ الكاتب يرى أنّ في هذا الاقتحام تحريراً لا تهديداً؛ فهو يدعونا إلى أن نُعيد تعريف ما يجعلنا بشراً، بحثاً عن جوهرٍ أعمق من مجرّد القدرة على رصف الكلمات، جوهرٍ قوامه القصد والمعنى والمسؤولية الأخلاقية التي لا تملكها آلةٌ مهما بلغت طلاقتها. فالنماذج اللغوية الكبرى ليست نهاية رحلة الذكاء، بل محطةٌ مبهرةٌ في طريقٍ ما زلنا في أوّله؛ وهي حين تُتقن كلماتنا تُعيد إلينا السؤال الذي بدأنا به أنفسنا منذ فجر الفلسفة: ما الذي يعنيه حقاً أن نفهم؟ ولعلّ التحدّي الأعظم ليس في أن نبني آلةً تتكلّم كما نتكلّم، بل في أن نظلّ نحن أصحاب الكلمة الأخيرة في ما نريد أن نقوله، ولماذا نقوله، ولِمَن.