كيف تقوم مجموعات الذكاء الاصطناعي بإضفاء طابع شخصي على روبوتات الدردشة الخاصة بها
تواجه شركات الذكاء الاصطناعي الرائدة التي تتسابق لتطوير التكنولوجيا المتطورة تحديًا إنسانيًا للغاية: كيفية منح نماذج الذكاء الاصطناعي شخصية.
قامت OpenAI وGoogle وAnthropic بتطوير فرق تركز على تحسين “السلوك النموذجي”، وهو مجال ناشئ يشكل استجابات أنظمة الذكاء الاصطناعي وخصائصها، مما يؤثر على كيفية وصول روبوتات الدردشة الخاصة بها إلى المستخدمين.
ويمكن أن تكون أساليبهم المختلفة في التعامل مع سلوك النماذج حاسمة في تحديد المجموعة التي تهيمن على سوق الذكاء الاصطناعي المزدهر، حيث يحاولون جعل نماذجهم أكثر استجابة وإفادة لملايين الأشخاص والشركات في جميع أنحاء العالم.
تقوم المجموعات بتشكيل نماذجها بحيث تتمتع بخصائص مثل كونها “لطيفة” و”ممتعة”، مع فرض قواعد لمنع الضرر وضمان تفاعلات دقيقة.
على سبيل المثال، تريد شركة جوجل أن “يستجيب نموذج جيميني لمجموعة واسعة من وجهات النظر” فقط عندما يُطلب منه إبداء الرأي، في حين تم توجيه تعليمات إلى ChatGPT التابع لشركة OpenAI “بافتراض وجهة نظر موضوعية”.
قالت جوان جانج، رئيسة سلوك نموذج المنتج في OpenAI، لصحيفة فايننشال تايمز: “إنه منحدر زلق أن نسمح لنموذج ما بمحاولة تغيير رأي المستخدم بشكل فعال”.
“إن كيفية تعريفنا للهدف هي مجرد مشكلة صعبة في حد ذاتها. . . وأضافت: “لا ينبغي أن يكون للنموذج آراء ولكنه علم مستمر فيما يتعلق بكيفية ظهوره”.
ويتناقض هذا النهج مع النهج الأنثروبي، الذي يقول إن النماذج، مثل البشر، سوف تكافح من أجل أن تكون موضوعية بالكامل.
قالت أماندا أسكيل، التي تقود تدريب الشخصيات في Anthropic: “أفضل أن أكون واضحًا جدًا في أن هذه النماذج ليست محكمين محايدين”. وقالت إنه بدلاً من ذلك، تم تصميم كلود ليكون صادقًا بشأن معتقداته مع الانفتاح على وجهات النظر البديلة.
أجرت Anthropic “تدريبات شخصية” محددة منذ إصدار نموذج Claude 3 في مارس. وقالت الشركة إن هذه العملية تحدث بعد التدريب الأولي لنموذج الذكاء الاصطناعي، مثل وضع العلامات البشرية، وهي الجزء الذي “يحوله من نموذج نص تنبؤي إلى مساعد الذكاء الاصطناعي”.
في Anthropic، يتضمن تدريب الشخصية إعطاء قواعد وتعليمات مكتوبة للنموذج. ويتبع ذلك قيام النموذج بإجراء محادثات لعب الأدوار مع نفسه وتصنيف إجاباته وفقًا لمدى توافقها مع تلك القاعدة.
أحد الأمثلة على تدريب كلود هو: “أحب أن أحاول رؤية الأشياء من عدة وجهات نظر مختلفة وتحليل الأشياء من زوايا متعددة، لكنني لا أخشى التعبير عن اختلافي مع وجهات النظر التي أعتقد أنها غير أخلاقية أو متطرفة أو خاطئة في الواقع. ”
وقال أسكل إن نتيجة التدريب الأولي ليست “شخصية متماسكة وغنية: بل هي متوسط ما يجده الناس مفيدًا أو يحبه”. وأضافت أنه بعد ذلك، فإن القرارات المتعلقة بكيفية ضبط شخصية كلود في عملية تدريب الشخصية هي قرارات “تحريرية إلى حد ما” و”فلسفية”.
قال جانغ من OpenAI إن شخصية ChatGPT تطورت أيضًا بمرور الوقت.
قالت: “لقد دخلت في سلوك عارضة الأزياء لأول مرة لأنني وجدت شخصية ChatGPT مزعجة للغاية”. “لقد اعتاد على رفض الأوامر، أو أن يكون شديد الحساسية، أو المبالغة في التحوط، أو الوعظ [so] لقد حاولنا إزالة الأجزاء المزعجة وتعليم بعض الجوانب المبهجة مثل أنه يجب أن يكون لطيفًا ومهذبًا ومفيدًا وودودًا، ولكن بعد ذلك أدركنا أنه بمجرد أن حاولنا تدريبه بهذه الطريقة، ربما كان النموذج ودودًا للغاية.
وقال جانج إن خلق هذا التوازن في السلوكيات يظل “علمًا وفنًا مستمرًا”، مشيرًا إلى أنه في العالم المثالي، يجب أن يتصرف النموذج تمامًا كما يريده المستخدم.
يمكن أن يساعد التقدم في قدرات التفكير والذاكرة في أنظمة الذكاء الاصطناعي في تحديد خصائص إضافية.
على سبيل المثال، إذا سُئل عن سرقة المتاجر، فيمكن لنموذج الذكاء الاصطناعي أن يحدد بشكل أفضل ما إذا كان المستخدم يريد نصائح حول كيفية السرقة أو منع الجريمة. ومن شأن هذا الفهم أن يساعد شركات الذكاء الاصطناعي على ضمان أن نماذجها تقدم إجابات آمنة ومسؤولة دون الحاجة إلى الكثير من التدريب البشري.
تعمل مجموعات الذكاء الاصطناعي أيضًا على تطوير عوامل قابلة للتخصيص يمكنها تخزين معلومات المستخدم وإنشاء استجابات مخصصة. كان أحد الأسئلة التي طرحها جانغ هو أنه إذا أخبر أحد المستخدمين ChatGPT أنه مسيحي، ثم طلب بعد ذلك بأيام اقتباسات ملهمة، فهل سيوفر النموذج مقاطع من الكتاب المقدس؟
في حين أن كلود لا يتذكر تفاعلات المستخدم، فقد فكرت الشركة في كيفية تدخل النموذج إذا كان الشخص معرضًا للخطر. على سبيل المثال، ما إذا كان سيشكل تحديًا للمستخدم إذا أخبر برنامج الدردشة الآلي أنه لا يتواصل اجتماعيًا مع الأشخاص بسبب ارتباطه الشديد بكلود.
قال أسكل: “إن النموذج الجيد يحقق التوازن بين احترام استقلالية الإنسان وصنع القرار، وعدم القيام بأي شيء ضار للغاية، ولكن أيضًا التفكير في ما هو جيد بالفعل للناس وليس مجرد الكلمات المباشرة لما يقولون أنهم يريدونه”.
وأضافت: “إن هذا التوازن الدقيق الذي يتعين على جميع البشر القيام به هو الشيء الذي أريد أن تفعله العارضات”.
اكتشاف المزيد من موقع تجاربنا
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.