جوجل تطلق مساعد “Project Astra” في أحدث تقدم للذكاء الاصطناعي
افتح ملخص المحرر مجانًا
رولا خلف، محررة الفايننشال تايمز، تختار قصصها المفضلة في هذه النشرة الأسبوعية.
كشفت شركة Alphabet المالكة لشركة Google عن وكيل ذكاء اصطناعي يمكنه الإجابة على الاستفسارات في الوقت الفعلي عبر الفيديو والصوت والنص، كجزء من عدد من المبادرات المصممة لعرض براعتها في الذكاء الاصطناعي وقمع الانتقادات بأنها تخلفت عن المنافسين.
استعرض الرئيس التنفيذي ساندر بيتشاي مساعد الذكاء الاصطناعي الجديد “متعدد الوسائط” لعملاق وادي السيليكون والذي يسمى Project Astra، والمدعوم بنسخة مطورة من نموذج Gemini الخاص به، خلال مؤتمر سنوي للمطورين يوم الثلاثاء.
كانت Astra جزءًا من سلسلة من الإعلانات لعرض رؤية جديدة تتمحور حول الذكاء الاصطناعي لشركة Google. ويأتي ذلك بعد إطلاق المنتجات ونماذج الذكاء الاصطناعي المحدثة من منافسي شركات التكنولوجيا الكبرى بما في ذلك Meta وMicrosoft وشريكتها OpenAI.
وفي عرض توضيحي بالفيديو، استجاب النموذج الأولي لمساعد الذكاء الاصطناعي من جوجل للأوامر الصوتية بناءً على تحليل ما يراه من خلال كاميرا الهاتف أو عند استخدام زوج من النظارات الذكية.
لقد نجحت في تحديد تسلسل التعليمات البرمجية، واقترحت تحسينات على مخططات الدوائر الكهربائية، وتعرفت على حي كينغز كروس في لندن من خلال عدسة الكاميرا، وذكّرت المستخدم بالمكان الذي تركوا فيه نظاراتهم.
وقال بيتشاي إن جوجل تخطط لبدء إضافة إمكانيات Astra إلى تطبيق Gemini الخاص بها وعبر منتجاتها هذا العام. ومع ذلك، فقد حذر من أنه على الرغم من أن “الهدف النهائي هو جعل Astra متاحًا بسلاسة” عبر برمجيات الشركة، إلا أنه سيتم طرحه بحذر و”سيكون المسار إلى الإنتاج مدفوعًا بالجودة”.
وفي المؤتمر، حددت جوجل أيضًا تغييرات كبيرة في محرك البحث الأساسي الخاص بها. اعتبارًا من هذا الأسبوع، سيرى جميع المستخدمين في الولايات المتحدة “نظرة عامة على الذكاء الاصطناعي” – وهي إجابة مختصرة تم إنشاؤها بواسطة الذكاء الاصطناعي على الاستعلام – في الجزء العلوي من العديد من نتائج البحث الشائعة، تليها روابط قابلة للنقر تتخللها إعلانات في الأسفل.
وأضافت الشركة أن نظام البحث سيكون قادرًا على الإجابة على الأسئلة المعقدة من خلال التفكير متعدد الخطوات – مما يعني أن وكيل الذكاء الاصطناعي يمكنه اتخاذ عدة قرارات مستقلة من أجل إكمال المهمة – ومساعدة العملاء على إنشاء استعلامات بحث باستخدام الصوت والفيديو.
قال السير ديميس هاسابيس، رئيس ذراع أبحاث الذكاء الاصطناعي ديب مايند DeepMind: “إن تقليل وقت الاستجابة لشيء ما يمثل تحديًا هندسيًا صعبًا”. “إنه لأمر مدهش أن نرى المدى الذي وصل إليه الذكاء الاصطناعي، خاصة عندما يتعلق الأمر بالفهم المكاني ومعالجة الفيديو والذاكرة.”
وقالت ليز ريد، رئيسة قسم بحث جوجل، إن الهدف هو “إزالة بعض الإجراءات القانونية في البحث” وسيتم توسيع نظرة عامة على الذكاء الاصطناعي لتشمل المستخدمين في أجزاء أخرى من العالم في وقت لاحق من هذا العام.
تأتي التغييرات في الوقت الذي يهدد فيه OpenAI أعمال البحث في Google.
يوفر برنامج الدردشة ChatGPT الخاص بالشركة الناشئة في سان فرانسيسكو إجابات سريعة وكاملة للعديد من الأسئلة، مما يهدد بجعل نتائج البحث قديمة والتي توفر قائمة تقليدية من الروابط إلى جانب الإعلانات. وقعت OpenAI أيضًا صفقات مع مؤسسات إعلامية لتضمين معلومات محدثة لتحسين استجاباتها.
في يوم الاثنين – في خطوة يُنظر إليها على أنها محاولة لتجاوز إعلانات جوجل – عرضت OpenAI نسخة أسرع وأرخص من النموذج الذي يشغل ChatGPT، والذي يمكنه تفسير الصوت والفيديو والصور والرموز بالمثل في واجهة واحدة.
وكشفت جوجل أيضًا عن منتجات الذكاء الاصطناعي الجديدة أو المحسنة بما في ذلك Veo، الذي يقوم بإنشاء فيديو من المطالبات النصية؛ Imagen 3، الذي ينشئ الصور؛ وLyria، نموذج لتوليد موسيقى الذكاء الاصطناعي. سيتمكن المشتركون في Gemini Advanced من إنشاء روبوتات محادثة مخصصة تسمى “Gems” للمساعدة في مهام محددة.
كما تمت ترقية طراز Gemini 1.5 Pro الرائد للشركة. أصبح لديها الآن نافذة سياق أكبر بكثير تضم مليوني رمز مميز – في إشارة إلى كمية البيانات مثل التعليمات البرمجية أو الصور التي يمكنها الرجوع إليها عند إنشاء استجابة – مما يجعلها أفضل في اتباع التعليمات الدقيقة والرجوع إلى المحادثات السابقة.
اكتشاف المزيد من موقع تجاربنا
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.