Gemini Embedding 2 ذكاء اصطناعي يدمج النصوص والفيديوهات والصور والصوت معا

أعلنت جوجل عن إطلاق نموذج ذكاء اصطناعي جديد متخصص في تحليل البيانات متعددة الوسائط تحت اسم Gemini Embedding 2، والمتاح حاليا في مرحلة المعاينة العامة. يمثل هذا الإصدار خطوة مهمة نحو معالجة متزامنة للنصوص والصور والفيديوهات والصوتيات في منصة واحدة.

جوجل تطلق Gemini Embedding 2.. دمج شامل للنصوص والفيديو والصوت والصور بالذكاء الاصطناعي

بعكس النماذج التوليدية مثل Gemini 3، تركز نماذج التضمين على فهم المعلومات وتمثيلها رياضياً بدل إنشاء محتوى جديد. إذ يتم تحويل أنواع البيانات المختلفة إلى متجهات رقمية يمكن للآلات التعامل معها بسهولة. هذه الميزة تتيح أداء مهام متنوعة مثل البحث الدلالي، وتصنيف المحتوى، وتجميع المعلومات بشكل أكثر دقة وسياقية مقارنة بالأنظمة التقليدية التي تعتمد فقط على الكلمات المفتاحية.

في حين كان نموذج التضمين الأول من جوجل يقتصر على تحليل النصوص فقط، يقدم Gemini Embedding 2 خطوة متقدمة عبر دمج أنواع متعددة من المحتوى ضمن إطار واحد. يستطيع هذا النموذج معالجة النصوص والصور والفيديوهات والملفات الصوتية والمستندات، مع القدرة على استنباط المعنى الدلالي بدقة، ويدعم أكثر من 100 لغة حول العالم.

وفقا لجوجل، يسهّل هذا النظام التعامل مع العمليات المعقدة ويعزز أداء مجموعة واسعة من المهام متعددة الوسائط، بدءًا من توليد المحتوى المحسّن مرورًا بـ الاسترجاع والبحث الدلالي وصولًا إلى تحليل المشاعر وتجميع البيانات. بالإضافة إلى ذلك، يتيح النظام فهم العلاقات بين أنواع المحتوى المختلفة وتنفيذ الطلبات التي تجمع بين النصوص والصور في الوقت نفسه، مما يسهل إجراء تحليل شامل ومتكامل للمعلومات.

Gemini Embedding 2

من بين التطبيقات المحتملة، تشير جوجل إلى القطاع القانوني، حيث يمكن للمحترفين الاستفادة من Gemini Embedding 2 أثناء عمليات فحص الأدلة، لتحديد المعلومات الهامة بدقة وسرعة بين ملايين السجلات.
ويتوفر هذا النموذج حاليا للمعاينة العامة عبر واجهة برمجة تطبيقات Gemini و Vertex AI.

ختاما، يُعد Gemini Embedding 2 خطوة مهمة نحو مستقبل الذكاء الاصطناعي متعدد الوسائط، حيث يجمع بين النصوص والصور والفيديوهات والصوتيات في إطار واحد، مع إمكانيات تحليلية متقدمة. مع دعمه لأكثر من 100 لغة وقدرته على معالجة المعلومات بشكل متكامل، يُفتح هذا النموذج آفاقًا واسعة لتطبيقات عملية في مجالات متنوعة، من القانون والتعليم إلى الأعمال والإعلام، ليشكل أداة قوية للمستخدمين والمطورين على حد سواء.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى