ما الجديد في النموذج الأحدث من ديب سيك: ديب سيك-ف3.2-إكسب؟
ملخص:
أطلقت شركة "ديب سيك" الصينية نموذجها التجريبي الجديد DeepSeek-V3.2-Exp، الذي يعد بتحسين كفاءة أنظمة الذكاء الاصطناعي وتقليل التكاليف. ومع ذلك، تظل هناك تساؤلات حول فعالية وأمان هذا النموذج.
نموذج ديب سيك التجريبي الجديد
أعلنت شركة "ديب سيك" الصينية الناشئة عن إطلاق نموذجها التجريبي الجديد DeepSeek-V3.2-Exp، الذي يعد بزيادة كفاءة أنظمة الذكاء الاصطناعي وتحسين قدرتها على معالجة كميات كبيرة من المعلومات بتكاليف منخفضة. ومع ذلك، لا تزال هناك تساؤلات حول مدى فعالية وأمان هذا النموذج.
أثارت "ديب سيك" ضجة في وادي السيليكون عندما أطلقت نموذجها الأول R1 العام الماضي، مما أظهر إمكانية تدريب نماذج اللغة الكبيرة بسرعة على شرائح أقل قوة باستخدام موارد أقل.
التحسينات الجديدة
أصدرت الشركة نموذج DeepSeek-V3.2-Exp يوم الاثنين، وهو نسخة تجريبية من نموذجها الحالي DeepSeek-V3.1-Terminus، حيث يهدف إلى تعزيز كفاءة أنظمة الذكاء الاصطناعي.
قالت أدينا يكيفو، رئيسة المجتمع الصيني في "هاغينغ فيس": "يواصل DeepSeek V3.2 التركيز على الكفاءة وتقليل التكاليف ومشاركة المصادر المفتوحة". وأضافت أن "التحسين الكبير هو ميزة جديدة تسمى DSA (الاهتمام المتناثر)، التي تجعل الذكاء الاصطناعي أفضل في التعامل مع الوثائق الطويلة والمحادثات، كما تقلل تكلفة تشغيل الذكاء الاصطناعي إلى النصف مقارنة بالإصدار السابق".
فوائد وعيوب الاهتمام المتناثر
يعمل نموذج الذكاء الاصطناعي على اتخاذ قرارات استنادًا إلى بيانات التدريب والمعلومات الجديدة. على سبيل المثال، إذا أرادت شركة طيران العثور على أفضل مسار من A إلى B، فإن تصفية الخيارات الأقل جدوى يمكن أن تقلل بشكل كبير من الوقت والوقود والتكاليف.
• الاهتمام المتناثر يساعد في تعزيز الكفاءة وقدرة الذكاء الاصطناعي على التوسع باستخدام موارد أقل.
ومع ذلك، هناك مخاوف من أن يؤدي ذلك إلى انخفاض موثوقية النماذج بسبب نقص الإشراف على كيفية ولماذا يتم استبعاد المعلومات.
قالت إيكاترينا ألمسكي، الشريكة المؤسسة في صندوق رأس المال الاستثماري BlankPage: "الواقع هو أنهم فقدوا الكثير من التفاصيل الدقيقة".
التحديات المستقبلية
أشارت "ديب سيك" إلى أن النموذج التجريبي يعمل على قدم المساواة مع V3.1-Terminus. رغم الشائعات حول تشكيل فقاعة في سوق الذكاء الاصطناعي، لا يزال هذا المجال في صميم المنافسة الجيوسياسية بين الولايات المتحدة والصين.
أضافت يكيفو أن نماذج "ديب سيك" تعمل "من دون أي إعداد إضافي" على شرائح الذكاء الاصطناعي المصنوعة في الصين، مثل Ascend وCambricon.
قالت ألمسكي إن الطبيعة المفتوحة لهذا النموذج تعني أن التكنولوجيا قد لا تكون قابلة للدفاع عنها، مشيرة إلى أن الصناعة تتحدث عن النماذج المتناثرة منذ عام 2015.
ختامًا
تعترف الشركة بأن V3.2-Exp هو "خطوة وسيطة نحو بنية الجيل التالي". كما أشار باتينس، "إن القيمة الأساسية لـ ديب سيك تتمثل في أن الكفاءة أصبحت بنفس أهمية القوة الخام".
قالت يكيفو: "تلعب ديب سيك لعبة طويلة للحفاظ على استثمار المجتمع في تقدمهم".