
مرحبًا بكم في النشرة الإخبارية الدائمة لـ TechCrunch حول الذكاء الاصطناعي! نحن سنتوقف لفترة مؤقتة، ولكن يمكنك العثور على تغطيتنا الكاملة حول الذكاء الاصطناعي، بما في ذلك مقالاتي، تحليلاتنا اليومية، وقصص الأخبار العاجلة، على TechCrunch. إذا كنت ترغب في هذه القصص وأكثر في بريدك الإلكتروني كل يوم، فقم بالاشتراك في النشرات اليومية الخاصة بنا .
\nهذا الأسبوع، أصدرت شركة xAI لملياردير إيلون ماسك طرازها الرئيسي الجديد للذكاء الاصطناعي، Grok 3، الذي يشغل تطبيقات الشات بوت Grok للشركة. تدرب هذا الطراز على حوالي 200,000 وحدة معالجة الرسومات، ويتفوق على عدد من الطرز الرائدة الأخرى، بما في ذلك من OpenAI، في معايير الرياضيات، والبرمجة، وأكثر من ذلك.
\nلكن ماذا تخبرنا هذه المعايير حقًا؟
\nهنا في TC، نقوم في كثير من الأحيان بالكره عند الإبلاغ عن الأرقام المعيارية لأنها واحدة من الطرق (نسبيًا) الموحدة التي تقيس بها صناعة الذكاء الاصطناعي تحسن الطراز. تميل المعايير المعروفة للذكاء الاصطناعي إلى اختبار المعرفة البعيدة، ويتمنح تقييمات مجمعة ترتبط بسوء بالمهارات في المهام التي يهتم بها معظم الناس.
\nكما أشار البروفيسور إيثان موليك من وارتون في سلسلة من المنشورات على X بعد كشف Grok 3 يوم الاثنين، هناك "حاجة عاجلة إلى بطاريات اختبارية أفضل وسلطات اختبارية مستقلة." تقوم شركات الذكاء الاصطناعي بالإبلاغ عن نتائج المعايير بشكل ذاتي في أغلب الأحيان، كما ألمح موليك، مما يجعل تلك النتائج أصعب قبولها على الفور.
\nكتب موليك: "المعايير العامة هي 'مل' ومشبعة، مما يترك الكثير من اختبار الذكاء الاصطناعي يشبه مراجعات الطعام، استنادًا إلى الذوق." موليك كتب: "إذا كان الذكاء الاصطناعي ضروريًا للعمل، فإننا بحاجة إلى المزيد."
\nلا يوجد نقص في الاختبارات المستقلة والمنظمات التي تقترح معايير جديدة للذكاء الاصطناعي، ولكن قيمتها النسبية بعيدة عن حلولت في الصناعة. يقترح بعض المعلقين والخبراء في مجال الذكاء الاصطناعي مطابقة المعايير مع الأثر الاقتصادي لضمان فعاليتها، بينما يجادل آخرون بأن اعتماد وفائدة المعايير أمران أساسيان.
\nقد تستمر هذه الجدل حتى نهاية الزمان. ربما يجب علينا بدلاً من ذلك، كما يوصي المستخدم Roon، ببساطة إيلاء أقل اهتمام للنماذج والمعايير الجديدة ما لم يحدث اختراق تقني رئيسي في مجال الذكاء الاصطناعي. لصحتنا الجماعية، قد لا تكون هذه أسوأ فكرة، حتى وإن كانت تثير بعض مستوى القلق بشأن الذكاء الاصطناعي.
\nكما ذكر أعلاه، ستتوقف هذه النشرة الأسبوعية في الذكاء الاصطناعي. شكرًا لكم، أيها القراء، على الثبات معنا خلال هذه الرحلة المليئة بالأحداث. إلى اللقاء في المرة القادمة.
\nالأخبار
\n
تحاول OpenAI "إزالة الرقابة" عن ChatGPT: كتب ماكس عن كيف تقوم OpenAI بتغيير نهج تطوير الذكاء الاصطناعي لاعتناق "الحرية الفكرية" بشكل صريح، بغض النظر عن مدى تحديها أو جدلها.
\nشركة Mira الناشئة الجديدة: تعتزم الشركة الناشئة Thinking Machines Lab التي كان موجودًا لها سابقًا كمدير تكنولوجيا في OpenAI، بناء أدوات لـ "جعل الذكاء الاصطناعي يعمل لتلبية احتياجات وأهداف [الناس] الفريدة".
\nGrok 3 يأتي: أصدرت شركة xAI للملياردير إيلون ماسك، طرازها الرئيسي الجديد للذكاء الاصطناعي، Grok 3، وكشفت عن قدرات جديدة لتطبيقات Grok لنظام iOS والويب.
\nمؤتمر لاما للألبكة: ستستضيف شركة Meta أول مؤتمر للمطورين مكرس للذكاء الاصطناعي الذي يولد الصورة هذا الربيع. يطلق عليه اسم LlamaCon بعد عائلة Llama من شركة Meta لنماذج الذكاء الاصطناعي الذي يولد صورة، ومقرر عقده في 29 أبريل.
\nالذكاء الاصطناعي وسيادة أوروبا الرقمية: كتب بول عن OpenEuroLLM، وهي تعاون بين حوالي 20 منظمة لبناء "سلسلة من نماذج الأساس للذكاء الاصطناعي الشفاف في أوروبا" التي تحافظ على "التنوع اللغوي والثقافي" لجميع لغات الاتحاد الأوروبي.
\nورقة بحث الأسبوع
\n
قام باحثو OpenAI بإنشاء معيار جديد للذكاء الاصطناعي، SWE-Lancer، الذي يهدف إلى تقييم قدرات البرمجة لأنظمة الذكاء الاصطناعي القوية. يتكون المعيار من أكثر من 1,400 مهمة هندسة برمجيات حرة تتراوح بين إصلاح الأخطاء ونشر الميزات إلى اقتراحات التنفيذ الفني على مستوى الإدارة.
\nوفقًا لـ OpenAI، الطراز الأفضل أداءً، Claude 3.5 Sonnet من Anthropic، يحصل على نتيجة 40.3% في معيار SWE-Lancer الكامل - مما يوحي بأن الذكاء الاصطناعي لديه طريق طويل للذهاب. يجدر بالذكر أن الباحثين لم يقيسوا النماذج الأحدث مثل o3-mini من OpenAI أو R1 من شركة DeepSeek الصينية.
\nنموذج الأسبوع
\nأصدرت شركة AI صينية تدعى Stepfun نموذجًا "مفتوحًا" للذكاء الاصطناعي، Step-Audio، الذي يمكن فهم وتوليد الكلام بعدة لغات. يدعم Step-Audio الصينية والإنجليزية واليابانية ويتيح للمستخدمين ضبط العاطفة وحتى اللهجة للصوت الاصطناعي الذي ينشئه، بما في ذلك الغناء.
\nStepfun هي واحدة من عدة شركات صينية ناشئة في مجال الذكاء الاصطناعي تصدر نماذج بترخيص ذو كرمية. تأسست Stepfun في عام 2023، وذكرت التقارير أخيرًا أنها أغلقت جولة تمويل بقيمة عدة ملايين من الدولارات من مجموعة من المستثمرين بما في ذلك شركات الأوراق المالية الخاصة التابعة للدولة الصينية.
\nحقيبة القبضة
\n
أطلقت مجموعة البحث في الذكاء الاصطناعي، Nous Research، ما يدعي أنه واحد من أول نماذج الذكاء الاصطناعي الذي يوحد التفكير وقدرات نموذج اللغة "الحدسية".
\nيمكن للطراز، DeepHermes-3 Preview، تبديل سلاسل "فكر طويلة" لتحسين الدقة على حساب بعض الثقل الحسابي. في وضع "التفكير"، يفكر DeepHermes-3 Preview، مثل نماذج الذكاء الاصطناعي الأخرى، لفترة أطول في حالات الصعوبة ويعرض عملية التفكير الخاصة به للوصول إلى الإجابة.
\nيخطط يذكر أن يصدر طرازًا مماثلاً معماريًا قريبًا، وقد قالت OpenAI إن مثل هذا الطراز هو في خريطتها القريبة المدى.
\n