चिनी कृत्रिम बुद्धिमत्ता (एआय) लॅब झेड.एआयने सोमवारी दोन नवीन ओपन-सोर्स जनरल भाषा मॉडेल (जीएलएम) सोडण्याची घोषणा केली. डब जीएलएम -4.5 आणि जीएलएम -4.5-एअर, एआय फर्म त्यांना त्याचे नवीनतम फ्लॅगशिप मॉडेल म्हणतात. हे दोघेही संकरित तर्क मॉडेल आहेत जे जटिल तर्क आणि साधन वापरासाठी विचारसरणी मोड देतात आणि त्वरित प्रतिसादांसाठी नॉन-थिंकिंग मोड. याव्यतिरिक्त, कंपनी म्हणते की ही मॉडेल्स एजंटच्या क्षमतेस समर्थन देतात. उल्लेखनीय म्हणजे, एआय फर्मचा असा दावा आहे की त्याचे नवीनतम मॉडेल जगभरातील इतर सर्व मुक्त-स्त्रोत मॉडेल्सला मागे टाकतात.
झेड.एआयने ओपन-सोर्स जीएलएम -4.5 एआय मॉडेल्सची ओळख करुन दिली
मध्ये मध्ये ब्लॉग पोस्टचिनी एआय फर्मने या मॉडेल्सच्या प्रकाशनाची घोषणा केली. जीएलएम मॉडेल्समागील कल्पना ही एक मोठी भाषा मॉडेल (एलएलएम) तयार करणे आहे जी खरोखर सामान्य आहे आणि तितकीच विविध प्रकारची कार्ये करू शकते. कंपनीचा असा युक्तिवाद आहे की जनरेटिव्ह एआयमध्ये अनेक प्रगती असूनही, Google, ओपनई आणि मानववंशशास्त्र यांच्या आवडीनिवडीतील मॉडेल्स पुरेसे सामान्य नाहीत, कारण ते इतरांमध्ये मागे पडताना काही भागात मजबूत कामगिरी दर्शवितात. “जीएलएम -4.5 सर्व भिन्न क्षमता एकत्रित करण्याच्या उद्दीष्टासाठी प्रयत्न करते,” कंपनीने सांगितले.
जीएलएम -4.5 एआय मॉडेलमध्ये 32 अब्ज सक्रिय पॅरामीटर्ससह एकूण 355 अब्ज पॅरामीटर्स आहेत. दुसरीकडे, एअर व्हेरिएंटला 106 अब्ज एकूण पॅरामीटर्स मिळतात, ज्यात 12 अब्ज पॅरामीटर्स सक्रिय आहेत. दोन्ही मॉडेल एकाच आर्किटेक्चरमध्ये तर्क, कोडिंग आणि एजंटिक क्षमता एकसंध करतात. यात 1,28,000 टोकनची संदर्भ विंडो आहे आणि ती मूळ फंक्शन कॉलिंग क्षमतेसह येते.
मॉडेल आर्किटेक्चरमध्ये येत असताना, झेड.एआयने प्रशिक्षण आणि अनुमानांची गणना कार्यक्षमता सुधारण्यासाठी मिश्रण-ऑफ-एक्सपर्ट्स (एमओई) आर्किटेक्चरची निवड केली. दीपसेक-व्ही 3 सारख्या मो लेयर्सची रुंदी (लपविलेले परिमाण आणि तज्ञांची संख्या) वाढवण्याऐवजी जीएलएम -4.5 मालिका उंची (थरांची संख्या) वाढविताना रुंदी कमी करते. कंपनीने असा विश्वास ठेवला होता की सखोल मॉडेल्सने सुधारित तर्क क्षमता प्रदर्शित केली.
चीनी एआय फर्मने ब्लॉग पोस्टमध्ये प्री-ट्रेनिंग आणि पोस्ट-प्रशिक्षण प्रक्रियेसाठी वापरल्या जाणार्या कादंबरी तंत्रांची यादी देखील विकसक समुदायाला मॉडेल सुरवातीपासून कशी तयार केली गेली हे समजण्यास मदत केली.
जीएलएम -4.5 मालिका एआय मॉडेल्सची कामगिरी
फोटो क्रेडिट: z.ai
झेड.आय.ने एजंटिक, तर्क आणि कोडिंग ओलांडून 12 बेंचमार्कवर जीएलएम -4.5 मॉडेलच्या कामगिरीची चाचणी केल्याचा दावा केला. त्यानंतर ओपनई, मानववंश, गूगल, झई, अलिबाबा आणि बरेच काही मधील विविध एलएलएम विरूद्ध मॉडेलच्या एकूण स्कोअरची तुलना करण्याचा दावा केला. या अंतर्गत मूल्यांकनाच्या आधारे, चिनी एआय फर्मचा असा दावा आहे की ओपनईच्या ओ 3 आणि झईच्या ग्रोक 4 च्या मागे जीएलएम -4.5 तिसर्या स्थानावर आहे.
इच्छुक व्यक्ती झेड.आय. च्या या मॉडेल्सच्या खुल्या वजनात प्रवेश करू शकतात गीथब आणि मिठी मारणारा चेहरा सूची? वैकल्पिकरित्या, या एलएलएमएस कंपनीच्या वेबसाइट आणि अनुप्रयोग प्रोग्रामिंग इंटरफेस (एपीआय) द्वारे देखील प्रवेश केला जाऊ शकतो.

मुख्य संपादक : – इमरान शेख


























