मायक्रोसॉफ्टच्या संशोधकांनी बुधवारी एक नवीन फाउंडेशन मॉडेल जाहीर केले जे एजंटिक फंक्शन्स करू शकते. डब मॅग्मा, कृत्रिम बुद्धिमत्ता (एआय) मॉडेल मजकूर, प्रतिमा, व्हिडिओ तसेच स्थानिक स्वरूपात डेटासेटच्या मोठ्या प्रमाणात प्री-प्रशिक्षित आहे. रेडमंड-आधारित टेक राक्षस म्हणाले की मॅग्मा हा व्हिजन-लँग्वेज (व्हीएल) मॉडेल्सचा विस्तार आहे आणि तो केवळ मल्टीमोडल माहिती समजू शकत नाही तर त्यांच्यावर योजना आणि कार्य देखील करू शकतो. एआय एजंट-सक्षम मॉडेल संगणक व्हिजन, यूजर इंटरफेस (यूआय) नेव्हिगेशन आणि रोबोट मॅनिपुलेशनसह विस्तृत कार्यांमध्ये वापरली जाऊ शकते.
मायक्रोसॉफ्टने मॅग्मा फाउंडेशन मॉडेलची घोषणा केली
गीथब मध्ये पोस्टमायक्रोसॉफ्टच्या संशोधकांनी नवीन मॅग्मा फाउंडेशन मॉडेलचे तपशीलवार वर्णन केले. फाउंडेशन मॉडेल हे विशिष्ट मोठ्या भाषेचे मॉडेल (एलएलएम) आहेत, जे सुरवातीपासून तयार केले गेले आहेत आणि इतर कोणत्याही मॉडेलमधून डिस्टिल्ड नाहीत. ते बर्याचदा मालिकेतील इतर मॉडेल्ससाठी बेसलाइन बनतात. मॅग्मा या अर्थाने अद्वितीय आहे की एआय मॉडेल डेटासेटच्या विस्तृत श्रेणीवर पूर्व-प्रशिक्षित आहे.
संशोधकांनी असे सांगितले की मॅग्मामागील बेस आर्किटेक्चर हे लामा 3 एआय मॉडेल आहे. तथापि, मॅग्मा व्हिज्युअल-स्थानिक जगात योजना आखण्याची आणि कार्य करण्याची क्षमता देखील सुसज्ज आहे. हे मॉडेलला केवळ चॅटबॉट सारखे आउटपुट व्युत्पन्न करू शकत नाही तर क्रिया देखील कार्यान्वित करण्यास अनुमती देते.
हे संगणक व्हिजन चॅटबॉट म्हणून वापरले जाऊ शकते जे कॅमेरा सेन्सरसह पेअर केल्यावर जगाविषयी माहिती देऊ शकते. डिव्हाइसच्या यूआय नियंत्रित करण्यासाठी मॅग्मा देखील वापरला जाऊ शकतो. परंतु अधिक मनोरंजकपणे, हे एजंटच्या क्षमतांचा वापर करून जटिल कार्ये पूर्ण करण्यासाठी रोबोट्स देखील नियंत्रित करू शकते.
या क्षमतांमागील एक प्रमुख कारण म्हणजे दोन तांत्रिक घटकांसह-सेट-ऑफ-मार्क आणि ट्रेस-मार्क-मार्क. पूर्वी प्रतिमा, व्हिडिओ आणि स्थानिक डेटामध्ये अॅक्शन ग्राउंडिंग सक्षम करते मॉडेलने प्रतिमेच्या जागेत बटण किंवा रोबोट शस्त्रासाठी संख्यात्मक गुणांचा अंदाज लावला. नंतरचे मॉडेल टेम्पोरल व्हिडिओ गतिशीलता फीड करते आणि कृती करण्यापूर्वी पुढील फ्रेमचा अंदाज लावते. हे मॉडेलला मजबूत स्थानिक समज विकसित करण्यास अनुमती देते.
मायक्रोसॉफ्टच्या संशोधकांनी अंतर्गत चाचणीच्या आधारे एआय मॉडेलचे बेंचमार्क स्कोअर देखील सामायिक केले. ओपनई, अलिबाबा आणि Google द्वारे सर्व एजंटिक मूल्यांकन चाचण्यांमधील स्पर्धात्मक स्कोअर, मॉडेल आउटफॉर्मिंग मॉडेल्समध्ये त्याने स्पर्धात्मक स्कोअर साध्य केले आहेत. कंपनीने आत्तापर्यंत सार्वजनिक डोमेनमध्ये मॅग्मा सोडला नाही.

मुख्य संपादक : – इमरान शेख


























