OpenAI ने लॉन्च किया नया ChatGPT एजेंट: AI के साथ अपने कामों को आसान बनाएं!

क्या आपने कभी सोचा है कि आपकी ज़िंदगी कितनी आसान हो सकती है अगर एक AI आपकी सभी जटिल ज़िम्मेदारियों का ध्यान रख सके? पिछले गुरुवार, OpenAI ने ChatGPT एजेंट लॉन्च किया, एक नई सुविधा जो कंपनी के AI सहायक को अपनी खुद की वेब ब्राउज़र को नियंत्रित करके मल्टी-स्टेप कार्यों को पूरा करने की अनुमति देती है। यह अपडेट OpenAI के पहले के ऑपरेटर टूल और डीप रिसर्च फीचर की क्षमताओं को जोड़ता है, जिससे ChatGPT वेबसाइटों को नेविगेट करने, कोड चलाने और दस्तावेज़ बनाने में सक्षम हो जाता है, जबकि उपयोगकर्ता प्रक्रिया पर नियंत्रण बनाए रखते हैं।
यह सुविधा OpenAI की नवीनतम प्रविष्टि है, जिसे तकनीकी उद्योग 'एजेंटिक AI' कहता है—ऐसी प्रणालियाँ जो उपयोगकर्ता की ओर से स्वतंत्र मल्टी-स्टेप क्रियाएँ कर सकती हैं। OpenAI के अनुसार, उपयोगकर्ता एजेंट से अनुरोध कर सकते हैं, जैसे कि किसी विशेष अवसर के लिए कपड़ों का सेट बनाना और खरीदना, PowerPoint स्लाइड डेक बनाना, भोजन की योजना बनाना, या वित्तीय स्प्रेडशीट को नए डेटा से अपडेट करना।
यह प्रणाली कार्यों को पूरा करने के लिए वेब ब्राउज़र्स, टर्मिनल एक्सेस और API कनेक्शन का एक संयोजन उपयोग करती है। इसमें "ChatGPT कनेक्टर्स" शामिल हैं जो Gmail और GitHub जैसे एप्लिकेशनों के साथ एकीकृत होते हैं।
जब उपयोगकर्ता एजेंट का उपयोग कर रहे होते हैं, तो वे ChatGPT इंटरफ़ेस के अंदर एक विंडो देख सकते हैं जो दिखाती है कि AI अपने निजी सैंडबॉक्स के अंदर सभी क्रियाएँ कर रहा है। यह सैंडबॉक्स अपनी एक आभासी ऑपरेटिंग सिस्टम और वेब ब्राउज़र के साथ वास्तविक इंटरनेट तक पहुंच प्रदान करता है; यह आपके व्यक्तिगत उपकरण को नियंत्रित नहीं करता। OpenAI लिखता है, "ChatGPT इन कार्यों को अपनी आभासी कंप्यूटर का उपयोग करके पूरा करता है, तर्क और क्रिया के बीच प्रवाह करते हुए जटिल कार्य प्रक्रियाओं को आपके निर्देशों के आधार पर शुरू से अंत तक संभालता है।"
जैसे कि पहले के ऑपरेटर की तरह, एजेंट सुविधा को वास्तविक दुनिया के परिणामों के साथ कुछ क्रियाएँ करने से पहले उपयोगकर्ता की अनुमति की आवश्यकता होती है, जैसे कि खरीदारी करना। उपयोगकर्ता किसी भी समय कार्यों को बाधित कर सकते हैं, ब्राउज़र पर नियंत्रण ले सकते हैं, या संचालन को पूरी तरह से रोक सकते हैं। प्रणाली में एक "वॉच मोड" भी शामिल है, जो उन कार्यों के लिए है जैसे कि ईमेल भेजना, जो सक्रिय उपयोगकर्ता निगरानी की आवश्यकता होती है।
चूंकि एजेंट की क्षमताएँ ऑपरेटर से अधिक हैं, OpenAI का कहना है कि कंपनी की पहले की ऑपरेटर पूर्वावलोकन साइट कुछ और हफ्तों के लिए कार्यात्मक रहेगी, इसके बाद इसे बंद कर दिया जाएगा।
हालाँकि OpenAI के दावे एक बात हैं, लेकिन यह देखना कि कंपनी का नया AI एजेंट वास्तव में मल्टी-स्टेप कार्यों को कैसे पूरा करेगा, परिस्थितियों के आधार पर बहुत भिन्न होगा। इसका कारण यह है कि AI मॉडल समस्या-समाधान बुद्धिमत्ता का एक पूर्ण रूप नहीं है, बल्कि एक जटिल मास्टर अनुकरणकर्ता है। इसमें एक परिदृश्य को एक साथ जोड़ने में कुछ लचीलापन है, लेकिन इसके कई अंधे स्थान भी हैं। OpenAI ने एजेंट (और इसके घटक) को कंप्यूटर उपयोग और उपकरण उपयोग के उदाहरणों का उपयोग करके प्रशिक्षित किया; जो भी प्रशिक्षण डेटा से अवशोषित उदाहरणों के बाहर है, उसे पूरा करना संभवतः अभी भी मुश्किल साबित होगा।