आर्टिफिशियल इंटेलिजेंस ने हाल के वर्षों में अद्भुत प्रगति की है, लेकिन Google का नवीनतम चैटबॉट यह दिखा रहा है कि सबसे स्मार्ट मशीनें भी दबाव में कमजोर पड़ सकती हैं। Google DeepMind द्वारा जारी एक हालिया रिपोर्ट बताती है कि इसके प्रमुख मॉडल, जेमिनी 2.5 प्रो, पोकेमोन ब्लू खेलते समय घबराहट के संकेत दिखा रहा था। यह एक पुराना वीडियो गेम है, जिसे बच्चे आसानी से खेल लेते हैं। यह जानकारी एक ट्विच चैनल, जेमिनी_प्लेज़_पोकेमोन, से मिली, जहां स्वतंत्र इंजीनियर जोएल झांग ने जेमिनी को परखा। जबकि जेमिनी को अपनी उन्नत तर्क करने की क्षमताओं और कोड-स्तरीय समझ के लिए जाना जाता है, इस गेमिंग चुनौती के दौरान इसके प्रदर्शन ने अप्रत्याशित व्यवहारिक विचलनों को उजागर किया।

DeepMind टीम के अनुसार, जेमिनी ने “एजेंट पैनिक” दिखाना शुरू कर दिया। रिपोर्ट में कहा गया है, “खेल के दौरान जेमिनी 2.5 प्रो कई ऐसी स्थितियों में पहुंचता है जो मॉडल को ‘घबराहट’ का अनुकरण करने के लिए मजबूर करती हैं। उदाहरण के लिए, जब पार्टी के पोकेमोन का स्वास्थ्य या पावर पॉइंट कम होता है, तो मॉडल के विचार बार-बार पार्टी को तुरंत ठीक करने या वर्तमान डंगन से भागने की आवश्यकता को दोहराते हैं।” इस व्यवहार को नजरअंदाज नहीं किया गया। ट्विच दर्शक यह पहचानने लगे कि कब एआई घबराहट में है, जबकि DeepMind ने यह नोट किया कि “यह व्यवहार कई अलग-अलग उदाहरणों में हुआ है कि ट्विच चैट के सदस्यों ने इसे सक्रिय रूप से नोटिस किया है।”

हालांकि एआई मानव की तरह तनाव या भावनाओं का अनुभव नहीं करता है, लेकिन उच्च दबाव की स्थितियों में मॉडल के असामान्य निर्णय-निर्माण इस तरह के व्यवहार को दर्शाता है जो लोग तनाव में करते हैं, impulsive या अप्रभावी विकल्प चुनते हैं। पहले पूर्ण गेम रन में, जेमिनी ने पोकेमोन ब्लू को समाप्त करने में 813 घंटे लिए। झांग द्वारा किए गए समायोजनों के बाद, एआई ने दूसरे प्रयास में 406.5 घंटे में पूरा किया। फिर भी, यह एक बच्चे द्वारा वही गेम समाप्त करने के समय की तुलना में काफी अस्थिर था। सोशल मीडिया उपयोगकर्ता एआई के चिंतित गेमप्ले का मजाक बनाने में तेजी से लगे। एक दर्शक ने कहा, “अगर आप इसके विचारों को पढ़ते हैं जब यह तर्क करता है तो ऐसा लगता है कि यह किसी भी समय घबराहट में है जब आप कुछ भी थोड़े भिन्न तरीके से शब्द करते हैं।” एक अन्य ने मजाक किया: “LLANXIETY।” एक तीसरे ने एक व्यापक विचार के साथ कहा: “मैं सोचने लगा हूँ कि ‘पोकेमोन इंडेक्स’ शायद हमारे सबसे अच्छे AGI संकेतकों में से एक हो सकता है। हमारे सबसे अच्छे एआई अभी भी एक बच्चे के खेल में संघर्ष कर रहे हैं, यह इस बात का सबसे अच्छा संकेत है कि हम अभी कितनी दूर हैं। और हम कितनी दूर आ चुके हैं।” दिलचस्प बात यह है कि ये खुलासे केवल कुछ सप्ताह बाद आए हैं जब एप्पल ने एक अध्ययन जारी किया था जिसमें कहा गया था कि अधिकांश एआई तर्क मॉडल वास्तव में तर्क नहीं करते हैं। इसके बजाय, वे पैटर्न पहचान पर भारी निर्भर करते हैं और जब कार्य को संशोधित या जटिल किया जाता है तो गिर जाते हैं।