क्या आपने कभी सोचा है कि एक दिन AI हमारे साथ मिलकर वास्तविक समय में 3D स्पेस में घूम सकता है? जी हाँ! Google DeepMind ने हाल ही में Genie 3 का अनावरण किया है, जो एक अत्याधुनिक AI “वर्ल्ड” मॉडल है। यह मॉडल न केवल 3D स्पेस बना सकता है, बल्कि यह मनुष्यों और AI एजेंटों के लिए इनमें घूमने और इंटरैक्ट करने की क्षमता भी प्रदान करता है।

Genie 3 का मकसद लंबे और यथार्थवादी अनुभव प्रदान करना है, जिसमें यह याद रख सकता है कि वस्तुएँ कहाँ रखी गई हैं, भले ही आप उन पर से नज़र हटा लें और बाद में लौट आएं।

वास्तव में, वर्ल्ड मॉडल जैसे Genie को एक प्रॉम्प्ट के आधार पर डिजिटल वातावरण बनाने के लिए डिज़ाइन किया गया है, बिल्कुल वीडियो गेम वर्ल्ड की तरह। लेकिन यहाँ पर, सब कुछ AI द्वारा निर्मित किया जाता है, न कि मैन्युअल रूप से 3D एसेट्स द्वारा। ये वातावरण कई उद्देश्यों के लिए उपयोग किए जा सकते हैं, जैसे कि सीखना, मनोरंजन, और रोबोट या AI सिस्टम को प्रशिक्षित करना।

Genie 3 के साथ, Google का कहना है कि इंटरैक्शन टाइम कुछ मिनटों तक बढ़ गया है, जो Genie 2 में 10-20 सेकंड से एक बड़ी छलांग है। अब, यह सिस्टम लगभग एक मिनट तक दृश्य विवरण को याद रख सकता है। इसका मतलब है कि यदि आप किसी चीज़ से दूर चले जाते हैं, जैसे कि एक चॉकबोर्ड या पेंट की दीवार, और फिर वापस देखते हैं, तो विवरण वैसा ही रहेगा जैसा पहले था। इसके अलावा, यह मॉडल 720p रिज़ॉल्यूशन पर दुनिया का निर्माण करता है और 24 फ्रेम प्रति सेकंड पर चलता है।

एक नई विशेषता जिसे “प्रॉम्प्टेबल वर्ल्ड इवेंट्स” कहा जाता है, उपयोगकर्ताओं को दुनिया के भीतर की स्थितियों को बदलने की अनुमति देती है - जैसे कि मौसम को बदलना या नए पात्र जोड़ना, बस एक कमांड टाइप करके।

पहले के Genie 2, जो दिसंबर में लॉन्च हुआ था, केवल एक छवि से इंटरएक्टिव स्पेस बना सकता था, लेकिन इसके इंटरैक्शन टाइम कम थे और स्थिर दृश्य बनाने में कठिनाई हुई। उद्योग में अन्य प्रयासों को भी इसी तरह की चुनौतियों का सामना करना पड़ा, कभी-कभी ऐसे बदलते या बिगड़े हुए इमेजरी का निर्माण किया जो अनुभव को कम आकर्षक बनाता था।

Genie 3 अभी आम जनता के लिए उपलब्ध नहीं होगा। DeepMind इसे एक सीमित शोध पूर्वावलोकन के रूप में एक छोटे से सेट के शैक्षणिक और निर्माताओं के लिए रोल आउट कर रहा है, ताकि संभावित जोखिमों का अध्ययन किया जा सके और सुरक्षा उपायों पर निर्णय लिया जा सके। वर्तमान में, इंटरएक्शन फीचर्स भी प्रतिबंधित रहेंगे, और उत्पन्न दुनिया के भीतर पढ़ने योग्य पाठ ज्यादातर तभी दिखाई देगा जब यह प्रारंभिक प्रॉम्प्ट का हिस्सा हो। Google का कहना है कि भविष्य में यह अधिक परीक्षणकर्ताओं के लिए पहुंच को बढ़ा सकता है। Genie 3 पर काम करने वाली वर्ल्ड मॉडल टीम का नेतृत्व एक पूर्व सह-नेता कर रहा है जो OpenAI के Sora वीडियो जनरेशन प्रोजेक्ट का हिस्सा था।