- OpenAI के o1 मॉडल को सितंबर में एक सफलता के रूप में सराहा गया था।
- नवंबर तक, एक चीनी एआई लैब ने डीपसीक नामक एक समान मॉडल जारी किया था।
- गुरुवार को, Google जेमिनी 2.0 फ़्लैश थिंकिंग नामक एक चुनौती लेकर आया।
सितंबर में, OpenAI ने o1 नामक एक बिल्कुल नए प्रकार के AI मॉडल का अनावरण किया। कुछ ही महीनों में, प्रतिद्वंद्वियों ने इसी तरह की पेशकश पेश की।
गुरुवार को, Google ने जेमिनी 2.0 फ्लैश थिंकिंग जारी किया, जो तर्क तकनीकों का उपयोग करता है जो काफी हद तक o1 की तरह दिखती हैं।
इससे पहले भी, नवंबर में, एक चीनी कंपनी ने डीपसीक की घोषणा की थी, जो एक एआई मॉडल है जो चुनौतीपूर्ण प्रश्नों को ओपनएआई के ओ1 जैसे अधिक प्रबंधनीय कार्यों में तोड़ देता है।
यह भीड़-भाड़ वाली एआई सीमा का नवीनतम उदाहरण है जहां महंगे नवाचारों का तेजी से मिलान किया जाता है, जिससे अलग दिखना कठिन हो जाता है।
स्टार्टअप जूलियस एआई के सीईओ राहुल सोनवलकर ने कहा, “यह आश्चर्यजनक है कि एआई मॉडल में सुधार कितनी तेजी से कमोडिटी में बदल जाता है।” “कंपनियाँ इन नए मॉडलों के निर्माण में भारी मात्रा में खर्च करती हैं, और कुछ ही महीनों में वे एक वस्तु बन जाते हैं।”
समान क्षमताओं वाले कई एआई मॉडल के प्रसार से इन उपकरणों का उपयोग करने के लिए उच्च कीमत वसूलने को उचित ठहराना मुश्किल हो सकता है। एआई मॉडल तक पहुंच की कीमत वास्तव में पिछले एक साल में कम हो गई है।
बदले में, यह सवाल उठ सकता है कि क्या अगला शीर्ष एआई मॉडल बनाने के लिए करोड़ों डॉलर या अरबों डॉलर खर्च करना उचित है।
एआई उद्योग में सितंबर एक जीवन भर का समय है
सितंबर में जब OpenAI ने अपने O1 मॉडल का पूर्वावलोकन किया, तो उत्पाद को एक सफलता के रूप में सराहा गया। यह अधिक चुनौतीपूर्ण प्रश्नों का उत्तर देने के लिए अनुमान-समय गणना नामक एक नए दृष्टिकोण का उपयोग करता है।
यह प्रश्नों को अधिक सुपाच्य कार्यों में विभाजित करके और इनमें से प्रत्येक चरण को एक नए प्रॉम्प्ट में बदलकर करता है जिसे मॉडल निपटता है। प्रत्येक चरण के लिए एक नया अनुरोध चलाने की आवश्यकता होती है, जिसे एआई में अनुमान चरण के रूप में जाना जाता है।
यह विचार की एक श्रृंखला या तर्क की श्रृंखला का निर्माण करता है जिसमें समस्या के प्रत्येक भाग का उत्तर दिया जाता है, और मॉडल तब तक अगले चरण पर नहीं जाता है जब तक कि यह अंततः पूर्ण प्रतिक्रिया के साथ नहीं आता है।
मॉडल पीछे भी जा सकता है और अपने पिछले कदमों की जांच करके त्रुटियों को ठीक कर सकता है, या समाधान का प्रयास कर सकता है और कुछ और प्रयास करने से पहले विफल हो सकता है। यह वैसा ही है जैसे मनुष्य जटिल कार्यों में अधिक समय बिताते हैं।
डीपसीक उगता है
केवल दो महीनों में, O1 को एक प्रतिद्वंद्वी मिल गया। 20 नवंबर को एक चीनी एआई कंपनी ने जारी किया डीपसीक.
यूसी बर्कले के एआई शोधकर्ता और सह-लेखक चार्ली स्नेल ने कहा, “वे शायद ओ1 को पुन: पेश करने वाले पहले व्यक्ति थे।” एक Google डीपमाइंड पेपर इस वर्ष अनुमान-समय गणना पर।
उन्होंने डीपसीक के एआई मॉडल को आज़माया है और कहते हैं कि यह जटिल गणित समस्याओं पर अच्छा प्रदर्शन करता है जिन्हें लंबे समय तक और चरणों में सोचकर हल किया जाना चाहिए।
उन्होंने कहा कि डीपसीक के डीपथिंक मोड में, मॉडल उपयोगकर्ताओं को अपनी विचार प्रक्रिया के हर चरण को दिखाता है। O1 के साथ, ये मध्यवर्ती चरण उपयोगकर्ताओं से छिपे हुए हैं।
स्नेल ने बीआई को बताया, “मैंने ओपनएआई के लोगों से पूछा है कि वे इसके बारे में क्या सोचते हैं।” “वे कहते हैं कि यह एक ही चीज़ जैसा दिखता है, लेकिन वे यह नहीं जानते कि डीपसीक ने इतनी तेज़ी से ऐसा कैसे किया।”
OpenAI ने टिप्पणी के अनुरोध का जवाब नहीं दिया।
ओपनएआई के सह-संस्थापक आंद्रेज कारपैथी ने उसी तर्क सुविधा के लिए Google के नए “थिंकिंग” मॉडल की प्रशंसा की।
उन्होंने आगे लिखा, “यहां प्रमुख और सुखद आश्चर्य यह है कि ओ1 के विपरीत मॉडल के तर्कपूर्ण निशान दिखाए गए हैं।” एक्स. “एक उपयोगकर्ता के रूप में मैं व्यक्तिगत रूप से इसे वास्तव में पसंद करता हूं क्योंकि तर्क स्वयं देखना और पढ़ना दिलचस्प है – मॉडल सक्रिय रूप से विभिन्न संभावनाओं, विचारों, खुद पर बहस आदि के बारे में सोचते हैं, यह मूल्यवर्धन का हिस्सा है।”
एक डीपसीक डेमो
स्नेल ने बिजनेस इनसाइडर के साथ एक बहु-चरणीय गणित समस्या साझा की, जिसका उपयोग स्वयं के लिए डीपसीक का परीक्षण करने के लिए किया गया था:
“+, -, /, * का एक क्रम ढूंढें जिसे संख्या 7, 3, 11, 5 पर लागू करके 24 तक पहुँचा जा सकता है, जहाँ दी गई प्रत्येक संख्या का उपयोग ठीक एक बार किया जाता है।”
बीआई ने उस प्रॉम्प्ट को अपनी वेबसाइट पर डीपसीक की चैट विंडो में डाल दिया। मॉडल ने शुरुआत में चुनौती को सामने रखकर प्रतिक्रिया व्यक्त की।
“ठीक है, तो मेरे पास यह समस्या है: मुझे संख्याओं 7, 3, 11, और 5 का उपयोग करने की आवश्यकता है, और प्रत्येक संख्या का ठीक एक बार उपयोग करके उन्हें जोड़, घटाव, गुणा और भाग की संक्रियाओं के साथ संयोजित करना होगा, प्राप्त करने के लिए से 24,” इसने उत्तर दिया। “पहली नज़र में, यह थोड़ा मुश्किल लगता है, लेकिन मुझे लगता है कि कुछ व्यवस्थित सोच के साथ, मैं इसका पता लगा सकता हूँ।”
इसके बाद यह लगभग 16 पृष्ठों की चर्चा में कई चरणों से गुजरा जिसमें गणितीय गणना और समीकरण शामिल थे। मॉडल से कभी-कभी गलती हो जाती थी, लेकिन उसने इसे पहचान लिया और हार नहीं मानी। इसके बजाय, यह तेजी से दूसरे संभावित समाधान की ओर बढ़ गया।
“33/7 * 5 ≈ 23.57 के साथ लगभग वहां पहुंच गया, लेकिन काफी 24 नहीं। शायद मुझे एक अलग दृष्टिकोण आज़माने की ज़रूरत है“यह एक बिंदु पर लिखा था।
स्नेल के अनुसार, कुछ मिनटों के बाद उसे सही समाधान मिल गया।
स्नेल ने बुधवार को एक साक्षात्कार में बताया, “आप इसे अलग-अलग विचारों को आज़माते और पीछे हटते हुए देख सकते हैं।” उन्होंने डीपसीक की विचार श्रृंखला के इस हिस्से को विशेष रूप से उल्लेखनीय बताया।
“यह वास्तव में समय लेने वाला होता जा रहा है। शायद मुझे एक अलग रणनीति पर विचार करने की ज़रूरत है,” एआई मॉडल ने लिखा। “एक समय में दो संख्याओं को संयोजित करने के बजाय, शायद मुझे उन्हें अलग-अलग समूह बनाने या नेस्टेड तरीके से संचालन का उपयोग करने का तरीका खोजना चाहिए।“
फिर गूगल दिखता है
स्नेल ने कहा कि अन्य कंपनियां संभवतः एआई मॉडल पर काम कर रही हैं जो ओपनएआई के समान अनुमान-समय गणना दृष्टिकोण का उपयोग करती हैं।
उन्होंने बुधवार को कहा, “डीपसीक पहले से ही ऐसा करता है, इसलिए मुझे लगता है कि अन्य लोग भी इस पर काम कर रहे हैं।”
अगले दिन, Google ने जेमिनी 2.0 फ़्लैश थिंकिंग जारी किया। डीपसीक की तरह, यह नया मॉडल समस्याओं से निपटने के दौरान उपयोगकर्ताओं को अपनी विचार प्रक्रिया के प्रत्येक चरण को दिखाता है।
Google AI के अनुभवी जेफ डीन ने एक्स पर एक डेमो साझा किया जिसमें दिखाया गया कि इस नए मॉडल ने एक भौतिकी समस्या को हल किया और इसके तर्कसंगत चरणों को समझाया।
डीन ने लिखा, “इस मॉडल को अपने तर्क को मजबूत करने के लिए विचारों का उपयोग करने के लिए प्रशिक्षित किया गया है।” “जब हम अनुमान समय की गणना बढ़ाते हैं तो हमें आशाजनक परिणाम मिलते हैं!”