DeepSeek R1 vs OpenAI : सच्चाई चौकाएगी!

NCI

DeepSeek R1 vs OpenAI

 चीन ने हाल ही में एक नया AI मॉडल, DeepSeek R1, लॉन्च किया है, जो गहरे डेटा विश्लेषण के लिए डिज़ाइन किया गया है और सीधे अमेरिका के OpenAI को चुनौती देता है। इस तकनीकी विकास के बाद वैश्विक AI उद्योग में उथल-पुथल मच गई। DeepSeek R1 को केवल $6 मिलियन की लागत में विकसित करने का दावा किया गया, जिसने निवेशकों को चौंका दिया और अमेरिकी शेयर बाजार में भारी गिरावट देखी गई। OpenAI और अन्य अमेरिकी कंपनियों को अपनी AI प्रगति के लिए अरबों डॉलर और वर्षों का समय लगा, लेकिन चीन ने महज दो महीनों में कमज़ोर ग्राफिक्स प्रोसेसिंग यूनिट (GPU) पर एक प्रतिस्पर्धी मॉडल तैयार कर दिया। इस खबर के बाद वैश्विक बाजारों में हलचल मच गई और तकनीकी शेयरों में भारी गिरावट आई।

DeepSeek R1 के लॉन्च के तुरंत बाद, अमेरिकी शेयर बाजार से 1 ट्रिलियन डॉलर से अधिक की संपत्ति मिट गई। बड़े नामों जैसे Meta, Oracle और Alphabet को भारी नुकसान हुआ, लेकिन सबसे ज्यादा असर NVIDIA पर पड़ा, जिसके शेयरों में एक ही दिन में 600 बिलियन डॉलर की गिरावट आई। यह घटना 2008 के वित्तीय संकट से भी बड़ी बताई जा रही है। यह झटका इसलिए भी असामान्य था क्योंकि चीन अमेरिका द्वारा लगाए गए AI चिप्स पर प्रतिबंधों का सामना कर रहा था, जिससे NVIDIA H100 जैसे उच्च-प्रदर्शन वाले GPU चीन में नहीं भेजे जा सकते। इसके बावजूद DeepSeek ने एक शक्तिशाली AI मॉडल विकसित कर लिया। अब सवाल यह उठता है कि क्या चीन ने इन प्रतिबंधों को दरकिनार करने का कोई तरीका खोज लिया, या यह पूरी कहानी मात्र एक भ्रम है?

DeepSeek R1 के सबसे बड़े दावों में से एक यह था कि इसका प्रशिक्षण केवल $6 मिलियन में पूरा हुआ। लेकिन यह आंकड़ा गुमराह करने वाला है क्योंकि AI मॉडल के प्रशिक्षण की वास्तविक लागत सिर्फ एक संख्या पर निर्भर नहीं करती। इसमें कंप्यूटिंग संसाधन, बुनियादी ढांचा और निरंतर विकास शामिल होता है। Anthropic के सह-संस्थापक Dario Amodei ने इस दावे पर सवाल उठाया और बताया कि उनकी कंपनी द्वारा विकसित Claude 3.5 Sonnet, जो करीब एक साल पुराना मॉडल है, का निर्माण करने में भी करोड़ों डॉलर खर्च हुए थे। ऐसे में DeepSeek R1 को महज $6 मिलियन में बनाने का दावा संदिग्ध लगता है। वास्तव में, GPT-4 को विकसित करने में 100 मिलियन डॉलर से अधिक खर्च हुआ था और Meta के LLaMA 2 जैसे मॉडल भी बड़े निवेश के बिना संभव नहीं थे।

विशेषज्ञों के अनुसार, AI प्रशिक्षण की लागत समय के साथ घटती जाती है। ऐसा माना जाता है कि हर साल लागत चार गुना कम हो जाती है। इसलिए DeepSeek का सस्ता प्रशिक्षण वास्तव में किसी क्रांतिकारी बदलाव का संकेत नहीं देता, बल्कि यह उद्योग में सामान्य प्रवृत्ति का ही हिस्सा है। असल में, DeepSeek ने अपने बुनियादी ढांचे में भारी निवेश किया था। कुछ रिपोर्टों के अनुसार, DeepSeek के पास 50,000 NVIDIA H100 GPU थे, जिनकी कीमत अकेले $1 बिलियन के करीब बैठती है। H100 चिप्स की कीमत प्रति यूनिट $20,000 से $40,000 के बीच होती है। यदि यह आंकड़े सही हैं, तो DeepSeek का हार्डवेयर निवेश भी OpenAI और Anthropic जैसी अमेरिकी कंपनियों के बराबर या उससे अधिक हो सकता है।

इस घटनाक्रम में एक महत्वपूर्ण तथ्य यह भी है कि DeepSeek R1 असल में कोई बड़ी सफलता नहीं थी। DeepSeek का असली नवाचार DeepSeek V3 था, जो R1 से एक महीने पहले लॉन्च किया गया था। जबकि मीडिया ने R1 पर ध्यान केंद्रित किया, विशेषज्ञों का मानना है कि असली तकनीकी छलांग V3 मॉडल में हुई थी। V3 ने दो प्रमुख सुधार पेश किए - पहला, एक उन्नत की-वैल्यू कैश (key-value cache) प्रणाली, जिससे मेमोरी दक्षता बढ़ी और लंबे टेक्स्ट हैंडल करने की क्षमता में सुधार हुआ; दूसरा, मिश्रण-विशेषज्ञ अनुकूलन (Mixture of Experts - MoE), जिससे मॉडल अधिक तेज़ और लागत प्रभावी बना।

लेकिन DeepSeek R1, जो कि मीडिया का मुख्य आकर्षण बन गया, वास्तव में सिर्फ एक साधारण अद्यतन था। R1 केवल DeepSeek V3 का एक उन्नत संस्करण था, जिसमें Reinforcement Learning जोड़ा गया था। Reinforcement Learning एक ऐसी तकनीक है जिसका उपयोग पहले से ही OpenAI, Google DeepMind, और Meta जैसी कंपनियां कर रही हैं। यानी, DeepSeek R1 को एक क्रांतिकारी मॉडल के रूप में पेश किया गया, जबकि यह वास्तव में मौजूदा तकनीकों पर आधारित एक मामूली सुधार मात्र था।

AI उद्योग में यह एक असामान्य समय है। वर्तमान में, कई कंपनियां उच्च-स्तरीय सोचने की क्षमता वाले मॉडल बना रही हैं, लेकिन यह दौर ज्यादा समय तक नहीं चलेगा। AI विकास का एक पैटर्न है - जिन कंपनियों के पास सबसे बड़ा बुनियादी ढांचा और सबसे अधिक कंप्यूटिंग शक्ति होती है, वही अंततः हावी होती हैं। केवल प्रशिक्षण की लागत महत्वपूर्ण नहीं होती, बल्कि यह भी मायने रखता है कि कौन सी कंपनी सबसे तेज़ी से स्केल कर सकती है और लंबे समय तक प्रतिस्पर्धा में बने रहने के लिए संसाधन झोंक सकती है।

आज, कोई भी AI लैब, जिसके पास पर्याप्त बजट हो, एक शक्तिशाली मॉडल बना सकती है, लेकिन AI के अगले चरण में प्रवेश करने के लिए कहीं अधिक उन्नत संसाधनों की आवश्यकता होगी। इसमें सुधारित तर्क प्रणाली (enhanced reasoning) और उन्नत Reinforcement Learning तकनीकों की जरूरत होगी, जिनके लिए बहुत अधिक धन और बुनियादी ढांचे की आवश्यकता होगी। इसलिए, विशेषज्ञों का मानना है कि DeepSeek ने भले ही एक मजबूत शुरुआत की हो, लेकिन यह AI विकास की मूलभूत संरचना को नहीं बदलेगा। भविष्य अभी भी उन्हीं कंपनियों द्वारा नियंत्रित किया जाएगा, जिनके पास सबसे बड़े कंप्यूटर क्लस्टर, सबसे उन्नत AI अनुसंधान, और सबसे गहरी वित्तीय क्षमता होगी।

DeepSeek R1 के लॉन्च के बाद न केवल AI उद्योग, बल्कि वैश्विक वित्तीय बाजारों में भी हलचल मच गई। NVIDIA के शेयरों में 600 बिलियन डॉलर की गिरावट आई, जिससे कुल 1 ट्रिलियन डॉलर का नुकसान हुआ। निवेशकों को लगा कि AI उद्योग की आर्थिक संरचना पूरी तरह बदल सकती है, जिससे कई तकनीकी शेयरों की कीमतें गिर गईं। लेकिन जैसे-जैसे सच्चाई सामने आई, यह स्पष्ट हुआ कि DeepSeek का मॉडल उतना क्रांतिकारी नहीं था, जितना पहले बताया गया था।

AI उद्योग में इस तरह की हाइप खतरनाक हो सकती है। जब कोई नई तकनीक आती है और दावा किया जाता है कि यह पुराने मॉडलों से कहीं सस्ती और बेहतर है, तो निवेशक घबरा जाते हैं और बाजार में भारी उतार-चढ़ाव देखने को मिलता है। वास्तव में, किसी भी AI मॉडल को विकसित करने की लागत केवल प्रशिक्षण लागत तक सीमित नहीं होती; इसमें बुनियादी ढांचे की स्थापना, तैनाती (deployment), और दीर्घकालिक सुधार शामिल होते हैं, जिन पर अरबों डॉलर खर्च होते हैं।

निष्कर्षतः, DeepSeek R1 का $6 मिलियन का दावा गलत तरीके से प्रस्तुत किया गया। असल लागत NVIDIA के 50,000 GPU क्लस्टर में छिपी हुई थी, जिसकी कीमत करीब $1 बिलियन थी। इसके अलावा, असली तकनीकी छलांग R1 में नहीं, बल्कि V3 में थी, जिसे मीडिया ने नज़रअंदाज कर दिया। मौजूदा समय में AI विकास की गति अस्थायी रूप से संतुलित दिखाई देती है, लेकिन यह स्थिति जल्द ही बदल जाएगी। जैसे-जैसे AI उद्योग आगे बढ़ेगा, प्रतियोगिता केवल उन कंपनियों के बीच होगी, जो सबसे बड़े संसाधनों का नियंत्रण रखती हैं।

AI के क्षेत्र में यह घटना हमें याद दिलाती है कि असली शक्ति उन्हीं के हाथ में रहती है, जिनके पास सबसे बड़ा निवेश और सबसे अधिक कंप्यूटिंग संसाधन होते हैं। DeepSeek ने एक महत्वपूर्ण कदम उठाया है, लेकिन यह AI उद्योग में मौलिक परिवर्तन लाने के लिए पर्याप्त नहीं है।

#buttons=(Ok, Go it!) #days=(20)

Our website uses cookies to enhance your experience. Learn More
Ok, Go it!
To Top