पूर्व OpenAI वैज्ञानिक आंद्रेज कार्पेथी ने Reinforcement Learning पर जताई चिंता
आंद्रेज कार्पेथी ने Reinforcement Learning के भविष्य पर चिंता जताई।


bhanu@chugal.com
जाने-माने एआई (आर्टिफिशियल इंटेलिजेंस) शोधकर्ता और OpenAI के पूर्व वैज्ञानिक आंद्रेज कार्पेथी ने Reinforcement Learning (आरएल) को लेकर अपनी दीर्घकालिक चिंताओं को साझा किया है। उन्होंने सोशल मीडिया प्लेटफॉर्म एक्स (पहले ट्विटर) पर एक पोस्ट में कहा कि भविष्य में यह तरीका अप्रभावी और डिजाइन करने में मुश्किल साबित होगा।
कौन हैं आंद्रेज कार्पेथी?
आंद्रेज कार्पेथी OpenAI के संस्थापक सदस्यों में से एक थे। उन्होंने GPT-4 मॉडल के विकास में महत्वपूर्ण भूमिका निभाई थी, जिसे बाद में ChatGPT के रूप में जारी किया गया था। वह एआई समुदाय में अपने गहन विचारों और तकनीकी विशेषज्ञता के लिए जाने जाते हैं।
'Reinforcement Learning' पर क्या है उनकी राय?
कार्पेथी का मानना है कि Reinforcement Learning, जो मशीन लर्निंग की एक तकनीक है, लंबी अवधि में उतनी कुशल नहीं रहेगी और इसे डिजाइन करना भी कठिन होगा। उन्होंने कहा कि उनका विश्वास है कि सीखने के नए तरीके, जो काफी हद तक इंसानों के सोचने के तरीके से मिलते-जुलते होंगे, आखिरकार Reinforcement Learning की जगह ले लेंगे।
मानव सीखने का तरीका
कार्पेथी ने अपनी पोस्ट में कहा, "व्यक्तिगत रूप से और लंबी अवधि में, मैं माहौल और एजेंटिक इंटरैक्शन को लेकर आशावादी हूं, लेकिन Reinforcement Learning को लेकर विशेष रूप से निराशावादी हूं।" उन्होंने इस बात पर भी संदेह व्यक्त किया कि इंसान अधिकांश बौद्धिक कार्यों के लिए Reinforcement Learning का उपयोग करते हैं, सिवाय कुछ शारीरिक कार्यों (motor tasks) के।
भविष्य की तकनीक
उन्होंने जोर देकर कहा कि इंसान सीखने के अलग-अलग तरीकों का इस्तेमाल करते हैं जो "काफी अधिक शक्तिशाली और सैंपल-कुशल" होते हैं, और जिन्हें अभी तक ठीक से खोजा और विकसित नहीं किया गया है, हालांकि शुरुआती विचार और अवधारणाएं मौजूद हैं। कार्पेथी ने कहा कि जहां टेक्स्ट पढ़ना और उदाहरणों का अनुकरण करना जैसी पुरानी एआई प्रशिक्षण तकनीकें मौजूद रहेंगी, वहीं भविष्य मॉडलों को ऐसे वातावरण में रहने और एक-दूसरे के साथ बातचीत करके सीखने में निहित होगा।
Reinforcement Learning का बढ़ता चलन
गौरतलब है कि मौजूदा बड़े भाषा मॉडल (LLMs) की प्रगति धीमी होने के साथ, Reinforcement Learning विधियों में फिर से रुचि देखी जा रही है। यह एक ऐसी मशीन लर्निंग प्रशिक्षण तकनीक है जिसका उपयोग एआई मॉडल बनाने के लिए किया जाता है। हालांकि, कार्पेथी के बयान से इस तकनीक के दीर्घकालिक भविष्य पर नई बहस छिड़ गई है।