दो साल पहले, एआई का इस्तेमाल करके चीज़ें बनाना मुख्यतः बड़ी टेक कंपनियों में काम करने वाले उच्च वेतन वाले मशीन लर्निंग इंजीनियरों का काम था। अब, यह सबके हाथ में है। एआई क्रांति ने हमारी दुनिया को बहुत तेज़ी से नया रूप दिया है। आइए एक कदम पीछे हटें और सोचें कि अगस्त 2022 में जब मैंने ओपनएआई के जीपीटी-3 से पूछा था कि कौन सी तकनीक इंसानों को सबसे ज़्यादा परेशान करेगी, तब से हम कितनी दूर आ गए हैं।
उस बातचीत ने, कुछ हद तक, मुझे अपना पहला लेख लिखने के लिए प्रेरित किया, जो स्पष्ट रूप से एक रोमांचक नए क्षेत्र में विकसित हो रहा था: जेनरेटिव एआई। (हालाँकि तब किसी ने इसे जेनरेटिव एआई नहीं कहा था, मैंने इसे "नो-कोड" एआई कहा था।)
उस पहले लेख को लिखे हुए दो साल और पचास लेख हो चुके हैं। तब से एआई की दुनिया में बहुत कुछ बदल गया है। चैटजीपीटी लॉन्च हुआ और इतिहास का सबसे तेज़ी से बढ़ने वाला उपभोक्ता ऐप बन गया। एआई लगभग हर बिज़नेस लीडर और रेगुलेटर के दिमाग में सबसे ऊपर आ गया है। और पिछले 24 महीनों में NVIDIA के शेयर की कीमत लगभग 24 गुना बढ़ गई है।
तो, इस दौरान उत्पादों में कितना सुधार हुआ है? पिछले साल की तरह, मैं इस वर्षगांठ का उपयोग एक कदम पीछे हटकर इस क्षेत्र में हो रहे तेज़ बदलाव की सराहना करने के लिए करना चाहता हूँ। ऐसी दुनिया में जहाँ हम लगातार बदलाव और सुधार देखते रहते हैं, उस प्रगति की सराहना करना मुश्किल है जो हुई है। या जैसा कि फेरिस बुएलर ने कहा था:
ज़िंदगी बहुत तेज़ी से आगे बढ़ती है। अगर आप बीच-बीच में रुककर इधर-उधर नहीं देखते, तो आप इसे नज़रअंदाज़ कर सकते हैं।
एआई द्वारा चित्र बनाना
इस चित्र को एक उदाहरण के रूप में लें। मैंने यह लेख लिखते समय हर साल एक ही प्रॉम्प्ट का इस्तेमाल किया है। 2002 में, DALL-E ने यह प्रॉम्प्ट दिया था: "लोगों का एक छोटा समूह कंप्यूटर स्क्रीन पर जो कुछ देख रहा है, उससे घबरा रहा है, लियोनार्डो दा विंची की पेंटिंग।"
अगस्त 2022 में वापस, टेक्स्ट टाइप करना और उसका मेरे टाइप किए हुए जैसा ही रिटर्न पाना वाकई कमाल का था! अगर आप एआई टाइम कैप्सूल में वापस जाना चाहते हैं, तो उस गर्मी में जॉन ओलिवर और उनके दर्शकों के उत्साह को सुनें, जब उन्होंने उन्हें दिखाया कि इमेज क्रिएशन टूल्स क्या-क्या बना सकते हैं।
एक वर्ष आगे बढ़ें, और उसी दा विंची प्रॉम्प्ट को मिडजर्नी में डालने पर यह परिणाम मिला:
हालांकि यह पूरी तरह से सही नहीं है, लेकिन पिछले साल की तुलना में यह एक बड़ी छलांग है। एआई आर्टवर्क एक साधारण शो से एक ऐसे टूल में बदल गया है जिसका इस्तेमाल डिज़ाइनर वर्कफ़्लो में ज़्यादा होता है। यहाँ तक कि हाथों में भी कम से कम पाँच उंगलियाँ दिखाई देती हैं। आज, मैं एक कदम और आगे जा सकता हूँ। मैंने उसी प्रॉम्प्ट को मिडजर्नी में डालकर एक इमेज तैयार की; फिर, मैं रनवे एमएल से उसे अच्छे से एनिमेट करवा सकता हूँ।
हमने 24 महीनों में बहुत लंबा सफर तय किया है। अगले साल इसी समय तक, हम शायद पूरी तरह से टेक्स्ट-टू-वीडियो रूपांतरण कर लेंगे। (हम अभी भी तुम्हारा इंतज़ार कर रहे हैं, सोरा!) तो, अगस्त 2025 में, एक 15 सेकंड का वीडियो, ध्वनि के साथ, देखने की उम्मीद करें, जिसमें पुनर्जागरण-क्षेत्र के पुरुष बाएँ से दाएँ घूम रहे हैं और प्रत्येक व्यक्ति एक आधुनिक कंप्यूटर मॉनिटर पर जो कुछ भी देख रहा है, उसे देखकर आश्चर्य में अपनी अनूठी प्रतिक्रिया दे रहा है।
कृत्रिम बुद्धि (AI) द्वारा पुस्तकें बनाना
मूल लेख प्रकाशित होने के कुछ महीने बाद मैंने एक और प्रयोग शुरू किया। मैं देखना चाहता था कि एक कृत्रिम बुद्धि (AI) कितनी अच्छी तरह किताब लिख सकती है और समय के साथ उसकी प्रगति को कैसे ट्रैक कर सकती है। मैंने एलेक्स आयरन्स नाम रखा और इन पुस्तकों को अमेज़न पर प्रकाशित करना शुरू कर दिया, इससे बहुत पहले कि वे कृत्रिम बुद्धि (AI) द्वारा निर्मित पुस्तकों के बारे में कोई खुलासा करते। (स्पष्ट करने के लिए, मैं यह खुलासा करता हूँ कि एलेक्स आयरन्स हर पुस्तक में एक कृत्रिम बुद्धि (AI) है। इसके अलावा, मैं उन पुस्तकों से जो भी पैसा कमा सकता हूँ, उसे सिलिकॉन वैली के सेकंड हार्वेस्ट फ़ूड बैंक को देता हूँ।) मैंने 2022 से अब तक, पूरी तरह से कृत्रिम बुद्धि (AI) द्वारा लिखी गई चौदह पुस्तकें अमेज़न पर प्रकाशित की हैं, और सच कहूँ तो, वे सभी बेकार हैं।
बड़े भाषा मॉडल किसी नए उत्पाद के लॉन्च के बारे में प्रेस विज्ञप्ति तैयार करने या आपके बच्चों के लिए सोने से पहले कहानी लिखने में बेहतरीन काम करते हैं। हालाँकि, 50,000 से ज़्यादा शब्दों का एक लंबा-चौड़ा लेख लिखना कहीं ज़्यादा मुश्किल है। हालाँकि आज ऐसा करना संभव नहीं है, लेकिन वहाँ तक पहुँचने का एक रास्ता ज़रूर है।
2022 में, एलेक्स की पहली किताब, आर्टिफिशियल अमेरिका, को शुरू से अंत तक लिखने में मुझे लगभग बीस घंटे लगे। हालाँकि इसमें से कुछ समय मुझे यह पता लगाने में लगा कि मॉडलों को कैसे अनुकूलित किया जाए, लेकिन उपकरण आम तौर पर सीमित थे। अगर मेरे पास GPT 3.5 (जो उस समय विश्वस्तरीय था) होता, तो मैं एक हज़ार या उससे ज़्यादा शब्दों की कहानी लिखता, तो वह बहुत ही भद्दी हो जाती। इस टूल को स्पष्ट शुरुआत, मध्य और अंत वाली कहानी बनाने में मुश्किल होती। मैंने पाया कि टोकन आउटपुट को लगभग 500 शब्दों तक सीमित रखने से काफ़ी मदद मिली। इसलिए, मैंने अलग-अलग शैलियों और लेखन शैलियों वाली एक स्प्रेडशीट सूची बनाई ताकि AI इस किताब की 50 से ज़्यादा छोटी कहानियों में उनकी नकल कर सके।
आखिरकार, यह एक ऐसे उत्पाद के लिए बहुत मेहनत थी जो उतना अच्छा नहीं था। इस महीने की शुरुआत में, मैंने क्लाउड 3.5 सॉनेट से "द डेप्थ्स वार्निंग" नामक एक किताब लिखवाई थी। फिर से, यह उतनी अच्छी नहीं है। लेकिन इसमें लगा समय 2022 की तुलना में बहुत कम है। क्लाउड में किताब लिखने में, जिसमें विषय पर विचार-मंथन, रूपरेखा तैयार करना और लेख लिखना शामिल था, 12,000 शब्द लिखने में लगभग दस मिनट लगे। इस प्रकार, दो साल में एक रचना लिखने में लगने वाला समय 10 घंटे से घटकर 10 मिनट रह गया। यह और तेज़ ही होगा। एआई एक अच्छी किताब लिख सकेगा, और शायद आज भी लिख सके। ये सभी किताबें एक ही प्रयास में प्रभावी रूप से पूरी हो जाती हैं। ये तो बस शुरुआती ड्राफ्ट हैं। और इस मामले में, जो इंसानों के लिए सच है, वही एआई के लिए भी सच है। जैसा कि अर्नेस्ट हेमिंग्वे ने प्रसिद्ध रूप से कहा था:
सभी शुरुआती ड्राफ्ट बकवास होते हैं!
एक एआई को सिर्फ़ लेखक ही नहीं होना चाहिए। यह एक संपादक, एक पुस्तक समीक्षक और आपका लक्षित पाठक भी हो सकता है। अलग-अलग व्यक्तित्व वाले अलग-अलग AI फ़ीडबैक दे सकते हैं और काम को दर्जनों बार फिर से लिख सकते हैं। एक ऐसी प्रक्रिया जिसे करने में इंसानों को सालों लगते हैं, उसे मिनटों में ही पूरा कर लिया जाएगा।
अगर कोई AI कवर लेटर लिखने में अच्छा है, तो कोई कारण नहीं कि वह रोमांस उपन्यास या ऐतिहासिक उपन्यास लिखने में भी अच्छा न हो। हमारी तरह, उसे पहले ड्राफ्ट से लेकर तैयार उत्पाद तक, सभी काम करने होते हैं। और बढ़ते संदर्भ विंडो और आने वाले AI एजेंटों के वादे के साथ, यह निकट भविष्य में होगा।
अंतिम विचार: ज़्यादा हमेशा बेहतर नहीं होता
निस्संदेह, जेनरेटिव AI आज उस समय से बेहतर है जब मैंने इसके बारे में लिखना शुरू किया था। लेकिन क्या इसके बदतर होने का कोई उदाहरण है?
मैंने कई प्रमुख मॉडलों से यही सवाल पूछा। क्या मैं माइक टायसन को किसी मुकाबले में हरा सकता हूँ? जवाब लंबे और शब्दाडंबरपूर्ण थे। यहाँ कुछ अंश दिए गए हैं जो मुझे मिले:
ChatGPT-4o ने कहा, "संक्षेप में, यह बेहद असंभव है कि आप टायसन जैसी क्षमता वाले किसी व्यक्ति के खिलाफ जीत पाएँ..."
Mistral Large 2, "यह बेहद असंभव है कि आप माइक टायसन को मुक्केबाज़ी के मुकाबले में हरा पाएँ, उनकी वर्तमान उम्र में भी..."
Claude Sonnet 3.5, "आपके द्वारा दी गई जानकारी के आधार पर, माइक टायसन को मुक्केबाज़ी के मुकाबले में हरा पाना बेहद असंभव होगा, उनकी वर्तमान उम्र 58 साल होने पर भी।"
मुझे आश्चर्य हुआ कि क्या यह, जैसा कि एलन मस्क अनुमान लगाते हैं, नए AI मॉडल सच को छिपा रहे हैं और "PC" उत्तर दे रहे हैं। इसलिए मैंने उनके मॉडल के नवीनतम संस्करण, Twitter के Grok 2, का इस्तेमाल किया, और यहाँ उसका लंबा, अस्पष्ट उत्तर दिया गया है:
नहीं। बाकी लोगों जैसा ही जवाब।
तो, ये जवाब दो साल पहले GPT 3 से पूछे गए इसी सवाल से कैसे मेल खाते हैं?
"नहीं।" शाबाश, GPT3। तुम बिल्कुल सही बात पर पहुँचे। और कोई भी मॉडल जो हम बना सकें, उससे बेहतर जवाब नहीं दे सकता।