1950 में, द्वितीय विश्व युद्ध के दौरान एनिग्मा कोड को क्रैक करने वाले ब्रिटिश कंप्यूटर वैज्ञानिक एलन ट्यूरिंग ने एक लेख लिखा था जिसमें उन्होंने एक बेतुका सवाल उठाया था: “क्या मशीनें सोच सकती हैं?” अजीब सजीव चैटजीपीटी की पिछले साल के अंत में शुरुआत हमें एक उत्तर के करीब ले गई। रातोंरात, एक पूरी तरह से गठित सिलिकॉन-आधारित चैटबॉट ने डिजिटल छाया से कदम रखा। यह चुटकुले गढ़ सकता है, विज्ञापन कॉपी लिख सकता है, कंप्यूटर कोड डिबग कर सकता है और किसी भी चीज और हर चीज के बारे में बातचीत कर सकता है। इस परेशान करने वाली नई वास्तविकता को पहले से ही कृत्रिम बुद्धिमत्ता के इतिहास में उन “टिपिंग पॉइंट्स” में से एक के रूप में वर्णित किया जा रहा है।
लेकिन आए काफी समय हो गया है। और यह विशेष रचना दशकों से कंप्यूटर साइंस लैब में इशारा कर रही है।
एक सोच मशीन के लिए अपने प्रस्ताव के परीक्षण के रूप में, ट्यूरिंग ने एक “नकली खेल” का वर्णन किया, जहां एक इंसान दूसरे कमरे में स्थित दो उत्तरदाताओं से पूछताछ करेगा। एक हाड़-मांस का इंसान होगा, दूसरा कंप्यूटर। पूछताछकर्ता को “टेलीप्रिंटर” के माध्यम से प्रश्न पूछकर यह पता लगाने का काम सौंपा जाएगा कि कौन सा था।
ट्यूरिंग ने एक बुद्धिमान कंप्यूटर की कल्पना की जो पर्याप्त आसानी से सवालों का जवाब दे सके कि पूछताछकर्ता आदमी और मशीन के बीच अंतर करने में विफल हो जाए। जबकि उन्होंने स्वीकार किया कि उनकी पीढ़ी के कंप्यूटर परीक्षण पास करने के करीब नहीं आ सके, उन्होंने भविष्यवाणी की कि सदी के अंत तक, “विरोधाभास की उम्मीद किए बिना मशीनों की सोच के बारे में बात करने में सक्षम होंगे।”
उनके निबंध ने कृत्रिम बुद्धिमत्ता में अनुसंधान शुरू करने में मदद की। लेकिन इसने लंबे समय तक चलने वाली दार्शनिक बहस को भी छेड़ दिया, क्योंकि ट्यूरिंग के तर्क ने मानव चेतना के महत्व को प्रभावी ढंग से दरकिनार कर दिया। यदि कोई मशीन केवल सोच की उपस्थिति तोता कर सकती है – लेकिन ऐसा करने की कोई जागरूकता नहीं है – तो क्या यह वास्तव में एक सोचने वाली मशीन थी?
कई वर्षों तक, एक ऐसी मशीन बनाने की व्यावहारिक चुनौती जो नकली खेल खेल सके, इन गहन प्रश्नों पर भारी पड़ गई। मुख्य बाधा मानव भाषा थी, जो विस्तृत गणितीय समस्याओं की गणना के विपरीत, कंप्यूटिंग शक्ति के अनुप्रयोग के लिए उल्लेखनीय रूप से प्रतिरोधी साबित हुई।
यह कोशिश करने की कमी के लिए नहीं था। ट्यूरिंग के साथ काम करने वाले हैरी हस्की, न्यू यॉर्क टाइम्स ने भाषाओं का अनुवाद करने में सक्षम “इलेक्ट्रिक ब्रेन” के रूप में बेदम तरीके से बिल बनाने के लिए अमेरिका लौट आए। यह परियोजना, जिसे संघीय सरकार ने निधि देने में मदद की, शीत युद्ध की अनिवार्यताओं से प्रेरित थी जिसने रूसी-से-अंग्रेज़ी अनुवाद को प्राथमिकता दी।
यह विचार कि शब्दों का एक-से-एक फैशन में अनुवाद किया जा सकता है – कोड-ब्रेकिंग की तरह – जल्दी से सिंटैक्स की जटिलताओं में आगे बढ़ गया, कभी भी अलग-अलग शब्दों में निहित अस्पष्टताओं पर ध्यान न दें। क्या “आग” का अर्थ आग है? रोजगार का अंत? बंदूक का ट्रिगर?
इन शुरुआती प्रयासों के पीछे अमेरिकियों में से एक वारेन वीवर ने माना कि संदर्भ महत्वपूर्ण था। यदि “बंदूक” के पास “आग” दिखाई देती है, तो कुछ निष्कर्ष निकाले जा सकते हैं। वीवर ने इस प्रकार के सहसंबंधों को “भाषा का सांख्यिकीय शब्दार्थ चरित्र” कहा, एक अंतर्दृष्टि जिसका आने वाले दशकों में महत्वपूर्ण प्रभाव होगा।
इस पहली पीढ़ी की उपलब्धियाँ आज के मानकों से बहुत कम हैं। अनुवाद शोधकर्ताओं ने खुद को भाषा की परिवर्तनशीलता से स्तब्ध पाया और 1966 तक, सरकार द्वारा प्रायोजित एक रिपोर्ट ने निष्कर्ष निकाला कि मशीनी अनुवाद एक गतिरोध था। फंडिंग वर्षों से सूख गई।
लेकिन दूसरों ने प्राकृतिक भाषा प्रसंस्करण, या एनएलपी के रूप में जाना जाने वाला शोध किया। इन शुरुआती प्रयासों ने यह प्रदर्शित करने की कोशिश की कि एक कंप्यूटर, जिसे अपनी प्रतिक्रियाओं को निर्देशित करने के लिए पर्याप्त नियम दिए गए हैं, कम से कम नकली खेल खेलने में बाधा डाल सकता है।
इन प्रयासों का एक विशिष्ट कार्यक्रम 1961 में शोधकर्ताओं के एक समूह का अनावरण किया गया था। “बेसबॉल” को डब किया गया, इस कार्यक्रम ने उपयोगकर्ताओं को “सामान्य अंग्रेजी में कंप्यूटर के प्रश्न पूछने और कंप्यूटर के सवालों के जवाब देने में सक्षम बनाने के लिए” पहला कदम “बनाया। सीधे। लेकिन एक पकड़ थी: उपयोगकर्ता केवल कंप्यूटर में संग्रहीत बेसबॉल के बारे में प्रश्न पूछ सकते थे।
इस चैटबॉट को जल्द ही डिजिटल तकनीक के जुरासिक युग में पैदा हुई अन्य कृतियों द्वारा देख लिया गया: SIR (सिमेंटिक इंफॉर्मेशन रिट्रीवल), जो 1964 में शुरू हुआ; एलिज़ा, जिसने एक देखभाल करने वाले चिकित्सक के रूप में सवालों के साथ बयानों का जवाब दिया; और SHRDLU, जिसने एक उपयोगकर्ता को कंप्यूटर को सामान्य भाषा का उपयोग करके आकृतियों को स्थानांतरित करने का निर्देश देने की अनुमति दी।
हालांकि कच्चे, इनमें से कई शुरुआती प्रयोगों ने नवाचारों को चलाने में मदद की कि मनुष्य और कंप्यूटर कैसे बातचीत कर सकते हैं – कैसे, उदाहरण के लिए, एक कंप्यूटर को किसी क्वेरी को “सुनने” के लिए प्रोग्राम किया जा सकता है, इसे चालू करें, और इस तरह से जवाब दें जो विश्वसनीय और विश्वसनीय लगे सजीव, सभी मूल क्वेरी में प्रस्तुत शब्दों और विचारों का पुन: उपयोग करते हुए।
दूसरों ने बेतरतीब ढंग से उत्पन्न नियमों और शब्दों के मिश्रण के साथ कविता और गद्य के मूल कार्यों को उत्पन्न करने के लिए कंप्यूटर को प्रशिक्षित करने की मांग की। 1980 के दशक में, उदाहरण के लिए, दो प्रोग्रामरों ने द पुलिसमैन्स बियर्ड इज़ हाफ कंस्ट्रक्ट प्रकाशित किया, जिसे पूरी तरह से कंप्यूटर द्वारा लिखी गई पहली पुस्तक के रूप में प्रस्तुत किया गया था।
लेकिन इन प्रदर्शनों ने एनएलपी की दुनिया में पनप रही एक और गहरी क्रांति को अस्पष्ट कर दिया। चूंकि कम्प्यूटेशनल शक्ति एक घातीय दर से बढ़ी और कार्यों का एक बढ़ता हुआ शरीर मशीन-पठनीय प्रारूप में उपलब्ध हो गया, यह तेजी से परिष्कृत मॉडल बनाना संभव हो गया जो शब्दों के बीच सहसंबंधों की संभावना को मापता था।
यह चरण, जिसे एक खाते ने “बड़े पैमाने पर डेटा को कोसने” के रूप में वर्णित किया, ने इंटरनेट के आगमन के साथ उड़ान भरी, जिसने ग्रंथों के बढ़ते हुए कोष की पेशकश की जिसका उपयोग “सॉफ्ट” संभाव्य दिशानिर्देशों को प्राप्त करने के लिए किया जा सकता है जो एक कंप्यूटर को सक्षम बनाता है। भाषा की बारीकियों को समझें। कठोर और तेज़ “नियमों” के बजाय जो हर भाषाई क्रमचय का अनुमान लगाने की मांग करते थे, नए सांख्यिकीय दृष्टिकोण ने अधिक लचीला दृष्टिकोण अपनाया, जो कि अधिक बार नहीं, सही था।
वाणिज्यिक चैटबॉट्स का प्रसार इस शोध से हुआ, जैसा कि अन्य अनुप्रयोगों में हुआ: मूल भाषा पहचान, अनुवाद सॉफ्टवेयर, सर्वव्यापी ऑटो-सही सुविधाएं और हमारे तेजी से वायर्ड जीवन की अन्य सामान्य विशेषताएं। लेकिन जैसा कि किसी कृत्रिम एयरलाइन एजेंट पर चिल्लाया है, वह जानता है कि निश्चित रूप से उनकी सीमाएं थीं।
अंत में, यह पता चला कि एक मशीन के लिए नकली खेल खेलने का एकमात्र तरीका मानव मस्तिष्क की नकल करना था, इसके अरबों परस्पर जुड़े न्यूरॉन्स और सिनैप्स के साथ। तथाकथित कृत्रिम तंत्रिका नेटवर्क उसी तरह से काम करते हैं, डेटा को स्थानांतरित करना और फीडबैक प्रक्रिया के माध्यम से समय के साथ तेजी से मजबूत कनेक्शन बनाना।
ऐसा करने की कुंजी एक और विशिष्ट मानवीय युक्ति है: अभ्यास, अभ्यास, अभ्यास। यदि आप एक तंत्रिका नेटवर्क को किताबें पढ़कर प्रशिक्षित करते हैं, तो यह उन वाक्यों को बनाना शुरू कर सकता है जो उन पुस्तकों में भाषा की नकल करते हैं। और यदि आपके पास तंत्रिका नेटवर्क पढ़ा है, कहें, जो कुछ भी लिखा गया है, वह वास्तव में संचार करने में वास्तव में अच्छा हो सकता है।
जो कम या ज्यादा है, जो दिल में है चैटजीपीटी. मंच को लिखित कार्य के विशाल कोष पर प्रशिक्षित किया गया है। दरअसल, विकिपीडिया की संपूर्णता 1% से भी कम पाठों का प्रतिनिधित्व करती है, जो मानव भाषण की नकल करने की अपनी खोज में फहराया गया है।
इस प्रशिक्षण के लिए धन्यवाद, चैटजीपीटी नकल के खेल में यकीनन जीत सकता है। लेकिन रास्ते में कुछ दिलचस्प हुआ है। ट्यूरिंग के मानकों के अनुसार, अब मशीनें सोच सकती हैं। लेकिन इस उपलब्धि को हासिल करने का एकमात्र तरीका कठोर नियमों वाली मशीनों की तरह कम और इंसानों की तरह अधिक बनना है।
ChatGPT द्वारा उत्पन्न सभी गुस्से के बीच यह विचार करने योग्य है। नक़ल करना चापलूसी का सही रूप है। लेकिन क्या यह मशीनों से डरने की जरूरत है, या खुद से?
© 2023 ब्लूमबर्ग एल.पी