स्टार्टअप, जिसने लोकप्रिय स्टेबल डिफ्यूजन एआई इमेज जनरेटर का सह-निर्माण किया है, ने एक एआई मॉडल जारी किया है जो किसी भी पाठ विवरण को लेता है – जैसे “आकाश में उड़ने वाले कछुए” – और मिलान करने वाले वीडियो फुटेज के तीन सेकंड उत्पन्न करता है।
सुरक्षा और व्यावसायिक कारणों का हवाला देते हुए, रनवे मॉडल को व्यापक रूप से शुरू करने के लिए जारी नहीं कर रहा है, न ही यह ओपन-सोर्स की तरह होगा स्थिर प्रसार. टेक्स्ट-टू-वीडियो मॉडल, Gen-2 डब किया गया, प्रारंभ में पर उपलब्ध होगा कलह रनवे वेबसाइट पर प्रतीक्षा सूची के माध्यम से।
का उपयोग करते हुए ऐ टेक्स्ट इनपुट से वीडियो बनाना कोई नई बात नहीं है। मेटा प्लेटफार्म और गूगल दोनों ने पिछले साल के अंत में टेक्स्ट-टू-वीडियो एआई मॉडल पर शोध पत्र जारी किए। हालांकि, अंतर यह है कि रनवे के टेक्स्ट-टू-वीडियो एआई मॉडल को आम जनता के लिए उपलब्ध कराया जा रहा है, रनवे के मुख्य कार्यकारी अधिकारी क्रिस्टोबल वालेंज़ुएला ने कहा।
रनवे को उम्मीद है कि क्रिएटिव और फिल्म निर्माता उत्पाद का उपयोग करेंगे, वालेंज़ुएला ने कहा।
पिछले महीने चिप बनाने वाली दिग्गज कंपनी क्वालकॉम प्रदर्शन किया स्टेबल डिफ्यूजन 1.5, एआई इमेज जनरेटर, एक पर चल रहा है एंड्रॉयड मोबाइल वर्ल्ड कांग्रेस से पहले बिना नेटवर्क एक्सेस वाले हैंडसेट (एमडब्ल्यूसी) 2023। क्वालकॉम के अनुसार, कंपनी की एआई टूल की तैनाती, जिसके लिए आमतौर पर बहुत अधिक कंप्यूटिंग शक्ति की आवश्यकता होती है, कुछ सेकंड में छवियां बनाने में सक्षम है। कंपनी ने स्मार्टफोन पर स्थानीय रूप से चलने के लिए AI टूल को ऑप्टिमाइज़ करने के लिए उपयोग किए जाने वाले स्मार्टफोन हार्डवेयर के विवरण का खुलासा नहीं किया।
लोकप्रिय जनरेटिव AI टूल चलाने के लिए बहुत अधिक कंप्यूटिंग शक्ति का उपभोग करने के लिए जाना जाता है, यही वजह है कि कई सेवाएं जो इस पर निर्भर करती हैं, इन गतिविधियों को उपयोगकर्ता के स्मार्टफोन या कंप्यूटर के बजाय बड़े सर्वर पर करती हैं।
© थॉमसन रॉयटर्स 2023