Openai मल्टीमॉडल एआई की सीमाओं को आगे बढ़ाने के साथ, यह नया अपडेट एक प्रमुख छलांग का प्रतिनिधित्व करता है कि उपयोगकर्ता कैसे बातचीत कर सकते हैं और विज़ुअल्स को उत्पन्न कर सकते हैं, राइट विथिन चैट।
Openai के सीईओ सैम अल्टमैन ने अपने लोकप्रिय खोज इंजन, CHATGPT की छवि-जनरेशन क्षमता के लिए एक प्रमुख उन्नयन की घोषणा की है, जो पहले महत्वपूर्ण वृद्धि को आवक में चिह्नित करता है। नवीनतम सुविधा को ‘चैट में छवियां’ कहा जाएगा, जो उपयोगकर्ताओं को सीधे चैटबॉट के भीतर उच्च गुणवत्ता वाले चित्र बनाने में सक्षम बनाता है।
उपलब्ध खाता CHATGPT प्लस, प्रो, टीम और मुफ्त योजनाएं, नए अपडेट को Openai के सबसे उन्नत छवि-जनरेशन मॉडल, GPT-4O के रूप में पेश किया गया है, जो Noch अब डल-ई 3 को प्लेटफ़ॉर्म के प्राथमिक एआई-संचालित छवि निर्माता के रूप में देता है।
कैसे GPT-4O छवि पीढ़ी में सुधार करता है
डल-ई 3 के विपरीत, जो एक सेप्ट डिफ्यूजन ट्रांसफॉर्मर मॉडल के रूप में कार्य करता है, जीपीटी -4 ओ एक ऑल-इन एआई सिस्टम है जिसे टेक्स्ट, इमेज और कोड को उसी मॉडल के साथ संभालने के लिए प्रशिक्षित किया गया है। यह एकीकृत दृष्टिकोण एआई को छवियों का उत्पादन करने में सक्षम बनाता है:
- अधिक सटीकता और विस्तार
- कई पुनरावृत्तियों में बेहतर स्थिरता
- संकेतों की प्रासंगिक समझ में वृद्धि
Altman ने समझाया कि जबकि GPT-4O छवियों को उत्पन्न करने में थोड़ा अधिक समय लेता है, अतिरिक्त प्रसंस्करण समय अधिक प्राथमिकता और यथार्थवादी दृश्य में परिणाम देता है।
नई सुविधाएँ और क्षमताएं
Openai के अनुसार, GPT-4O के छवि मॉडल को पाठ और छवियों के एक विशाल डेटासेट पर प्रशिक्षित किया गया था, जिससे यह भाषा और दृश्य के बीच जटिल संबंधों को समझने की अनुमति देता है। कुछ प्रमुख सुधारों में शामिल हैं:
- इंटरैक्टिव इमेज एडिटिंग-यूजर्स वास्तविक समय की चैट के माध्यम से गतिशील रूप से छवियों को परिष्कृत कर सकते हैं, पृष्ठभूमि और वस्तुओं जैसे तत्वों को सरल संकेतों के साथ समायोजित कर सकते हैं।
- संदर्भ-जागरूक संशोधन-GPT-4O मौजूदा छवियों को संपादित कर सकते हैं, लोगों के साथ शामिल कर सकते हैं, अग्रभूमि और पृष्ठभूमि तत्वों के लिए मूल रूप से एकीकृत समायोजन।
- बेहतर ऑब्जेक्ट हैंडलिंग-व्हाईन अन्य एआई सिस्टम एक दृश्य में 5-8 ऑब्जेक्ट्स को सटीक रूप से प्रस्तुत करने के साथ संघर्ष करते हैं, जीपीटी -4 ओ 10-20 को बेहतर रूप से उछाले हुए स्प्रूव्ड स्प्लोर जागरूकता और खाद के साथ संभाल सकता है।
उदाहरण के लिए, यदि आप एक वीडियो गेम चरित्र को डिजाइन कर रहे हैं, तो GPT-4O सब्सरर्स है कि चरित्र का डिज़ाइन कई शोधन के दौरान स्थिरता स्थिरता रहता है, एक अधिक सुविधाजनक रचनात्मक प्रक्रियाओं की पेशकश करता है।
छवि और पाठ निर्माण के लिए एक चालाक एआई
पाठ और दृश्य समझ को गहराई से एकीकृत करके, GPT-4O CHATGPT के समग्र Capabilits को बढ़ाता है, जिससे यह न केवल एक बेहतर छवि क्रेटर बन जाता है, बल्कि डिजाइनरों, सामग्री रचनाकारों और डेवलपर्स के लिए अधिक बुद्धिमान भी है।
ALSO READ: Microsoft Windows 11 25H2 परीक्षण शुरू होता है: क्या उम्मीद है?
ALSO READ: OnePlus 13T 6,200mAh की बैटरी के साथ लॉन्च करने के लिए सेट, iPhone 16 को फिर से शुरू करें: क्या उम्मीद है?