नोवा सोनिक और नए पूर्वावलोकन नोवा एक्ट ब्राउज़र मॉडल के साथ, अमेज़ॅन बुद्धिमान सहायकों और एआई-चालित अनुप्रयोगों के विकसित परिदृश्य में नेतृत्व करने के अपने इरादे का संकेत दे रहा है।
अमेज़ॅन ने नोवा सोनिक को पेश किया है, जो एक शक्तिशाली नया जेनेक्टिव एआई वॉयस मॉडल है जो मानव जैसी वार्तालाप कैपबिलिट्स को अपने पारिस्थितिकी तंत्र में लाता है। Openai और Google से प्रतिद्वंद्वी वॉयस मॉडल के लिए डिज़ाइन किया गया, नोवा सोनिक तेजी से प्रतिक्रिया समय, बेहतर भाषण मान्यता और अधिक प्राकृतिक-साउंडिंग इंटरैक्शन का वादा करता है।
प्राकृतिक बातचीत के लिए बनाया गया
नोवा सोनिक एआई-संचालित सहायकों के विकास के लिए अमेज़ॅन की सीधी प्रतिक्रिया है। पुराने एलेक्सा मॉडल के विपरीत, जो अक्सर रोबोटिक महसूस करते थे, नोवा सोनिक मूल रूप से आवाज को संसाधित कर सकता है और चिकनी, मानव-जैसे उत्तर प्रदान कर सकता है। यह उपयोगकर्ता के ठहराव और रुकावटों से संकेत लेता है, जिससे संवाद अधिक तरल होते हैं।
अमेज़ॅन के अनुसार, नोवा सोनिक ने 1.09 सेकंड की प्रतिक्रिया विलंबता को प्राप्त किया, ओपनई के जीपीटी -4 ओ के 1.18 सेकंड को हराया, और उपयोगकर्ताओं को नवीकरण में या जब वे थे, तब उपयोगकर्ताओं को समझ सकते हैं।
अब बेडरॉक के माध्यम से उपलब्ध है
मॉडल Amazon बेडरॉक के माध्यम से डेवलपर्स को उपलब्ध कराया जा रहा है, जो एंटरप्राइज़ AI अनुप्रयोगों के निर्माण के लिए कंपनी का मंच है। नोवा सोनिक एक द्वि-दिशात्मक स्ट्रीमिंग एपीआई का उपयोग करता है, जो उपयोगकर्ताओं और ऐप्स के बीच वास्तविक समय, बैक-ऑन-फॉर संचार को सक्षम करता है।
अमेज़ॅन नोवा सोनिक को सबसे अधिक लागत-कुशल वॉयस एआई मॉडल के रूप में भी बताता है, जो ओपनईआई के जीपीटी -4 ओ की तुलना में 80% लागत बचत की पेशकश करता है।
अगली-जीन एलेक्सा+ को पावर देना
नोवा सोनिक के कुछ हिस्सों में एलेक्सा+, अमेज़ॅन के अपग्रेड किए गए डिजिटल सहायक हैं। रोहित प्रसाद, एसवीपी और अमेज़ॅन में एजीआई के प्रमुख वैज्ञानिक, ने कहा कि मॉडल ऑर्केस्टिएशन सिस्टम के साथ अनुभव के वर्षों का निर्माण करता है जो एलेक्सा रूट कमांड के लिए उपयोग करता है, ऐप्स में वास्तविक-टेक कार्रवाई करता है।
उन्होंने समझाया कि नोवा सोनिक उपयोगकर्ता के इरादे की व्याख्या करने और कार्य के लिए सही उपकरण का चयन करने में एक्सेल करता है, चाहे वह ऑनलाइन जानकारी प्राप्त कर रहा हो, मालिकाना डेटा तक पहुँच रहा हो, या तीसरे-कमेंटरी सेवाओं का संचालन कर रहा हो।
श्रेष्ठ सटीकता भाषाओं को प्राप्त करता है
बेंचमार्क परीक्षणों में, नोवा सोनिक ने बहुभाषी लाइब्रिसपेक डेटा पर अंग्रेजी, फ्रेंच, जर्मन, स्पेनिश और इतालवी में केवल 4.2% का एक शब्द त्रुटि दर (WER) हासिल की। अमेज़ॅन के अनुसार, मल्टी-स्पीकर, शोर वातावरण, नोवा सोनिक ने GPT-4O को 46.7% से बाहर कर दिया।
AGI के लिए अमेज़ॅन की दृष्टि का हिस्सा
नोवा सोनिक आर्टिफिशियल जनरल इंटेलिजेंस (एजीआई) विकसित करने के लिए अमेज़ॅन की व्यापक योजना का एक महत्वपूर्ण हिस्सा है -आई सिस्टम कुछ भी करने में सक्षम है जो एक मानव कंप्यूटर पर कर सकता है। प्रसाद ने कहा कि अमेज़ॅन के भविष्य के रोडमैप में ऐसे मॉडल शामिल हैं जो छवि, वीडियो, आवाज, आवाज और संवेदी डेटा जैसे विभिन्न तौर -तरीकों की व्याख्या और उत्पन्न कर सकते हैं।