📅 Monday, February 16, 2026 🌡️ Live Updates
टेक्नोलॉजी

AI इम्पैक्ट समिट 2026: गूगल जेमिनी और ChatGPT को टक्कर देने आया भारत का ‘सर्वम एआई’, जानिए क्या है खास

सर्वम: भारत का एआई स्टार्टअप क्षेत्रीय भाषा समर्थन के साथ चैटजीपीटी, गूगल जेमिनी को चुनौती देने के लिए पूरी तरह तैयार है

AI इम्पैक्ट समिट 2026:भारत का एआई स्टार्टअप क्षेत्रीय भाषा समर्थन के साथ चैटजीपीटी, गूगल जेमिनी को चुनौती देने के लिए पूरी तरह तैयार है

नई दिल्ली, 16 फरवरी 2026 (टेक डेस्क): राष्ट्रीय राजधानी में आज ‘एआई इम्पैक्ट समिट 2026’ का भव्य उद्घाटन हुआ। इस सम्मेलन का मुख्य केंद्र बिंदु आर्टिफिशियल इंटेलिजेंस (AI) के क्षेत्र में भारत की तेजी से बढ़ती प्रगति रही। इस दौरान जिस एक नाम ने सबसे ज्यादा सुर्खियां बटोरीं, वह है बेंगलुरु स्थित स्टार्टअप सर्वम एआई‘ (Sarvam AI)। यह स्वदेशी प्लेटफॉर्म अब ओपनएआई के चैटजीपीटी (ChatGPT) और गूगल के जेमिनी (Gemini) जैसे वैश्विक दिग्गजों को सीधी टक्कर देने के लिए तैयार है।

अगस्त 2023 में स्थापित सर्वम एआई ने स्पष्ट कर दिया है कि उसका लक्ष्य केवल एक और चैटबॉट बनाना नहीं है, बल्कि भारत की भाषाई विविधता को ध्यान में रखते हुए मूलभूत एआई मॉडल (Foundation AI Models) विकसित करना है।

(छवि स्रोत: सर्वम एआई)यूनिवर्सल एआई

विदेशी चैटबॉट्स से कैसे अलग है ‘सर्वम’?

जहां वैश्विक तकनीकी दिग्गज (Global Tech Giants) मुख्य रूप से अंग्रेजी और पश्चिमी बाजारों को ध्यान में रखकर अपने मॉडल विकसित कर रहे हैं, वहीं सर्वम एआई ने ‘इंडिया फर्स्ट’ की रणनीति अपनाई है।

  • भाषाई विविधता: सर्वम एआई भारत की सभी 22 अनुसूचित भाषाओं का समर्थन करने का दावा करता है। यह केवल अनुवाद नहीं करता, बल्कि भारतीय भाषाओं के जटिल उच्चारण, क्षेत्रीय बोलियों (Dialects) और लिपियों की बारीकियों को समझने में सक्षम है।

  • स्थानीय समाधान: इसका उद्देश्य उन लाखों भारतीयों के लिए डिजिटल टूल बनाना है जो अंग्रेजी में सहज नहीं हैं, जिससे तकनीकी लाभ केवल मेट्रो शहरों तक सीमित न रहे।

भारतीय भाषाओं पर गहरा फोकस

सर्वम एआई का कहना है कि यह सभी 22 अनुसूचित भारतीय भाषाओं का समर्थन करता है। यह बहुत बड़ी बात है. अधिकांश वैश्विक एआई उपकरण अभी भी क्षेत्रीय बोलियों, “छोटी” भाषाओं और भारत भर में लोगों द्वारा उपयोग किए जाने वाले पेचीदा उच्चारणों पर आधारित हैं। भारतीय लिपियों, लहजों और प्रत्येक भाषा की छोटी-छोटी विचित्रताओं को सामने और केंद्र में रखकर, सर्वम एआई यह सुनिश्चित करने की कोशिश कर रहा है कि एआई केवल अंग्रेजी बोलने वालों के लिए नहीं, बल्कि सभी के लिए है।

इंडिया टीवी - सर्वम एआई

(छवि स्रोत: सर्वम एआई)यूनिवर्सल एआई

गेम-चेंजर टूल्स: सर्वम विजन और बुलबुल V3

समिट के दौरान कंपनी ने अपनी दो प्रमुख तकनीकों का प्रदर्शन किया, जो इसे बाजार में अलग खड़ा करती हैं:

1. सर्वम विजन (Sarvam Vision): यह 3 अरब पैरामीटर वाला एक शक्तिशाली ‘विजन-लैंग्वेज मॉडल’ है।

  • क्षमता: यह छवियों से टेक्स्ट पढ़ने (OCR), कैप्शन बनाने और जटिल चार्ट्स या तालिकाओं को समझने में सक्षम है।

  • उपयोग: कंपनी का दावा है कि दस्तावेज़ों को समझने (Document Understanding) में यह मॉडल कई शीर्ष वैश्विक मॉडलों को भी पछाड़ देता है। यह सरकारी रिकॉर्ड, स्कूलों और व्यवसायों के पुराने दस्तावेजों को डिजिटाइज़ करने में क्रांतिकारी साबित होगा।

2. बुलबुल V3 (Bulbul V3): यह सर्वम का अत्याधुनिक ‘टेक्स्ट-टू-स्पीच’ (TTS) मॉडल है।

  • विशेषता: यह रोबोटिक आवाज़ के बजाय मानवीय भावनाओं (Expressive Speech) के साथ बात करता है। इसमें 35 से अधिक वॉयस ऑप्शन्स हैं।

  • विस्तार: वर्तमान में यह 11 भारतीय भाषाओं को सपोर्ट करता है, जिसे जल्द ही सभी 22 भाषाओं तक बढ़ाया जाएगा। इसका उपयोग कॉल सेंटर, वर्चुअल असिस्टेंट और एडटेक (EdTech) में बड़े पैमाने पर किया जा सकता है।

सर्वम विजन क्या है?

सर्वम की असाधारण परियोजनाओं में से एक सर्वम विजन है। यह चीज़ एक दृष्टि-भाषा मॉडल है जिसके अंतर्गत तीन अरब पैरामीटर हैं। यह बहुत कुछ करता है – छवियों से पाठ पढ़ना (ओसीआर), कैप्शन के साथ आना, दृश्य पाठ को पहचानना, चार्ट का पता लगाना और यहां तक ​​कि जटिल तालिकाओं को पार्स करना। यह दस्तावेज़ डिजिटलीकरण में भी बहुत अच्छा है।

कंपनी का कहना है कि सर्वम विजन केवल अंग्रेजी भाषा के लिए अत्याधुनिक ओसीआर को मात देता है और दस्तावेजों को समझने में कुछ शीर्ष वैश्विक मॉडलों से भी बेहतर प्रदर्शन करता है। लेकिन बड़ी बात यह है कि भारतीय भाषाओं के डिजिटलीकरण के लिए इसका क्या मतलब है। यह सरकारी रिकॉर्ड, स्कूलों और व्यवसायों जैसी चीज़ों के लिए बहुत बड़ी बात है, जिनके पास सभी प्रकार की स्थानीय भाषाओं में कागजी कार्रवाई का ढेर है।

बुलबुल V3 क्या है?

यहाँ एक और फ्लैगशिप है: बुलबुल V3। यह सर्वम का उन्नत टेक्स्ट-टू-स्पीच (टीटीएस) मॉडल है। यह प्राकृतिक, अभिव्यंजक भाषण का वादा करता है, उत्पादन के लिए बॉक्स से बाहर काम करता है, और 35 से अधिक आवाज़ों के साथ आता है। फिलहाल, इसमें 11 भारतीय भाषाएं शामिल हैं, जल्द ही सभी 22 भाषाओं को शामिल करने की योजना है।

शुरुआती समीक्षाओं में कहा गया है कि बुलबुल V3 श्रोताओं के बीच उच्च स्कोर करता है और अन्य विकल्पों की तुलना में कम गलतियाँ करता है। सर्वम इसे वॉयस एआई में एक वास्तविक दावेदार के रूप में रखता है, विशेष रूप से वर्चुअल असिस्टेंट, कॉल सेंटर, एडटेक और सार्वजनिक सेवाओं जैसी चीजों के लिए – सभी भारतीय आवाज़ों और भाषाओं के लिए तैयार हैं।

सर्वम एआई- भारतीय बाजार के लिए एक महत्वपूर्ण विकास

इसके मूल में, सर्वम एआई भारत की वास्तविक, रोजमर्रा की जरूरतों के लिए एआई को उपयोगी और सुलभ बनाना चाहता है। चैटजीपीटी और जेमिनी वैश्विक समाधानों का पीछा कर रहे हैं, लेकिन सर्वम भारत की बहुभाषी दुनिया के लिए नट और बोल्ट का निर्माण कर रहा है।

भारत के डिजिटल अंतर को कम करने की पहल

सर्वम एआई का दृष्टिकोण भारत के डिजिटल अंतर (Digital Divide) को पाटना है। कंपनी का फोकस चार प्रमुख क्षेत्रों पर है:

  1. भारतीय भाषाओं में दस्तावेजों का सटीक डिजिटलीकरण।

  2. हर क्षेत्र के लिए अनुकूल वॉयस एआई टूल्स।

  3. भारतीय लिपियों को संभालने वाले लैंग्वेज मॉडल।

  4. सरकार, शिक्षा और स्थानीय व्यवसायों के लिए विशेष एआई समाधान।

विशेषज्ञों का मानना है कि सर्वम एआई का उदय भारतीय स्टार्टअप इकोसिस्टम के लिए एक महत्वपूर्ण मोड़ है, जो यह साबित करता है कि भारत अब एआई का केवल उपभोक्ता नहीं, बल्कि निर्माता भी है।

Leave a Reply

Your email address will not be published. Required fields are marked *

Link Copied!