गूगल ने जेमिनी एआई मॉडल के लाइव API में ऑडियो मॉडल किया शामिल , जानें डिटेल्स
आप सभी गूगल gemini का इस्तेमाल तो करते ही होंगे लेकिन क्या आप यह जानते कि अभी हाल ही में उसमें एक अपडेट आया है जिसके वजह से अब आप बोलकर भी आसानी से बातचीत कर सकते हैं।
गूगल ने जेमिनी एआई मॉडल के लाइव API में ऑडियो मॉडल किया शामिल , जानें डिटेल्स
गूगल ने हाल ही में अपने जेमिनी एआई मॉडल के लाइव एपीआई में एक शानदार अपडेट दिया है जिसमें ऑडियो मॉडल को शामिल किया गया है। अब आप इसमें पहले से भी बेहतर तरीके से बातचीत कर पाएंगे और आपका काम पहले से भी ज्यादा आसान हो जाएगा इसके बारे में डिटेल्स में हम आपको इस आर्टिकल में बताते हैं।
ऑडियो मॉडल में क्या है खास
यह ऑडियो मॉडल जेमिनी 2.5 फ्लैश पर आधारित है जो लाइव एपीआई के जरिए नैचुरल साउंडिंग वॉइस जेनरेट करता है। यह मॉडल 30 से ज्यादा हाई-डेफिनिशन वॉइस ऑप्शंस और 24 से अधिक भाषाओं का सपोर्ट करता है। यह पुराने टेक्स्ट-टू-स्पीच सिस्टम्स से अलग है और यह सीधे ऑडियो आउटपुट पैदा करता है।
क्या आप WhatsApp पर न्यूज़ अपडेट पाना चाहते हैं?
WhatsApp पर ताज़ा और भरोसेमंद न्यूज़ अपडेट तुरंत पाएं। अभी जुड़ें और हर खबर सबसे पहले पढ़ें।
Follow News Tv India on WhatsApp
लाइव एपीआई का मज़ा
जेमिनी लाइव एपीआई पहले से ही रीयल-टाइम वॉइस और वीडियो इंटरैक्शंस को सपोर्ट करता था लेकिन इस नए मॉडल के साथ यह और स्ट्रांग हो गया है। यह अपडेट प्रीव्यू मोड में उपलब्ध है जो डेवलपर्स को टेस्ट करने का मौका देता है। गूगल का कहना है कि यह बदलाव वॉइस एजेंट्स को और बेहतरीन बनाता है।
पहले से ज्यादा लगेगा नेचुरल
अब जेमिनी मॉडल बातचीतों को और ज्यादा नेचुरल बना सकता है। यह इंटरप्शंस, पॉज और साइड कन्वर्सेशंस को बेहतर तरीके से हैंडल करता है। इससे उपयोगकर्ता को लगता है जैसे वे किसी दोस्त से बात कर रहे हों। इससे यूजर जल्दी बोर भी नहीं होता है और उसे बात करने में मजा भी आता है।
READ MORE - AOC Gaming Monitor AG326UCG से छाई गेमर्स में खुशी की लहर मिलेंगे कई गेमिंग मोड्स
अफेक्टिव डायलॉग फीचर
इस मॉडल की सबसे रोचक फीचर है अफेक्टिव डायलॉग जो यूजर की भावनाओं को पहचानकर रिएक्शन देता है। अगर आप गुस्से में बोलें या खुशी से तो जेमिनी उसी के अनुसार टोन एडजस्ट कर लेगा। यह फीचर नैचुरल कन्वर्सेशंस को गहराई देता है जैसे कि मॉडल वाकई में आपकी फीलिंग्स को समझ रहा हो।
प्रोएक्टिव ऑडियो फीचर
प्रोएक्टिव ऑडियो फीचर मॉडल को बैकग्राउंड नॉइज या इररेलेवेंट बातों को इग्नोर करने की कैपेसिटी देता है। यह केवल तभी रिस्पॉन्ड करता है जब बातचीत सीधे जुड़ी हो। इससे फालतू के इंटरप्शंस रुक जाते हैं और कन्वर्सेशन ज्यादा फोकस्ड रहती है। अगर आप शोरगुल वाले माहौल में है तो भी आपको बहुत ही बेहतर रिस्पॉन्स मिलेगा।
मिलेगा मल्टीलिंगुअल सपोर्ट
नया मॉडल 24 से ज्यादा भाषाओं में सीधे काम करता है। आप हिंदी में शुरू करें और अचानक इंग्लिश स्विच कर दें जेमिनी बिना रुके फॉलो कर लेगा। यह फीचर ग्लोबल ऐप्स के लिए बढ़िया है जहां यूजर्स अलग-अलग भाषाओं में बात करते हैं। ट्रांसक्रिप्शन की एक्यूरेसी भी बेहतर हो गई है जिससे गलतियां कम होती हैं।
लाइव डाटा मिलेगा अब आसान से
इस अपडेट के साथ फंक्शन कॉलिंग को और मजबूत किया गया है जो मॉडल को रीयल-टाइम डेटा सोर्सेस जैसे गूगल सर्च से जोड़ता है। डेवलपर्स अब कस्टम टूल्स इंटीग्रेट कर सकते हैं जिससे कन्वर्सेशंस ज्यादा प्रैक्टिकल बन जाती हैं।
लायेगा कई एप्लीकेशंस में बदलाव
यह मॉडल वर्चुअल असिस्टेंट्स, एजुकेशनल टूल्स और कस्टमर सर्विस बॉट्स के लिए गेम-चेंजर साबित हो सकता है। यह कई फील्ड के लिए बहुत ही ज्यादा फायदेमंद साबित होगा। फिर चाहे वह हेल्थ केयर का फील्ड हो या फिर किसी भी स्टूडेंट के पढ़ाई का फील्ड हो।
READ MORE - सोनी ने लिमिटेड एडिशन ड्यूअलसेंस वायरलेस कंट्रोलर लॉन्च 3 अक्टूबर से होंगे प्री-ऑर्डर शुरू