गूगल का एनुअल डेवलपर कॉन्फ्रेंस ‘गूगल I/O 2024’ इवेंट मंगलवार (14 मई) को हुआ। गूगल ने इस साल इस इवेंट में कोई भी नया डिवाइस लॉन्च नहीं किया। कंपनी का मुख्य फोकस AI फीचर्स पर रहा। कंपनी के CEO सुंदर पिचाई ने इवेंट की शुरुआत की। उन्होंने कहा, ‘जेमिनी 1.5 प्रो को अब ग्लोबल लेवल पर डेवलपर्स और कंज्यूमर्स के लिए अवेलेबल कर दिया गया है। इसके साथ ही गूगल ने AI पॉवर्ड सर्च, ऑन-डिवाइस AI, रियल-टाइम स्कैम प्रोटेक्शन, AI वीडियो मॉडल – VEO और इमेजन 3 सहित कई फीचर्स पेश किए।
आइए इस इवेंट में पेश किए गए 6 खास फीचर्स के बारे में जानते हैं…
1. AI-पॉवर्ड सर्च: मैथ और फिजिक्स के सवाल सॉल्व कर सकेंगे
एंड्रॉएड के सर्किल टु सर्च फीचर को गूगल एनहैंस कर रहा है। इस फीचर के जरिए आप एंड्रॉएड फोन की स्क्रीन पर किसी भी चीज को सर्किल कर गूगल पर सर्च कर सकते थे। अब इस फीचर के जरिए मैथ-फिजिक्स की प्रॉब्लम्स को हल करने के तरीके पर इंस्ट्रक्शन भी मिल सकेंगे।
2. रियल-टाइम कॉल स्कैम प्रोटेक्शन: फ्रॉड से बचने में मदद मिलेगी
गूगल वर्तमान में एक ऐसे फीचर का टेस्ट कर रहा है जो यूजर्स को संभावित स्कैम के बारे में सचेत करता है। यदि आपको कोई स्कैम कॉल आता है, तो सिस्टम आपको रियल-टाइम में पहचान कर वॉर्निंग दे सकता है, जिससे आपको संभावित धोखाधड़ी से बचने में मदद मिलती है।
3. जनरेटिव AI वीडियो मॉडल: टेक्स्ट प्रॉम्प्ट से वीडियो बना सकता है
गूगल ने जनरेटिव AI वीडियो मॉडल Veo पेश किया। ये गूगल का सबसे एडवांस्ड टेक्स्ट टु वीडियो जेनरेशन मॉडल है, जो HD क्वालिटी में सिनेमैटिक वीडियो जनरेट कर सकता है। कंपनी इस मॉडल के साथ प्रयोग के लिए कई फिल्म मेकर्स और क्रिएटर्स को आमंत्रित कर रही है।
इससे पहले ओपन AI ने ऐसा एक मॉडल ‘सोरा’ पेश किया था जो 60 सेकेंड लंबे वीडियो जनरेट कर सकता है। वहीं गूगल का दावा है कि उसका मॉडल 60 सेकेंड से भी ज्यादा लंबे वीडियो जनरेट कर सकता है। Veo एरियल शॉट और टाइमलैप्स जैसे शब्दों को भी समझता है।
4. आस्क फोटोज: AI की मदद से आपकी फोटोज सर्च करता है
गूगल का नया फीचर, आस्क फोटोज जल्द शुरू होगा। इसके बाद इसमें एडिशनल कैपेबिलिटीज भी ऐड होंगी। यह फीचर गूगल फोटोज को “मुझे दिखाओ कि मेरी बेटी की स्विमिंग प्रोग्रेस कैसे हुई” जैसे सवालों के जवाब देने की सुविधा देता है। इसके लिए वह जेमिनी का इस्तेमाल करके फोटो खोजता है और उनका कलेक्शन बनाता है।
5. इमेजन 3: टेक्स्ट-टु-इमेज जनरेटर का एक अपडेटेड वर्जन
कंपनी ने इमेजेन 3 को भी अनवील किया, जो टेक्स्ट-टु-इमेज जनरेटर का एक अपडेटेड वर्जन है। पिछले वर्जन की तुलना में, Imagen 3 बहुत कम आर्टिफैक्ट के साथ फोटो रिअलिस्टिक बनाने में सक्षम है। यह वर्तमान में ImageFX में एक प्राइवेट प्रीव्यू के रूप में क्रिएटर्स के लिए उपलब्ध है और जल्द ही गूगल के प्लेटफॉर्म वर्टेक्स AI पर आएगा।
इमेजेन 3 नेचुरल लैंगवेज, आपके प्रॉम्प्ट के पीछे के इंटेंट को बेहतर ढंग से समझता है। इमेजन 3 के लिए साइन-अप आज से ImageFX पर शुरू हो रहे हैं और यह जल्द ही डेवलपर्स और एंटरप्राइज कस्टमर्स के लिए उपलब्ध होगा।
6. प्रोजेक्ट अस्त्र की घोषणा: AI असिस्टेंट दैनिक जीवन में मदद करेगा
गूगल ने अस्त्र को “फ्यूचर ऑफ AI असिस्टेंट” कहा। एक यूनिवर्सल AI एजेंट जो दैनिक जीवन में मदद करेगा। आप फोन कैमरा ऑन करने के बाद उससे किसी भी चीज को पॉइंट कर उसके बारे में डिटेल ले सकते हैं। ये आपको तुरंत उसकी डिटेल बताएगा। गूगल डीपमाइंड के CEO डेमिस हसाबी ने कहा कि अस्त्र के साथ बातचीत की स्पीड और क्वालिटी नेचुरल लगती है।
जेमिनी AI 68 लैंग्वेज को सपोर्ट करेगा
गूगल ने अपने लेटेस्ट AI जेमिनी 1.5 प्रो को डॉक्स, शीट्स, स्लाइड्स, ड्राइव और जीमेल जैसे वर्कस्पेस ऐप्स के दाहिनी तरफ साइडबार में इंटीग्रेट किया है। इस वर्चुअल असिस्टेंस के पास आपकी सारी सेव की गई डिटेल्स तक पहुंच होगी। इसके अलावा गूगल मीट में जेमिनी AI 68 लैंग्वेज को सपोर्ट करेगा।
इवेंट में यह ऐलान भी हुए…
- गूगल जेमिनी में आने वाले महीनों में नया लर्निंग कोच जेम लर्न पेश किया जाएगा। यह स्टेप बाय स्टेप स्टडी गाइडेंस प्रोवाइड करता है, जो आपको केवल उत्तर देने के बजाय समझने में मदद करता है।
- मल्टीमॉडल कैपेबिलिटीज वाला जेमिनी नैनो इस साल के अंत में पिक्सेल डिवाइसेज में मिलेगा।
- गूगल ने नए विजन लैंग्वेज ओपन मॉडल Pali Gemma 2 की घोषणा की, जो अगले महीने जून में आएगा।
- गूगल वर्कस्पेस में जेमिनी-पावर्ड फीचर्स मिलेंगे। अल्फाबेट ने गूगल वर्कस्पेस के लिए जेमिनी-पावर्ड साइडबार की घोषणा की।
- गूगल सर्च में अब AI ओवरव्यू के साथ AI-पावर्ड सर्च रिजल्ट मिलेंगे, जो डिटेल्ड रिसर्च ऑफर करेगा।
- गूगल ने लो लेटेंसी एरियाज के लिए जेमिनी 1.5 फ्लैश लॉन्च किया, जो 1 मिलियन टोकन द्वारा पावर्ड है।
- CEO सुंदर पिचाई ने कहा कि गूगल एक दशक से ज्यादा समय से AI में निवेश कर रहा है। कंपनी को AI में आगे कई अवसर दिखाई दे रहे हैं।
- जेमिनी 1.5 प्रो को 1 मिलियन टोकन और लॉन्ग कॉन्टेक्स्ट वीडियो के साथ अपडेट किया गया है, जो 35+ लैंग्वेज में अवेलेबल है।
- जेमिनी 1.5 प्रो को अब ग्लोबल लेवल पर डेवलपर्स के लिए अवेलेबल कर दिया गया है। कंज्यूमर्स को एडवांस्ड जेमिनी में 1 मिलियन की जगह 2 मिलियन टोकन मिलेंगे।
शोरलाइन एम्फीथिएटर में आयोजित किया गया गूगल का यह इवेंट
गूगल का यह इवेंट कैलिफोर्निया के माउंटेन व्यूज में स्थित शोरलाइन एम्फीथिएटर में आयोजित किया गया। भारतीय समयानुसार यह इवेंट रात 10.30 बजे से शुरू हुआ था। कंपनी के यूट्यूब चैनल और सोशल मीडिया हैंडल पर इसको लाइवस्ट्रीम किया गया।
इससे पहले रिपोर्ट्स में बताया गया था कि कंपनी इस इवेंट में गूगल पिक्सल फोल्ड 2, वियर OS-5 और गूगल TV लॉन्च कर सकती है, लेकिन गूगल ने यह सब लॉन्च नहीं किया।
गूगल का ये इवेंट हर साल होता है। कंपनी के जेमिनी को पहले बार्ड के नाम से जाना जाता था। गूगल अपने जेमिनी AI को धीरे-धीरे हर ऐप्लिकेशन तक पहुंचाना चाहती है।
2008 में पहली बार हुआ था गूगल का I/O इवेंट
गूगल 2008 से हर साल इस इवेंट को आयोजित कर रहा है। इसके जरिए कंपनी कई नए गेजेट्स के साथ नई टेक्नोलॉजी लोगों के बीच पेश करती है।
गूगल ने पिछले साल इस इवेंट में अपना पहला फोल्डेबल फोन ‘पिक्सल फोल्ड’ लॉन्च किया था गूगल ने पिछले साल ‘Google I/O 2023’ इवेंट में अपना पहला फोल्डेबल फोन पिक्सल फोल्ड, जेमिनी AI टूल, पिक्सल 7A स्मार्टफोन और पिक्सल टैबलेट लॉन्च किया था।