Google Lens: Video i glasovna pretraga pokretana umjetnom inteligencijom, kako je koristiti i sve njene tajne

  • Pretraga videa putem Google Lensa omogućava kontekstualne odgovore u stvarnom vremenu, pokretane umjetnom inteligencijom.
  • Moguće je konsultovati se glasom ili tekstom tokom snimanja videa, što proširuje mogućnosti interakcije.
  • Funkcija se oslanja na Gemini model za interpretaciju slika, zvuka i multimodalnog konteksta za svaki upit.

Pretraživanje videa putem umjetne inteligencije u Google Lensu

Google objektiv Postao je neophodan Googleov alat za pretraživanje informacija s vašeg mobilnog telefona, a sada uključuje i revolucionarno ažuriranje: Pretražite videozapise i postavite pitanja naglas zahvaljujući umjetnoj inteligenciji. Ova funkcija označava skok naprijed u odnosu na tradicionalno pretraživanje slika i radikalno mijenja način na koji komuniciramo sa svijetom oko nas. Ovdje ćete otkriti kako funkcioniše, čemu služi, kako ga koristiti korak po korak, njegove prednosti, ograničenja i sve njegove tajne, uz detaljna objašnjenja i korisne savjete.

Šta je Google Lens i njegova evolucija prema multimodalnom pretraživanju videa?

Od svog pokretanja, Google Lens se istakao po tome što omogućava identifikaciju predmeta, tekstova, životinja, biljaka, proizvoda ili spomenika. jednostavnim usmjeravanjem kamere mobilnog telefona. Među njegovim najpopularnijim karakteristikama su trenutni prijevod teksta, rješavanje matematičkih problema, skeniranje QR kodova i upoređivanje proizvoda u fizičkim i online trgovinama.

Prekovremeno, Google Lens je integrirao nove tehnologije kao što su prepoznavanje glasa i multimodalno pretraživanje, a mogu se koristiti i u drugim aplikacijama u Google ekosistemu kao što su Mape, Fotografije ili Chrome. Njegova funkcionalnost nije ograničena samo na slike snimljene u tom trenutku, već uključuje i sačuvane fotografije, odabrane tekstove, a sada i video zapise snimljene direktno iz aplikacije.

Glavni trenutni napredak leži u Sposobnost analize kratkih videa, interpretacije scene i omogućavanja postavljanja pitanja putem glasa ili teksta, uz trenutno dobijanje preciznih i kontekstualnih odgovora.. Ovo prevazilazi glavnu prepreku pretrage slika, gdje jedna fotografija nije uvijek dovoljna da pruži potpuni kontekst upita.

Kako koristiti video i glasovnu pretragu u Google Lensu korak po korak

  1. Otvorite aplikaciju Google Lens sa svog Android ili iOS telefona ili pomoću ikone povećala u Google traci za pretragu.
  2. Odaberite "Pretraži pomoću kamere". Usmjerite kameru prema objektu, sceni ili situaciji koju želite pregledati.
  3. Pritisnite i držite dugme za snimanje da biste snimili kratki video (obično do 20 sekundi). Tokom snimanja, možete naglas dodati pitanje o onome što vidite. Alternativno, možete upisati pitanje nakon snimanja videa.
  4. Nakon završetka, Googleova umjetna inteligencija će analizirati i video i audio vašeg upita, odabirući najrelevantnije kadrove i odgovarajući u roku od nekoliko sekundi.

Tokom snimanja, sistem prikazuje poruku "Govorite sada da biste pitali o ovoj sceni". Ovaj proces čini iskustvo mnogo prirodnijim, jer možete suziti ono što želite znati, otkrivajući detalje koje jedna pretraga slike ili teksta ne bi mogla identificirati.

Kakvi se odgovori dobijaju i napredne praktične upotrebe

La Raznolikost i preciznost odgovora daleko prevazilazi one kod klasične pretrage slika., jer vještačka inteligencija ima pristup većem kontekstu i može povezati vizualne i usmene detalje u videu. Neki primjeri upotrebe i značajni praktični slučajevi:

  • Identifikacija pokretnih objekata i životinjaIdealno za snimanje aktivnih kućnih ljubimaca, životinja u njihovom prirodnom okruženju ili vozila u akciji i provjeru vrsta, marki ili karakteristika koje bi mogle proći nezapaženo na statičnoj fotografiji.
  • Prepoznavanje mjesta i spomenikaSnimite panoramski pogled na trg ili zgradu i pitajte o njenoj historiji, arhitekturi ili zanimljivim činjenicama. Vještačka inteligencija može pratiti recenzije, historijske informacije i ključne podatke.
  • Prikupljanje informacija o proizvodima u trgovinamaVidite li nešto zanimljivo i želite znati cijenu, mišljenja ili alternative? Snimite proizvod i postavite pitanje naglas. Sistem pruža linkove za kupovinu, poređenja i iskustva drugih korisnika.
  • Upiti o videozapisima trećih stranaSnimite ekran televizora, računara ili tableta kako biste identificirali pjesme, glumce, lokacije, restorane ili bilo koje vizualne ili zvučne elemente u sceni.
  • Pomoć u obrazovanju i rješavanju problemaSnimite eksperiment, matematičku operaciju ili rad pokvarenog uređaja i zatražite rješenje, objašnjenje ili detaljne upute.
  • Istraživanje umjetnosti i prirodeKonsultujte se o umjetničkom djelu, egzotičnoj biljci, geološkoj formaciji, vrsti oblaka itd., uz detaljna objašnjenja i resurse za proširenje informacija.
  • Trenutni prijevod u pokretuZa putnike, omogućava snimanje pokretnih znakova, natpisa ili titlova i primanje prijevoda bez obzira na to da li je znak van fokusa ili ga je teško snimiti na fotografiji.
  • Zanati i DIY projektiMožete snimiti materijale i proces, postavljati pitanja o sljedećem koraku ili tražiti detaljne upute prilagođene kontekstu vašeg videa.
  • Kuhinjski receptiPrikazuje sastojke ili postupak recepta i pita o pripremi, vremenu kuhanja ili alternativnim sastojcima.

Nema potrebe za pisanjem dugih tekstova ili gubljenjem vremena na tehničke opise.. Jednostavno snimite, prikažite i postavljajte pitanja kako biste dobili precizan pregled prilagođen vašem kontekstu, zahvaljujući Googleovoj multimodalnoj umjetnoj inteligenciji.

Pregledi Geminija i umjetne inteligencije: Umjetna inteligencija koja stoji iza magije

Motor koji omogućava ovu funkciju je Gemini, Googleov napredni model umjetne inteligencije sposoban za razumijevanje slika, teksta, zvuka, a sada i cijelih videozapisa.. Kako to funkcioniše? Kada snimite video i postavite pitanje, Gemini analizira snimak kadar po kadar, identificira ključne vizualne fragmente i ukršta te informacije s vašim pitanjem, bilo izgovorenim ili napisanim.

Rezultat se pojavljuje u obliku AI Overviews, eksperimentalna funkcija koja obrađuje informacije dostupne na webu, jasno ih sažima i prikazuje na ekranu uređaja za nekoliko sekundi. Ovo čini pretragu zaista multimodalniAI kombinuje sliku, glas i kontekst, omogućavajući rješavanje pitanja koja su ranije zahtijevala višestruke pretrage ili teško detaljne opise.

Za neke korisnike, posebno tamo gdje je funkcija još uvijek eksperimentalna, možda će biti potrebno uključiti opciju "Search Labs" i omogućiti "AI Overviews and more" iz Google aplikacije. Iako je uvođenje započeto u regijama gdje se govori engleski, širenje na druge jezike i zemlje brzo napreduje.

Primjeri i demonstracije iz stvarnog života: Kako Google Lens reaguje na video i glas

Praktični potencijal je uočen u testovima koje su snimili stručnjaci poput Mishaala Rahmana, koji je dokumentirao prepoznavanje pametnih satova, tanjira s hranom ili urbanih scena u sekundama. Na primjer, prilikom snimanja jela od borovnica i pitanja koliko ih je bilo, Gemini je u realnom vremenu vratio tačan broj. U drugom testu, snimanjem pametnog sata i pitanjem o njegovom modelu i operativnom sistemu, vještačka inteligencija je ispravno identificirala većinu detalja, čak i ako se specifični model može neznatno razlikovati.

U dodatnim eksperimentima, bilo je moguće identificirati vrste ptica u letu, identificirati vozila u pokretu, prebrojati objekte u sceni i ponuditi složena edukativna objašnjenja. Stopa tačnosti zavisi od kvaliteta i oštrine videa, ali brzina i korisnost odgovora daleko prevazilaze one kod pretraga fotografija.

Osoba sa stezaljkom sa google objektivom
Vezani članak:
Sve što možete postići s Google Lensom: Potpun i ažuriran vodič

Integracija s Google ekosistemom i nove metode pretraživanja

Evolucija Google Lensa ne samo da poboljšava glavnu aplikaciju, već i pokreće nove funkcije u cijelom Google ekosistemu.. Neke od najznačajnijih integracija i prednosti uključuju:

  • Direktna pretraga na YouTubeuIdentificirajte elemente u videozapisima unutar aplikacije, kao što su mjesta, pjesme, glumci ili proizvodi, jednostavnim snimanjem ekrana.
  • Obogaćeno Chrome iskustvoOmogućava vam odabir videa, slika ili fragmenata teksta sa web stranica i pregled informacija bez napuštanja preglednika.
  • Prevođenje u pokretu: Koristite funkciju kamere i videa za prevođenje pokretnih znakova ili titlova tokom putovanja ili promjenjivih situacija.
  • pametna kupovinaSnimanjem proizvoda dobijate direktne linkove do prodavnica, poređenje cijena, recenzije i dostupnost u realnom vremenu, optimizujući online i offline kupovinu.

Ograničenja, zahtjevi za korištenje i privatnost

Funkcija Još uvijek je u fazi progresivnog uvođenja, tako da njegova dostupnost zavisi od regije, jezika i toga da li je eksperimentisanje „AI pregledi“ omogućeno na vašem računu. U nekim slučajevima, korisnik se mora prijaviti u Search Labs i aktivirati povezane eksperimente iz Google aplikacije dodirom na ikonu u obliku tikvice.

  • Maksimalna dužina videaVideo je obično ograničen na 10-20 sekundi kako bi se osigurala efikasnost AI analize.
  • Preporučeni kvalitetPreporučuje se snimanje pri dobrom osvjetljenju i pravilno fokusiranje scene, budući da tačnost odziva zavisi od oštrine, kadriranja i jasnoće okoline.
  • privatnostPo zadanim postavkama, umjetna inteligencija izbjegava prepoznavanje lica i fokusira analizu na objekte, radnje i kontekste, a ne na ljude. Međutim, preporučljivo je izbjegavati snimanje ličnih podataka ili osoba bez njihovog pristanka.
  • Neprecizni odgovoriU zbunjujućim, nejasnim ili brzim videozapisima, umjetna inteligencija može ponuditi približne odgovore ili prijedloge umjesto tačnih rješenja. Uprkos tome, nivo korisnosti je, u većini slučajeva, veoma visok.

Zahvaljujući vizualnoj pretrazi videa u Google Lensu, otvara se horizont mogućnosti koji transformira način na koji rješavamo pitanja, učimo, uspoređujemo, kupujemo i istražujemo svijet. Ova funkcija, pokretana umjetnom inteligencijom, pruža informacije prilagođene svakoj situaciji, kombinirajući glas, sliku, video i kontekst u jednom koraku, približavajući korisnike budućnosti inteligentnog pretraživanja. Pratite evoluciju Google Lensa i ne ustručavajte se iskoristiti ovaj napredak koji briše granice između fizičke i digitalne stvarnosti na dlanu.