Extra

Forradalmi újítás: a Google megoldhatja az állandó rejtélyt, hogy hol felejthettük a tárgyainkat

A Google olyan szoftvereket mutatott be, amelyek képesek értelmezni a telefon kamerájával készült képeken, videókon, hangokon és beszélt nyelven megjelenő információkat. Az új mesterségesintelligencia-algoritmusok közül néhány már most is elérhető, de lesz, ami nyáron érkezik.

Elképesztő és egyben félelmetes technológiákat mutatott be a Google a szoftverfejlesztőknek tartott rendezvényén, a Google I/O-n. A kulcskifejezés ezúttal a multimodális algoritmus volt, ami azt jelenti, hogy egy mesterségesintelligencia-algoritmus képes megérteni és összevetni a különbözőképpen szerzett információkat, így a szövegeket, a kódokat, a hangokat, a képeket és a videókat, ezekből pedig következtetések levonására is képes. Az egyik kedden bemutatott funkció pedig megtalálja az elveszett tárgyakat: csak fel kell tenni a készüléknek a kérdést, hogy „hol van a kulcsom”, és az megválaszolja.

Las,Vegas,,Nv,1-10-2024:,Google,Booth,During,Ces.,Company,Logo
A Google olyan mesterséges intelligencia algoritmusokat mutatott be, amelyek képesek értelmezni a telefon kamerájával készült képeken, videókon, hangokon és beszélt nyelven megjelenő információkat.
A Google olyan mesterségesintelligencia-algoritmusokat mutatott be, amelyek megváltoztathatják az életünket / Fotó: Shutterstock

Nagyot fejlesztettek a Geminin, a Google legfontosabb mesterséges intelligenciáján

Új lendületet kap a Gemini Nano, a Pixel telefonokra telepített nagy nyelvi modell. A nevét is megváltoztatják, ami a Gemini Nano with Multimodality lesz. Sundar Pichai vezérigazgató a szoftver képességeit azzal szemléltette a szoftvermérnököknek tartott rendezvényen, hogy az lehetővé teszi, hogy „bármilyen bemenetet bármilyen kimenetté alakítson”.

Ez azt jelenti, hogy képes információt nyerni szövegből, fotókból, hangból, internetre feltöltött videókból, illetve a telefon kamerájáról készült élő videókból, majd értelmezni azokat, összefoglalni a megszerzett információkat, végül pedig megválaszolni az azokkal kapcsolatos kérdéseket. Erre mutattak is egy példát egy videóban, amiben valaki a telefonja kamerájával könyveket olvasott be egy polcon, majd a címeket adatbázisban rögzítette – magyarázta a Wired.

A Nano ezentúl riaszthat, ha be akarnak csapni minket. 

A csalásriasztó funkció prototípusa képes meghallgatni és értelmezni a telefonbeszélgetést, és ha csalást gyanít, akkor azt jelzi.

Hol van a kulcsom? Hol van a szemüvegem? A jövő mesterségesintelligencia-asszisztense megmondja

A technológiai óriás bemutatta az Astra projektet is, ami a jövő mesterségesintelligencia-asszisztense lehet. A program a képességeit bemutató videóban a rendszer megválaszolt szóban elhangzott, arra vonatkozó kérdéseket, hogy mit lát a telefon kamerájával. Sőt a szoftver azt is megválaszolta a kérdezőnek, hogy hol hagyta a szemüvegét.

A Google segít a munkában, a szülőségben és az iskolai feladatokban 

A Google a Workspace irodai eszközcsomagjába is beépíti a mesterséges intelligenciát. Keddtől számos alkalmazás, köztük a Gmail, a Google Drive, a Dokumentumok, a Táblázatok és a Diák oldalsó paneljén megjelenik egy gomb, amellyel a Google Gemini 1.5 Pro verzióját be lehet kapcsolni egy friss blogbejegyzés szerint. Ezáltal többek közt a Gmail is olyan újítást kap, amely például képes az összes, egy adott témával kapcsolatos e-mail összefoglalására.

A Gemini nemcsak az irodai dolgozóknak könnyítheti meg az életét, hanem a tanulókét és a szüleikét is.

Például a chatbot segíthet a házi feladat elkészítésében vagy összefoglalót adhat a szülői értekezletekről. A Google Circle to Search pedig hamarosan arra is használható lesz, hogy részletesen megmutassa a diákoknak matematikai feladatok megoldását.

A Google Search képességein is fejlesztettek. Egy bemutatóvideón keresztül mutattak a mesterséges intelligenciának egy elromlott lemezjátszót, majd megkérdezték tőle, hogy mi lehet vele a gond. Az algoritmus azonnal sorolta a lehetséges problémákat és megoldási javaslatokat is adott. A szoftver még a találatok felsorolása előtt megválaszolta a keresési kérdést. Ezt a funkciót jelenleg az Egyesült Királyságban tesztelik, de hamarosan máshol is elérhető lesz.

A Google Fotók is új funkciót kap a nyáron. A jövőben az applikáció összeköttetésben lehet a Gemini mesterséges intelligenciával, ha a felhasználó szeretné. Az algoritmus kereshet a fényképek közt és az eddigieknél részletesebb eredményeket adhat. Például megmondhatjuk neki, hogy keresse ki az összes olyan képet, amint egy bizonyos rendszám szerepel – magyarázta Jeremy Selier szoftvermérnök keddi blogbejegyzésében.

Nemsokára pedig egyes zenészek, művészek és filmesek olyan mesterséges intelligenciát tesztelhetnek, amely képet, videót és zenét alkot.

A Google azt ígéri, hogy a távolabbi jövőben egy virtuális csapattársat is a felhasználók rendelkezésére bocsát. Ennek megmondhatjuk, hogy végezzen el bizonyos feladatokat, például vegyen részt egyszerre több online megbeszélésen – számolt be a BBC.

Nagy a verseny a mesterséges intelligencia fejlesztésében

A Google egy nappal az OpenAI hétfői rendezvénye után mutatta be újításait. A versenytárs OpenAI a GPT-4o-t leplezte le. Ez a program képes emberi arckifejezéseket leolvasni a telefon kameráján keresztül, beszélgetni, sőt, flörtölni is.

Alig egy nappal a nagy bemutató után kulcsember távozik az OpenAI-tól

Ilya Sutskever volt az OpenAI agya a beszámolók szerint, míg a cégvezető Sam Altman inkább a tőke felhajtásában és az evangelizációban játszott fontos szerepet.

 

 

Google mesterséges intelligencia Gemini
Kapcsolódó cikkek