BÉT logóÁrfolyamok: 15 perccel késleltetett adatok
Las,Vegas,,Nv,1-10-2024:,Google,Booth,During,Ces.,Company,Logo
A Google olyan mesterséges intelligencia algoritmusokat mutatott be, amelyek képesek értelmezni a telefon kamerájával készült képeken, videókon, hangokon és beszélt nyelven megjelenő információkat.

Forradalmi újítás: a Google megoldhatja az állandó rejtélyt, hogy hol felejthettük a tárgyainkat

A Google olyan szoftvereket mutatott be, amelyek képesek értelmezni a telefon kamerájával készült képeken, videókon, hangokon és beszélt nyelven megjelenő információkat. Az új mesterségesintelligencia-algoritmusok közül néhány már most is elérhető, de lesz, ami nyáron érkezik.

Elképesztő és egyben félelmetes technológiákat mutatott be a Google a szoftverfejlesztőknek tartott rendezvényén, a Google I/O-n. A kulcskifejezés ezúttal a multimodális algoritmus volt, ami azt jelenti, hogy egy mesterségesintelligencia-algoritmus képes megérteni és összevetni a különbözőképpen szerzett információkat, így a szövegeket, a kódokat, a hangokat, a képeket és a videókat, ezekből pedig következtetések levonására is képes. Az egyik kedden bemutatott funkció pedig megtalálja az elveszett tárgyakat: csak fel kell tenni a készüléknek a kérdést, hogy „hol van a kulcsom”, és az megválaszolja.

Las,Vegas,,Nv,1-10-2024:,Google,Booth,During,Ces.,Company,Logo
A Google olyan mesterséges intelligencia algoritmusokat mutatott be, amelyek képesek értelmezni a telefon kamerájával készült képeken, videókon, hangokon és beszélt nyelven megjelenő információkat.
A Google olyan mesterségesintelligencia-algoritmusokat mutatott be, amelyek megváltoztathatják az életünket / Fotó: Shutterstock

Nagyot fejlesztettek a Geminin, a Google legfontosabb mesterséges intelligenciáján

Új lendületet kap a Gemini Nano, a Pixel telefonokra telepített nagy nyelvi modell. A nevét is megváltoztatják, ami a Gemini Nano with Multimodality lesz. Sundar Pichai vezérigazgató a szoftver képességeit azzal szemléltette a szoftvermérnököknek tartott rendezvényen, hogy az lehetővé teszi, hogy „bármilyen bemenetet bármilyen kimenetté alakítson”.

Ez azt jelenti, hogy képes információt nyerni szövegből, fotókból, hangból, internetre feltöltött videókból, illetve a telefon kamerájáról készült élő videókból, majd értelmezni azokat, összefoglalni a megszerzett információkat, végül pedig megválaszolni az azokkal kapcsolatos kérdéseket. Erre mutattak is egy példát egy videóban, amiben valaki a telefonja kamerájával könyveket olvasott be egy polcon, majd a címeket adatbázisban rögzítette – magyarázta a Wired.

A Nano ezentúl riaszthat, ha be akarnak csapni minket. 

A csalásriasztó funkció prototípusa képes meghallgatni és értelmezni a telefonbeszélgetést, és ha csalást gyanít, akkor azt jelzi.

Hol van a kulcsom? Hol van a szemüvegem? A jövő mesterségesintelligencia-asszisztense megmondja

A technológiai óriás bemutatta az Astra projektet is, ami a jövő mesterségesintelligencia-asszisztense lehet. A program a képességeit bemutató videóban a rendszer megválaszolt szóban elhangzott, arra vonatkozó kérdéseket, hogy mit lát a telefon kamerájával. Sőt a szoftver azt is megválaszolta a kérdezőnek, hogy hol hagyta a szemüvegét.

A Google segít a munkában, a szülőségben és az iskolai feladatokban 

A Google a Workspace irodai eszközcsomagjába is beépíti a mesterséges intelligenciát. Keddtől számos alkalmazás, köztük a Gmail, a Google Drive, a Dokumentumok, a Táblázatok és a Diák oldalsó paneljén megjelenik egy gomb, amellyel a Google Gemini 1.5 Pro verzióját be lehet kapcsolni egy friss blogbejegyzés szerint. Ezáltal többek közt a Gmail is olyan újítást kap, amely például képes az összes, egy adott témával kapcsolatos e-mail összefoglalására.

A Gemini nemcsak az irodai dolgozóknak könnyítheti meg az életét, hanem a tanulókét és a szüleikét is.

Például a chatbot segíthet a házi feladat elkészítésében vagy összefoglalót adhat a szülői értekezletekről. A Google Circle to Search pedig hamarosan arra is használható lesz, hogy részletesen megmutassa a diákoknak matematikai feladatok megoldását.

A Google Search képességein is fejlesztettek. Egy bemutatóvideón keresztül mutattak a mesterséges intelligenciának egy elromlott lemezjátszót, majd megkérdezték tőle, hogy mi lehet vele a gond. Az algoritmus azonnal sorolta a lehetséges problémákat és megoldási javaslatokat is adott. A szoftver még a találatok felsorolása előtt megválaszolta a keresési kérdést. Ezt a funkciót jelenleg az Egyesült Királyságban tesztelik, de hamarosan máshol is elérhető lesz.

A Google Fotók is új funkciót kap a nyáron. A jövőben az applikáció összeköttetésben lehet a Gemini mesterséges intelligenciával, ha a felhasználó szeretné. Az algoritmus kereshet a fényképek közt és az eddigieknél részletesebb eredményeket adhat. Például megmondhatjuk neki, hogy keresse ki az összes olyan képet, amint egy bizonyos rendszám szerepel – magyarázta Jeremy Selier szoftvermérnök keddi blogbejegyzésében.

Nemsokára pedig egyes zenészek, művészek és filmesek olyan mesterséges intelligenciát tesztelhetnek, amely képet, videót és zenét alkot.

A Google azt ígéri, hogy a távolabbi jövőben egy virtuális csapattársat is a felhasználók rendelkezésére bocsát. Ennek megmondhatjuk, hogy végezzen el bizonyos feladatokat, például vegyen részt egyszerre több online megbeszélésen – számolt be a BBC.

Nagy a verseny a mesterséges intelligencia fejlesztésében

A Google egy nappal az OpenAI hétfői rendezvénye után mutatta be újításait. A versenytárs OpenAI a GPT-4o-t leplezte le. Ez a program képes emberi arckifejezéseket leolvasni a telefon kameráján keresztül, beszélgetni, sőt, flörtölni is.

Alig egy nappal a nagy bemutató után kulcsember távozik az OpenAI-tól

Ilya Sutskever volt az OpenAI agya a beszámolók szerint, míg a cégvezető Sam Altman inkább a tőke felhajtásában és az evangelizációban játszott fontos szerepet.

 

 

Google News Világgazdaság
A legfrissebb hírekért kövess minket a Világgazdaság.hu Google News oldalán is!

Portfóliónk minőségi tartalmat jelent minden olvasó számára. Egyedülálló elérést, országos lefedettséget és változatos megjelenési lehetőséget biztosít. Folyamatosan keressük az új irányokat és fejlődési lehetőségeket. Ez jövőnk záloga.