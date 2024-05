Elképesztő és egyben félelmetes technológiákat mutatott be a Google a szoftverfejlesztőknek tartott rendezvényén, a Google I/O-n. A kulcskifejezés ezúttal a multimodális algoritmus volt, ami azt jelenti, hogy egy mesterséges intelligencia algoritmus képes megérteni és összevetni a különbözőképpen szerzett információkat, így a szövegeket, a kódokat, a hangokat, a képeket és a videókat, ezekből pedig következtetések levonására is képes. Az egyik kedden bemutatott funkció pedig megtalálja az elveszett tárgyakat: csak fel kell tenni a készüléknek a kérdést, hogy „hol van a kulcsom”, és az megválaszolja.

Nagyot fejlesztettek a Geminin, a Google legfontosabb mesterséges intelligenciáján

Új lendületet kap a Gemini Nano, a Pixel telefonokra telepített nagy nyelvi modell. A nevét is megváltoztatják, ami a Gemini Nano with Multimodality lesz. Sundar Pichai vezérigazgató a szoftver képességeit azzal szemléltette a szoftvermérnököknek tartott rendezvényen, hogy az lehetővé teszi, hogy "bármilyen bemenetet bármilyen kimenetté alakítson".

Ez azt jelenti, hogy képes információt nyerni szövegből, fotókból, hangból, internetre feltöltött videókból, illetve a telefon kamerájáról készült élő videókból, majd értelmezni azokat, összefoglalni a megszerzett információkat, végül pedig megválaszolni az azokkal kapcsolatos kérdéseket. Erre mutattak is egy példát egy videóban, amiben valaki a telefonja kamerájával könyveket olvasott be egy polcon, majd a címeket adatbázisban rögzítette – magyarázta a Wired.

A Nano ezentúl riaszthat, ha be akarnak csapni minket.

A csalásriasztó funkció prototípusa képes meghallgatni és értelmezni a telefonbeszélgetést, és ha csalást gyanít, akkor azt jelzi.

Hol van a kulcsom? Hol van a szemüvegem? A jövő mesterséges intelligencia-asszisztense megmondja

A technológiai óriás bemutatta az Astra projektet is, ami a jövő mesterséges intelligencia-asszisztense lehet. A program a képességeit bemutató videóban a rendszer megválaszolt szóban elhangzott, arra vonatkozó kérdéseket, hogy mit lát a telefon kamerájával. Sőt, a szoftver azt is megválaszolta a kérdezőnek, hogy hol hagyta a szemüvegét.

A Google segít a munkában, a szülőségben és az iskolai feladatokban

A Google a Workspace irodai eszközcsomagjába is beépíti a mesterséges intelligenciát. Keddtől számos alkalmazás, köztük a Gmail, a Google Drive, a Dokumentumok, a Táblázatok és a Diák oldalsó paneljén megjelenik egy gomb, amellyel a Google Gemini 1.5 Pro verzióját be lehet kapcsolni egy friss blogbejegyzés szerint. Ezáltal többek közt a Gmail is olyan újítást kap, amely például képes az összes, egy adott témával kapcsolatos e-mail összefoglalására.

A Gemini nem csak az irodai dolgozóknak könnyítheti meg az életét, hanem a tanulókét és a szüleikét is.

Például a chatbot segíthet a házi feladat elkészítésében vagy összefoglalót adhat a szülői értekezletekről. A Google Circle to Search pedig hamarosan arra is használható lesz, hogy részletesen megmutassa a diákoknak matematikai feladatok megoldását.

A Google Search képességein is fejlesztettek. Egy bemutatóvideóban videón keresztül mutattak meg a mesterséges intelligenciának, egy elromlott lemezjátszót, majd megkérdezték tőle, hogy mi lehet vele a gond. Az algoritmus azonnal sorolta a lehetséges problémákat és megoldási javaslatokat is adott. A szoftver még a találatok felsorolása előtt megválaszolta a keresési kérdést. Ezt a funkciót jelenleg az Egyesült Királyságban tesztelik, de hamarosan máshol is elérhető lesz.

A Google Fotók is új funkciót kap a nyáron. A jövőben az applikáció összeköttetésben lehet a Gemini mesterséges intelligenciával, ha a felhasználó szeretné. Az algoritmus kereshet a fényképek közt és az eddigieknél részletesebb eredményeket adhat. Például megmondhatjuk neki, hogy keresse ki az összes olyan képet, amint egy bizonyos rendszám szerepel – magyarázta Jeremy Selier szoftvermérnök keddi blogbejegyzésében.

Nemsokára pedig egyes zenészek, művészek és filmesek olyan mesterséges intelligenciát tesztelhetnek, amely képet, videót és zenét alkot.

A Google azt ígéri, hogy a távolabbi jövőben egy virtuális csapattársat is a felhasználók rendelkezésére bocsát. Ennek megmondhatjuk, hogy végezzen el bizonyos feladatokat, például vegyen részt egyszerre több online megbeszélésen – számolt be a BBC.

Nagy a verseny a mesterséges intelligencia fejlesztésében

A Google egy nappal az OpenAI hétfői rendezvénye után mutatta be újításait. A versenytárs OpenAI a GPT-4o-t leplezte le. Ez a program képes emberi arckifejezéseket leolvasni a telefon kameráján keresztül, beszélgetni, sőt, flörtölni is.