Cégvilág

Megtalálni a tűt a szénakazalban

Bár a globális keresőpiacot a Google uralja, egyre terjednek a más módszert alkalmazó, úgynevezett intelligens keresők. A speciális szoftverek nagyságrendekkel kisebb merítéssel, de jóval pontosabban dolgoznak. A hazai piac legfontosabb szereplője bizakodó, bár az MTA SZTAKI szakértője szerint itthon még mindig inkább az emberi munkaerőben, mint a technológiában bíznak a vállalatok.

A Corporate Competitive Intelligence a szabadon felhasználható információk gyűjtésére, rendszerezésére és felhasználásra épülő technológia. Segítségével a vállalatok jobban megérthetik üzleti környezetüket, időben felkészülhetnek a versenytársaik, partnereik, a technikai fejlődés, a termékkínálat, és az ügyfelek világának változásaira. A rendszer sokszor alig kezelhető mennyiségű belső vállalati, illetve az üzleti környezetből származó információt képes feldolgozni, elemezni, szűrni adott feltételek szerint osztályozni.

Azt szoktuk mondani, amíg a Google keres, az Infovadász talál – összegzi a Montana intelligens keresőjének előnyeit Vadász Pál, a cég vezérigazgatója. Az intelligens kereső rendszerek teljesen más módszert alkalmaznak, mint például a Google. A keresőóriás azt figyeli, megtalálható-e az adott karaktersor a szövegben.

Az intelligens keresők, mint az Infovadász azonban szemantikai keresést hajtanak végre, vagyis igyekszik értelmet adni a beírt szavaknak. Ha valaki a karaktersoros keresőbe a "baltával koponyán csapta" kifejezést írja be, akkor csak azokat a szövegeket találja meg, ahol ezek a szavak előfordulnak. Az intelligens kereső azonban ebben az esetben olyan szövegeket is a találatok közé sorol majd, amelyben a "fejszével fejbe ütötte" kifejezés található meg, mivel "tudja", hogy ezek szinonim szavak.

Vadász Pál hozzátette: ezek a rendszerek nem összehasonlíthatóak a Google-lal, mivel az intelligens keresőket elsősorban vállalatok használják saját adatbázisaikban. Az ilyen keresők tehát jóval kisebb állományt vizsgálnak, de ennek megfelelően sokkal pontosabbak is, mint a Google, amely honlapok garmadáját figyeli meg.

Intelligens keresők versenye

Az intelligens keresők teljesítménye jól összemérhető. A két legfontosabb nemzetközi erőpróba a TREC (Text Retrieval Conference) és a CLEF (Cross Language Evaluation Forum). A megmérettetés során a két legfontosabb paraméter a precision (pontosság) és a recall (lefedés).

A pontosság azt mutatja meg, száz keresési találatból hány tekinthető valóban hasznos találatnak. A lefedés pedig ennek ellentéte, azt mutatja meg, az adott szövegben található száz keresendő kifejezés közül hányat talál meg a rendszer. A fejlesztés nehézsége, hogy ha az egyik faktorban jól teljesít a kereső, a másikban gyengébb lesz, vagyis – túlzással élve – a kereső vagy „mindenre lő” vagy erősen válogat.

A kérdés az, ki találja meg minél gyorsabban a tűt a szénakazalban – magyarázta a szoftver működését Vadász Pál. Mint mondta, nevetséges lenne azt gondolni, hogy az intelligens keresők a Google konkurenciájává válhatnak, de a szakember rendkívül dinamikus fejlődésre számít a hazai piacon. A 30-50 százalékos részesedést magáénak tudó Montana vezére szerint a forgalom évente megduplázódik a következő időszakban. Vadász Pál úgy látja: az egyelőre főként nagyvállalatok és államigazgatási szervek körében használt rendszer várhatóan fentről lefelé terjed majd.

Kérdés persze, hogy a fejlődés valóban ilyen lendületes lesz-e Magyarországon, tekintve, hogy a hazai vállalatok még ma is szívesebben oldják meg a problémákat emberi munkaerővel, mint a technológia segítségével – véli Kornai András. Az MTA Számítástechnikai és Automatizálási Kutatóintézetének (MTA SZTAKI) tudományos tanácsadója szerint a vállalati megoldások terén a cégeknek nem egy az egyben kell a Google-lal versenyezniük, mivel a keresőóriás nem rendelkezik erre specializált termékkel. Igaz, a legnagyobb játékosok, a Google, a Yahoo és a Bing után csak körülbelül a piac 5 százalékán osztoznak a kereső alkalmazásokat fejlesztő cégek.

Kornai András hozzátette: az intelligens keresés bevezetéséhez nem feltétlenül szükséges jelentős befektetés, egy közepes vállalat akár saját számítástechnikai infrastruktúrája és egy szakember alkalmazásával bevezetheti a „vállalati intelligenciát”. A szakértő ugyanakkor kiemelte: a hazai piacon működő informatikai cégek közül a nehéz piaci körülmények miatt sokan állami támogatásért folyamodnak, ellentétben amerikai versenytársaikkal, amelyeknél ez a lehetőség fel sem merül. Kornai András úgy látja, ennek ellenére a magyar intelligens kereső piac helyzete sem reménytelen, a robbanás időpontját azonban nem lehet megjósolni.

A pontosság azt mutatja meg, száz keresési találatból hány tekinthető valóban hasznos találatnak. A lefedés pedig ennek ellentéte, azt mutatja meg, az adott szövegben található száz keresendő kifejezés közül hányat talál meg a rendszer. A fejlesztés nehézsége, hogy ha az egyik faktorban jól teljesít a kereső, a másikban gyengébb lesz, vagyis – túlzással élve – a kereső vagy „mindenre lő” vagy erősen válogat.

Intelligens keresők -->

kereső Montana CLEF MTA SZTAKI karaktersoros Infovadász szemantikai Google TREC intelligens kereső
Kapcsolódó cikkek