Mi van a képen?

0

Mi van a képen? Egy egészséges ember agy számára nem nagy kihívás a válasz erre e kérdésre, de a mesterséges intelligenciának igen. A Google egy új képtartalom felismerő algoritmuson dolgozik, mely önállóan rájön mi van a fotón és röviden le is írja azt (angolul).

Az ötletet a gépi szövegfordítók dupla kapcsolt neuronhálózata (RNN) adta, de itt az RNN előtt egy CNN (konvolúciós neuronhálózat) dolgozik. Ebből persze nem sokat értünk, de a lényeg az, hogy az algoritmus több-kevesebb sikerrel képes felismerni a kép tartalmát, és lényegretörően leírni azt.

A fejlesztés persze még finomításra szorul, de a jövőben rengeteg alkalmazási területe lehet. A legegyszerűbb ötletként elég csak a fotók tartalom szerinti katalogizálására gondolni.