Fujitsu blog: gépi tanulás másképpen

Deep learning helyett wide learning. Megoldás a kiegyensúlyozatlan adatkészletre?

Írta: Abu85
Forrás: PROHARDVER!
2018-10-04 11:11

A Fujitsu jó ideje komolyan fókuszál a AI-ra, vagyis a mesterséges intelligenciára, így meglehetősen sok tapasztalatot gyűjthettek az amúgy még ma is gyerekcipőben járó irányról. Az egész alapja lényegében a deep learning, ami lehetővé teszi, hogy megfelelő adatkészlet megléte esetén a számítógép kialakíthasson olyan neuronhálókat, amelyek felhasználhatók bizonyos feladatok megvalósítására. Itt rögtön látható, hogy sok múlik az adatkészleten, ugyanis a tréning szakasz során ezek határozzák meg, hogy a neuronhálóval mire lehet menni. Hiába van tehát elméletben végtelen lehetőség ennek fejlesztésére, ha az adatkészlet nem megfelelő, akkor az eredmény csak egy nagyon szűk problémakör végrehajtására képes neuronháló lesz.

A fenti probléma az oka annak, hogy a nagyobb cégek folyamatosan gyűjtik az adatot, ez ugyanis hatalmas kincs, így biztosítható a tréning szakasz során a tesztek megfelelő mennyisége, illetve sok adat esetében aránylag nagy biztonsággal feltételezhető a kiegyensúlyozottság is. A Fujitsu azonban pusztán a tapasztalatokból is felismerhette, hogy kiegyensúlyozott és nagy adatkészletet kialakítani pokolian nehéz, így pedig hiába van meg a deep learning technológiai alapja a mesterséges intelligenciához, a tréning szakasz – pusztán az adatok miatt – sosem vagy csak elképesztően sokára adhat megfelelő eredményt.

A japán vállalat emiatt kidolgozott egy alternatív gépi tanulást, amely a wide learning nevet viseli. Ennek célja, hogy kiegyensúlyozatlan és akár kis adatkészlet mellett is belátható időn belül biztosítson egy olyan neuronhálót, amelynek a hatásfoka az adott területen elvárható minimumszint felett van.

[+]

A wide learning hipotézisekként kezeli az adatelemek összes kombinációját, majd meghatározza ezek fontosságát a kijelölt kategóriában szereplő találati arány alapján. A Fujitsu példájával élve, az egyes termékek vásárlására vonatkozó tendenciák elemzésekor a wide learning kombinálja az egyes típusokat az adatelemekről, azokra kategóriákra, akik vásároltak vagy nem vásároltak. Vehetjük tehát a 20-34 év közötti, egyedülálló nőket, akiknek van járművezetői engedélyük, majd elemezhető, hogy hány találatot kaptak azok, akik ténylegesen vásároltak, amikor ezeket a kombinációs mintákat hipotézisekként alkalmaztuk. Azok a hipotézisek, amelyek találati aránya meghalad egy bizonyos szintet, fontos hipotézisnek számítanak, amit a Fujitsu tudásdaraboknak nevez. Ez azt jelenti, hogy még akkor is, ha a meglévő adatok elégtelenek, a rendszer minden olyan hipotézist kivon, ami megfontolandó, és ez hozzájárulhat a korábban nem mérlegelt magyarázatok felfedezéséhez.

[+]

A második lépésben a rendszer egy osztályzási modellt készít, amely a többszörösen kiemelt tudásdarabokon és a kijelölt kategóriákon alapul. Amennyiben itt az egyes tudásdarabokat alkotó elemek sűrűn átfednek más tudásdarabokat alkotó elemeket, akkor a rendszer csökkenti ennek mértékét, hogy befolyásolja az osztályzás modellre gyakorolt hatást. Ez teszi lehetővé a pontos osztályozást kiegyensúlyozatlan adatok esetében is.

Végeredményben a wide learning 10-20%-kal növelheti az AI pontosságát a deep learninghez képest, ha nincs megfelelő adatkészlet a tréninghez. Ez a vállalat gyakorlati mérése marketing és egészségügyi területekről.

Hozzászólások (2)

Kapcsolódó cégek:
Fujitsu

Azóta történt

Fujitsu blog: mesterséges intelligenciával a magzati szívproblémák ellen

A Riken intézet egy lényeges probléma megoldásán gondoskodik, ami sok újszülött életét mentheti meg.

Blogbejegyzés 2018-10-11 10
Fujitsu blog: egy lépcsővel közelebb került a készpénz nélküli társadalom

A vállalat integrált biometrikus hitelesítési technológiája a tenyérvéna és az arckép alapján bárkit képes azonosítani.

Blogbejegyzés 2018-10-18 26
Fujitsu blog: a felsőházat veszi be az Eternus DX8900 S4

A fejlesztés mellé érkezik még egy DX8100 S4 jelzésű modell, de csak Japán számára.

Blogbejegyzés 2018-10-25 2
Fujitsu blog: újdonságok a Fujitsu Forumról

Öt fontosabb bejelentéssel készült a vállalat a jelenleg is zajló, müncheni rendezvényre.

Blogbejegyzés 2018-11-08 0

Előzmények

Fujitsu blog: új memóriabővítési technológiával kísérletezik a japán vállalat

Az adatközpontokat célzó megoldással akár 3,6-szor nagyobb lehet a rendszer teljesítménye.

Blogbejegyzés 2018-09-27 11
Fujitsu blog: idén is prezentálta vízióját a Fujitsu

A Fujitsu Technology and Service Vision 2018-ban a "Co-creation for Success" szlogent hirdeti.

Blogbejegyzés 2018-05-24 0
Fujitsu blog: az AI az ember szolgálatában

A japán vállalat két koncepción keresztül mutatja be, miképp lehet a mesterséges intelligencia az emberek segítségére.

Blogbejegyzés 2018-05-17 0
Fujitsu blog: mesterséges intelligencia a gyártásban

A Fujitsu Laboratories of Europe új fejlesztése az egyes gyártási eljárásoknál alkalmazott roncsolásmentes vizsgálatok elvégzésében segít.

Blogbejegyzés 2017-11-02 5