
Dirbtinis intelektas buvo tyrimas yra 10 kartų greičiau ir efektyviau
Iš "Google padalinys, užsiima plėtros dirbtinio intelekto, paskelbė apie naujojo metodo mokymai neuroninių tinklų kūrimą, derinant pažangias algoritmai ir senų vaizdo žaidimų naudojimą. Tais senais Atari vaizdo žaidimų yra naudojami kaip mokymosi aplinkoje.

DeepMind kūrėjai (atminkite, kad šie žmonės sukūrė neuroniškuosius AlphaGo, pakartotinai įveikti geriausių žaidėjų žaidimo logika) sako, kad mašinos galėtų būti apmokyti taip pat, kaip žmogui. Su DMLab-mokymo sistema 30, sukurto remiantis šaulys ir Quake III Atari arcade games (naudojant 57 skirtingų žaidimų) pagrindu, inžinieriai sukūrė naują mašina mokymosi algoritmo Impala (svarba svertinės Aktorius-Besimokančiųjų architektūros). Tai leidžia atskiros dalys studijuoti kelių uždavinių įgyvendinimą, ir tada dalintis savo žiniomis vieni su kitais.

Daugeliu atžvilgių, naujoji sistema buvo grindžiamas ankstesniu architektūros sistemos A3c (asinchroniniai aktorius kritikų atstovai), kuriame atskiri agentai tiria trečiadienį, tada procesas yra sustabdytas, ir jie dalijasi savo žiniomis su centriniu komponento "mokinio". Kaip ir IMPALA, tada jis gali būti daugiau agentų, ir pati mokymosi procesas vyksta šiek tiek skirtingai. Jos agentas siunčia informaciją į du "mokiniai", kurie tada taip pat bendrauti tarpusavyje. Be to, jei A3c apskaičiuojant nuostolių funkcijos gradientas (kitaip tariant, iš prognozuojamų ir gautų parametrų reikšmių nesutapimas) užsiima agentai patys, kurie siunčia informaciją į centrinę šerdį, šios sistemos objektas IMPALA užsiima "mokinius". Kad, Pasas žmogaus pavyzdys:

Štai kaip elgtis tą pačią užduotį Impala sistema:

Vienas iš pagrindinių problemų PG vystymosi laikas ir aukštos skaičiavimo galia poreikis. Net sąlygomis autonominių automatų reikia taisykles, pagal kurias jie galėtų sekti į savo eksperimentus ir ieškant būdų spręsti problemas. Kadangi mes gali ne tik sukurti robotai ir padaryti jas prieinamas ne valios mokytis, kūrėjai naudoja modeliavimo metodus ir giliai mokymąsi.
Norėdami modernus neuroninis tinklas gali sužinoti ką nors, jie turi tvarkyti didžiulį informacijos kiekį šiuo atveju yra - milijardai kadrų. Ir kuo daugiau jie tai daro greičiau, todėl mažiau laiko skiriama mokymui.
Pasak DeepMind, atsižvelgiant į pakankamą skaičių IMPALA procesorius buvimas pasiekia našumą 250 000 kadrų / s, arba 21 mlrd kadrų per dieną. Tai absoliutus rekordas šioje užduoties pobūdžio, portalo Kitas Web. Patys, kaip kūrėjai pastebėjo, kad jų PG sistema susidoroti su užduotimi geriau nei panašių mašinų ir žmonių.
Ateityje šie AI algoritmai gali būti naudojami robotų. Optimizuojant sistemos mašina mokymo robotai greitai prisitaikyti prie aplinkos ir dirbti efektyviau.