Învățarea de întărire sensibilă la risc prin căutarea gradientului politicii

Învățarea de întărire sensibilă la risc prin căutarea gradientului politicii (Prashanth L. a.)

Titlul original:

Risk-Sensitive Reinforcement Learning via Policy Gradient Search

Conținutul cărții:

Învățarea prin consolidare (RL) este unul dintre pilonii fundamentali ai inteligenței artificiale și ai învățării automate. Un considerent important în orice problemă de optimizare sau control este noțiunea de risc, dar încorporarea acestuia în RL a fost o dezvoltare destul de recentă. Această monografie analizează cercetările privind RL sensibilă la risc care utilizează căutarea gradientului politicii.

Autorii trec în revistă unele dintre lucrările recente din acest domeniu, în special atunci când căutarea gradientului politicii este abordarea soluției. În primul cadru de RL sensibil la risc, aceștia acoperă măsurile de risc populare bazate pe varianță, valoarea condiționată la risc și constrângerile de șansă și prezintă un șablon pentru algoritmii de RL sensibil la risc bazat pe gradient de politică care utilizează o formulare Lagrange. Pentru cadrul în care riscul este încorporat direct în funcția obiectiv, ei iau în considerare o formulare de utilitate exponențială, teoria prospectelor cumulative și măsuri de risc coerente.

Scris pentru începători și experți deopotrivă, autorii au făcut textul complet autonom, dar, de asemenea, organizat într-un mod care permite cititorilor experți să sară peste capitolele de fundal. Acesta este un ghid complet pentru studenții și cercetătorii care lucrează la acest aspect al învățării automate.

Alte date despre carte:

ISBN:	9781638280262
Autor:	Prashanth L. a.
Editura:	New Publ Inc
Limbă:	engleză
Legare:	Copertă moale
Numărul de pagini:	170

Cumpărare:

Disponibil în prezent, pe stoc.

Învățarea de întărire sensibilă la risc prin căutarea gradientului politicii

Titlul original:

Conținutul cărții:

Alte date despre carte:

Cumpărare:

Alte cărți ale autorului:

Lucrările autorului au fost publicate de următorii editori: