Evaluare:
În prezent, nu există recenzii ale cititorilor. Evaluarea se bazează pe 4 voturi.
Statistical Reinforcement Learning: Modern Machine Learning Approaches
Învățarea prin consolidare este un cadru matematic pentru dezvoltarea agenților informatici care pot învăța un comportament optim prin corelarea semnalelor generice de recompensă cu acțiunile lor anterioare. Cu numeroase aplicații de succes în business intelligence, controlul instalațiilor și jocuri, cadrul RL este ideal pentru luarea deciziilor în medii necunoscute cu cantități mari de date.
Furnizând o introducere actualizată și accesibilă în domeniu, Învățarea statistică de întărire: Abordări moderne de învățare automată prezintă concepte fundamentale și algoritmi practici de învățare statistică de întărire din punctul de vedere al învățării automate moderne. Acesta acoperă diferite tipuri de abordări RL, inclusiv abordări bazate pe model și fără model, iterația politicilor și metode de căutare a politicilor.
⬤ Acoperă gama de algoritmi de învățare prin întărire dintr-o perspectivă modernă.
⬤ Expune problemele de optimizare asociate pentru fiecare scenariu de învățare prin întărire acoperit.
⬤ Furnizează un tratament statistic provocator al algoritmilor de învățare prin întărire.
Cartea cuprinde abordări recent introduse în domeniile extragerii de date și învățării automate pentru a oferi o punte sistematică între RL și cercetătorii din domeniul extragerii de date/învățării automate. Cartea prezintă rezultatele de ultimă oră, inclusiv reducerea dimensionalității în RL și RL sensibilă la risc. Sunt incluse numeroase exemple ilustrative pentru a ajuta cititorii să înțeleagă intuiția și utilitatea tehnicilor de învățare prin consolidare.
Această carte este o resursă ideală pentru studenții de nivel universitar din programele de informatică și statistică aplicată, precum și pentru cercetătorii și inginerii din domenii conexe.
© Book1 Group - toate drepturile rezervate.
Conținutul acestui site nu poate fi copiat sau utilizat, nici parțial, nici integral, fără permisiunea scrisă a proprietarului.
Ultima modificare: 2024.11.08 07:02 (GMT)