Evaluare:
Cartea oferă un amestec cuprinzător de teorie și aplicații practice în învățarea prin consolidare, lăudată pentru structura sa clară și explicațiile detaliate. Recenzenții apreciază profunzimea sa, acoperirea largă a subiectelor și exemplele practice de codare, deși mulți au probleme cu compatibilitatea codului și exemplele învechite.
Avantaje:Amestec excelent de teorie și practică, structurat logic, discuții detaliate despre tehnicile de învățare prin consolidare, explicații clare, capitole bine definite, imagini bune, acoperă o mare varietate de subiecte, potrivit atât pentru începători, cât și pentru cursanții experimentați.
Dezavantaje:Exemplele de cod adesea nu rulează sau conțin erori, unii consideră că aspectele de codificare sunt învechite sau incompatibile cu bibliotecile actuale, depanarea este lăsată la latitudinea cititorului, probleme legate de starea fizică a cărții raportate.
(pe baza a 37 recenzii ale cititorilor)
Deep Reinforcement Learning Hands-On - Second Edition: Apply modern RL methods to practical problems of chatbots, robotics, discrete optimization, web
Noua ediție a celui mai bine vândut ghid privind învățarea profundă prin întărire și modul în care aceasta este utilizată pentru a rezolva probleme complexe din lumea reală. Revizuit și extins pentru a include metode multi-agent, optimizare discretă, RL în robotică, tehnici avansate de explorare și multe altele
Caracteristici principale
⬤ A doua ediție a celei mai bine vândute introduceri la învățarea profundă prin întărire, extinsă cu șase capitole noi.
⬤ Învățați tehnici avansate de explorare, inclusiv rețele zgomotoase, pseudo-count și metode de distilare a rețelelor.
⬤ Aplicați metodele RL la platformele robotice hardware ieftine.
Descrierea cărții
Deep Reinforcement Learning Hands-On, ediția a doua este o versiune actualizată și extinsă a ghidului bestseller pentru cele mai recente instrumente și tehnici de învățare prin întărire (RL). Acesta vă oferă o introducere în fundamentele RL, împreună cu abilitatea practică de a codifica agenți inteligenți de învățare pentru a efectua o serie de sarcini practice.
Cu șase capitole noi dedicate unei varietăți de evoluții de ultimă oră în RL, inclusiv optimizare discretă (rezolvarea cubului Rubik), metode multi-agent, mediul Microsoft TextWorld, tehnici avansate de explorare și multe altele, veți ieși din această carte cu o înțelegere profundă a celor mai recente inovații în acest domeniu emergent.
În plus, veți obține informații utile în domenii precum rețele Q profunde, metode gradient de politică, probleme de control continuu și metode non-gradient foarte scalabile. Veți descoperi, de asemenea, cum să construiți un robot hardware real antrenat cu RL pentru mai puțin de 100 $ și să rezolvați mediul Pong în doar 30 de minute de antrenament folosind optimizarea pas cu pas a codului.
Pe scurt, Deep Reinforcement Learning Hands-On, ediția a doua, este partenerul dvs. pentru a naviga prin complexitățile interesante ale RL, deoarece vă ajută să obțineți experiență și cunoștințe prin exemple din lumea reală.
Ce veți învăța
⬤ Înțelegeți contextul deep learning al RL și implementați modele complexe de deep learning.
⬤ Evaluați metodele RL, inclusiv entropia încrucișată, DQN, actor-critic, TRPO, PPO, DDPG, D4PG și altele.
⬤ Construiți un robot hardware practic antrenat cu metode RL pentru mai puțin de 100 $.
⬤ Descoperiți mediul TextWorld de la Microsoft, care este o platformă de jocuri interactive de ficțiune.
⬤ Utilizați optimizarea discretă în RL pentru a rezolva un cub Rubik.
⬤ Învățați-vă agentul să joace Connect 4 folosind AlphaGo Zero.
⬤ Explorați cele mai recente cercetări deep RL pe teme precum AI chatbots.
⬤ Descoperiți tehnici avansate de explorare, inclusiv rețele zgomotoase și tehnici de distilare a rețelelor.
Pentru cine este această carte
Se presupune o anumită fluență în Python. O înțelegere solidă a fundamentelor învățării profunde va fi utilă. Această carte este o introducere în RL profundă și nu necesită cunoștințe de bază în RL.
© Book1 Group - toate drepturile rezervate.
Conținutul acestui site nu poate fi copiat sau utilizat, nici parțial, nici integral, fără permisiunea scrisă a proprietarului.
Ultima modificare: 2024.11.08 07:02 (GMT)