Evaluare:
A doua ediție a cărții „Deep Reinforcement Learning with Python” este lăudată pe scară largă pentru claritatea sa, pentru acoperirea cuprinzătoare a conceptelor de învățare prin consolidare și pentru exemplele practice de codare folosind TensorFlow 2.0 și OpenAI Gym. Cu toate acestea, unii cititori o consideră învechită în ceea ce privește dependențele sale software și frustrantă din cauza lipsei de explicare a conceptelor în anumite exemple.
Avantaje:⬤ Explicații clare și curgerea treptată a conceptelor de la subiectele de bază la cele avansate ale RL.
⬤ Exerciții practice folosind TensorFlow
⬤ 0 și OpenAI Gym care susțin învățarea practică.
⬤ Acoperire foarte detaliată și cuprinzătoare a unei game largi de algoritmi de învățare prin consolidare.
⬤ Ilustrațiile vizuale îmbunătățesc înțelegerea.
⬤ Îmbunătățiri semnificative față de prima ediție, inclusiv explicații matematice detaliate.
⬤ O parte din conținut poate părea învechit, în special datorită dependenței de TensorFlow
⬤ x pentru anumite exemple.
⬤ Lipsa explicațiilor detaliate în unele exemple, ceea ce duce la confuzie cu privire la raționamentul din spatele anumitor alegeri.
⬤ Cartea este lungă (700 de pagini), ceea ce unii cititori consideră copleșitor și pot sugera împărțirea în versiuni pentru începători și avansate.
⬤ Instrucțiunile de instalare pentru mediul de cod sunt considerate insuficiente de unii utilizatori.
(pe baza a 21 recenzii ale cititorilor)
Deep Reinforcement Learning with Python - Second Edition
Un ghid bogat în exemple pentru începători pentru a-și începe călătoria de învățare prin consolidare și consolidare profundă cu algoritmi distincți de ultimă oră
Caracteristici cheie
⬤ Acoperă un spectru vast de algoritmi RL de la bază la avansați cu explicații matematice ale fiecărui algoritm.
⬤ Învățați cum să implementați algoritmi cu cod prin urmărirea exemplelor cu explicații linie cu linie.
⬤ Explorați cele mai recente metodologii RL, cum ar fi DDPG, PPO și utilizarea demonstrațiilor experților.
Descrierea cărții
Cu îmbunătățiri semnificative în calitatea și cantitatea algoritmilor în ultimii ani, această a doua ediție a Hands-On Reinforcement Learning with Python a fost modernizată într-un ghid bogat în exemple pentru a învăța algoritmi de ultimă generație de învățare prin întărire (RL) și RL profundă cu TensorFlow 2 și setul de instrumente OpenAI Gym.
În plus față de explorarea noțiunilor de bază ale RL și a conceptelor fundamentale, cum ar fi ecuația Bellman, procesele decizionale Markov și algoritmii de programare dinamică, această a doua ediție analizează în profunzime întregul spectru al metodelor RL bazate pe valori, pe politici și pe critica actorilor. Ea explorează în profunzime algoritmi de ultimă generație precum DQN, TRPO, PPO și ACKTR, DDPG, TD3 și SAC, demistificând matematica de bază și demonstrând implementările prin exemple simple de cod.
Cartea are câteva capitole noi dedicate noilor tehnici RL, inclusiv RL distribuțional, învățarea prin imitație, RL invers și meta RL. Veți învăța să profitați de liniile de bază stabile, o îmbunătățire a bibliotecii de linii de bază OpenAI, pentru a implementa fără efort algoritmi RL populari. Cartea se încheie cu o prezentare generală a abordărilor promițătoare, cum ar fi meta-învățarea și agenții augmentați de imaginație în cercetare.
Până la sfârșit, veți deveni pricepuți în a utiliza eficient RL și deep RL în proiectele dvs. din lumea reală.
Ce veți învăța
⬤ Înțelegeți conceptele de bază ale RL, inclusiv metodologiile, matematica și codul.
⬤ Formați un agent să rezolve Blackjack, FrozenLake și multe alte probleme utilizând OpenAI Gym.
⬤ Învățați un agent să joace Ms Pac-Man folosind o rețea Deep Q.
⬤ Învățați metodele bazate pe politici, pe valoare și pe critica actorilor.
⬤ Master matematica din spatele DDPG, TD3, TRPO, PPO, și multe altele.
⬤ Explorați noi căi, cum ar fi RL distribuțional, meta RL și RL invers.
⬤ Utilizați Stable Baselines pentru a antrena un agent să meargă și să joace jocuri Atari.
Pentru cine este această carte
Dacă sunteți un dezvoltator de învățare automată cu puțină sau nicio experiență cu rețele neuronale interesat de inteligența artificială și doriți să învățați despre învățarea prin întărire de la zero, această carte este pentru dvs.
Este necesară o familiaritate de bază cu algebra liniară, calculul și limbajul de programare Python. O anumită experiență cu TensorFlow ar fi un plus.
© Book1 Group - toate drepturile rezervate.
Conținutul acestui site nu poate fi copiat sau utilizat, nici parțial, nici integral, fără permisiunea scrisă a proprietarului.
Ultima modificare: 2024.11.08 07:02 (GMT)