Evaluare:
Cartea este foarte recomandată pentru cei implicați în învățarea prin consolidare (RL) aplicată, oferind un ghid practic cu exemple din lumea reală și metode moderne. Deși este bine scrisă și acoperă o gamă largă de subiecte, de la elementele de bază la aplicații avansate, nu este potrivită pentru începători și necesită cunoștințe de statistică, probabilitate și programare Python. Cu toate acestea, formatarea și prezentarea cărții au primit critici.
Avantaje:⬤ Flux excelent și ușor de urmărit împreună cu codurile Python.
⬤ Ghid practic cu exemple și aplicații din lumea reală.
⬤ Acoperă o gamă largă de subiecte de RL, inclusiv concepte avansate.
⬤ Oferă resurse externe pentru o înțelegere mai profundă.
⬤ Potrivit pentru utilizatorii intermediari și practicienii care intenționează să implementeze soluții RL.
⬤ Nu este destinat începătorilor; necesită cunoștințe prealabile de statistică, probabilitate și unele abilități de programare în Python.
⬤ Formatare și calitate slabă a prezentării, cu probleme precum cratima inconsecventă și imagini neclare.
(pe baza a 13 recenzii ale cititorilor)
Mastering Reinforcement Learning with Python: Build next-generation, self-learning models using reinforcement learning techniques and best practices
Obțineți experiență practică în crearea agenților de învățare prin întărire de ultimă generație utilizând TensorFlow și RLlib pentru a rezolva probleme complexe din lumea reală a afacerilor și industriei cu ajutorul sfaturilor experților și al celor mai bune practici
Caracteristici principale:
⬤ Înțelegeți cum funcționează algoritmii și abordările RL de ultimă generație la scară largă.
⬤ Aplicați RL pentru a rezolva probleme complexe în marketing, robotică, lanțul de aprovizionare, finanțe, securitate cibernetică și multe altele.
⬤ Explorați sfaturi și cele mai bune practici de la experți care vă vor permite să depășiți provocările RL din lumea reală.
Descrierea cărții:
Învățarea prin întărire (RL) este un domeniu al inteligenței artificiale (AI) utilizat pentru a crea agenți autonomi cu autoînvățare. Pornind de la o bază teoretică solidă, această carte adoptă o abordare practică și utilizează exemple inspirate din probleme reale din industrie pentru a vă învăța despre RL de ultimă generație.
Începând cu problemele bandit, procesele decizionale Markov și programarea dinamică, cartea oferă o analiză aprofundată a tehnicilor clasice de RL, cum ar fi metodele Monte Carlo și învățarea prin diferențe temporale. După aceea, veți învăța despre învățarea Q profundă, algoritmii gradientului de politică, metodele actor-critic, metodele bazate pe model și învățarea de întărire multi-agent. Apoi, veți face cunoștință cu unele dintre abordările cheie din spatele celor mai de succes implementări RL, cum ar fi randomizarea domeniului și învățarea bazată pe curiozitate.
Pe măsură ce avansați, veți explora mulți algoritmi noi cu implementări avansate folosind biblioteci Python moderne, cum ar fi TensorFlow și pachetul RLlib al lui Ray. De asemenea, veți afla cum să implementați RL în domenii precum robotica, gestionarea lanțului de aprovizionare, marketingul, finanțele, orașele inteligente și securitatea cibernetică, evaluând în același timp compromisurile dintre diferitele abordări și evitând capcanele comune.
Până la sfârșitul acestei cărți, veți stăpâni cum să vă antrenați și să vă implementați proprii agenți RL pentru rezolvarea problemelor RL.
Ce veți învăța:
⬤ Modelați și rezolvați probleme secvențiale complexe de luare a deciziilor utilizând RL.
⬤ Să dezvoltați o înțelegere solidă a modului în care funcționează metodele RL de ultimă generație.
⬤ Utilizați Python și TensorFlow pentru a codifica algoritmi RL de la zero.
⬤ Paralelizați și extindeți implementările RL utilizând pachetul RLlib al lui Ray.
⬤ Cunoașteți în profunzime o mare varietate de subiecte RL.
⬤ Înțelegeți compromisurile dintre diferitele abordări RL.
⬤ Descoperiți și abordați provocările implementării RL în lumea reală.
Pentru cine este această carte:
Această carte este pentru practicienii și cercetătorii experți în învățarea mașinilor care doresc să se concentreze pe învățarea de întărire practică cu Python prin implementarea conceptelor avansate de învățare de întărire profundă în proiecte din lumea reală. Experții în învățarea prin ranforsare care doresc să își avanseze cunoștințele pentru a aborda probleme de luare a deciziilor secvențiale complexe și pe scară largă vor găsi, de asemenea, această carte utilă. Sunt necesare cunoștințe practice de programare Python și învățare profundă, împreună cu experiență anterioară în învățarea prin întărire.
© Book1 Group - toate drepturile rezervate.
Conținutul acestui site nu poate fi copiat sau utilizat, nici parțial, nici integral, fără permisiunea scrisă a proprietarului.
Ultima modificare: 2024.11.08 07:02 (GMT)