圖書搜尋

進階搜尋：

原文書名

中文書名

ISBN

作者名

書訊內容

標籤

圖書類別

本書共由8個章節以及2篇講座組成。在開始閱讀本書前，請務必確認自己電腦跟程式的規格和版本是相同的。否則本書所書寫之結果，可能會因環境不同跟讀者操作出的結果有異，或者導致無法運算。適用本書對象主要為學習過至高三範圍的數學，以及曾有稍微接觸過程式的人（預想第一次接觸Python）。本書基礎至程式的安裝，進階至程式的實際運用都有涉及，請各位讀者不用擔心不懂程式理論，或是學了不會實際操作。第一章「強化學習的定位」說明本書概要及各種專有名詞（例如：AI、監督式學習、無監督式學習等）解釋。第二章「Python的環境構築」說明如何安裝Python，以及如何構築假定環境和如何下載本書舉例說明用的iRL。第三章「監督式學習」學習各種模組公式，他們各自的理論、構造、優缺點及使用時機。第四章「強化學習的問題設定」實際設計機器，由自己親手操作機器來完成任務。設定其狀態、可以觀測到的數值，和報酬。了解強化學習的目的，是為了「透過所有的觀測結果，選擇未來報酬期待值最大的行動」。

給想學「強化學習」的人的第一本書

Makoto Ito (伊藤真)