圖書搜尋
進階搜尋:
原文書名
中文書名
ISBN
作者名
書訊內容
標籤
圖書類別
本書共由8個章節以及2篇講座組成。在開始閱讀本書前,請務必確認自己電腦跟程式的規格和版本是相同的。否則本書所書寫之結果,可能會因環境不同跟讀者操作出的結果有異,或者導致無法運算。
適用本書對象主要為學習過至高三範圍的數學,以及曾有稍微接觸過程式的人(預想第一次接觸Python)。本書基礎至程式的安裝,進階至程式的實際運用都有涉及,請各位讀者不用擔心不懂程式理論,或是學了不會實際操作。
第一章「強化學習的定位」說明本書概要及各種專有名詞(例如:AI、監督式學習、無監督式學習等)解釋。第二章「Python的環境構築」說明如何安裝Python,以及如何構築假定環境和如何下載本書舉例說明用的iRL。第三章「監督式學習」學習各種模組公式,他們各自的理論、構造、優缺點及使用時機。第四章「強化學習的問題設定」實際設計機器,由自己親手操作機器來完成任務。設定其狀態、可以觀測到的數值,和報酬。了解強化學習的目的,是為了「透過所有的觀測結果,選擇未來報酬期待值最大的行動」。
給想學「強化學習」的人的第一本書