全く、強化学習の知識はなく、機械学習は少しは勉強したことがある程度です。機械学習では教師あり学習、教師なし学習、そして強化学習に分類されると一般にはありますが、そのような記述から興味を持ちました。しかし、本書では最初からかなりの知識をある人を対象に説明がなされているようで、かつプログラムのサンプルコードがないために、読み進めるのは非常に困難です。それでも1章は強化学習の概要をつかむにはベストかもしれません。2章になるとすでに初学者にとっては難しいです。ですので私にとっては必要な時に必要な部分を見たり、参考文献は豊富に紹介されているので、そちらを活用することになりそうです。内容は本としては現在の最先端を行っているのではないでしょうか?
この注文でお急ぎ便、お届け日時指定便を無料体験
Amazonプライム無料体験について
Amazonプライム無料体験について
プライム無料体験をお試しいただけます
プライム無料体験で、この注文から無料配送特典をご利用いただけます。
非会員 | プライム会員 | |
---|---|---|
通常配送 | ¥460 - ¥500* | 無料 |
お急ぎ便 | ¥510 - ¥550 | |
お届け日時指定便 | ¥510 - ¥650 |
*Amazon.co.jp発送商品の注文額 ¥3,500以上は非会員も無料
無料体験はいつでもキャンセルできます。30日のプライム無料体験をぜひお試しください。
新品:
¥4,620¥4,620 税込
発送元: Amazon.co.jp 販売者: Amazon.co.jp
新品:
¥4,620¥4,620 税込
発送元: Amazon.co.jp
販売者: Amazon.co.jp
中古品 - 非常に良い
¥419¥419 税込
配送料 ¥370 4月17日-19日にお届け
発送元: ブックマーケティング(ご注文確定前に表示の到着予定日をご確認下さい、ご注文後のキャンセルご遠慮下さい 販売者: ブックマーケティング(ご注文確定前に表示の到着予定日をご確認下さい、ご注文後のキャンセルご遠慮下さい
中古品 - 非常に良い
¥419¥419 税込
配送料 ¥370 4月17日-19日にお届け
発送元: ブックマーケティング(ご注文確定前に表示の到着予定日をご確認下さい、ご注文後のキャンセルご遠慮下さい
販売者: ブックマーケティング(ご注文確定前に表示の到着予定日をご確認下さい、ご注文後のキャンセルご遠慮下さい

無料のKindleアプリをダウンロードして、スマートフォン、タブレット、またはコンピューターで今すぐKindle本を読むことができます。Kindleデバイスは必要ありません。
ウェブ版Kindleなら、お使いのブラウザですぐにお読みいただけます。
携帯電話のカメラを使用する - 以下のコードをスキャンし、Kindleアプリをダウンロードしてください。
これからの強化学習 単行本(ソフトカバー) – 2016/10/27
このページの読み込み中に問題が発生しました。もう一度試してください。
{"desktop_buybox_group_1":[{"displayPrice":"¥4,620","priceAmount":4620.00,"currencySymbol":"¥","integerValue":"4,620","decimalSeparator":null,"fractionalValue":null,"symbolPosition":"left","hasSpace":false,"showFractionalPartIfEmpty":true,"offerListingId":"biaCbHrqL5q%2BcO1mA9YUTxGNgbLk%2F1NjcRvBhMMZC0EEhyiYokxfOgvZlCtvf8eWMgYieS%2FmSxy3S0h438NPgoc2u2cXHYHlX%2BVSMJ5UY21eDZqsj1%2BcPNtax4jY%2B8dn8PsJXudyo3E%3D","locale":"ja-JP","buyingOptionType":"NEW","aapiBuyingOptionIndex":0}, {"displayPrice":"¥419","priceAmount":419.00,"currencySymbol":"¥","integerValue":"419","decimalSeparator":null,"fractionalValue":null,"symbolPosition":"left","hasSpace":false,"showFractionalPartIfEmpty":true,"offerListingId":"biaCbHrqL5q%2BcO1mA9YUTxGNgbLk%2F1NjoVx1FPOOFsXnQRMuG9lRcrSRqFxhtayDpCmxEFKN2K2nSOHiwVXzocGg4QF%2B6NNewedy4mTZUFVMPpNs13KyL%2BoaN6kDUZWDl9EX2jB6ON99yZ6QjK3DMoHF7Z1gY07gUOlUNchAMW5z%2FD4YRMuKjw%3D%3D","locale":"ja-JP","buyingOptionType":"USED","aapiBuyingOptionIndex":1}]}
購入オプションとあわせ買い
◆強化学習は「ポストビッグデータ」の技術である!
人工知能,金融工学,ロボット制御,言語処理,生産現場やサービスの最適化,あらゆる分野に応用が広がる強化学習.十分なデータが与えられることが前提とされる他の機械学習法と異なり「,足りないデータを集めながら最適化すること」に力点を置く強化学習は,ビッグデータの先を行くための重要な技術となることが期待されます.
◆強化学習の「いま」を知り「,これから」を切り拓くための1冊.
本書では,この分野を代表する執筆陣が集い,強化学習の基礎・発展・応用を多面的に解説します.
・基礎:強化学習の動作原理と基本アルゴリズムを,初学者でも分かるように導入.
・発展:より複雑な問題に対処し,高度な研究に進むための,さまざまな発展的手法を解説<.br> ・応用:マルチロボットシステムの制御,対話処理,医療データ分析,囲碁の対局など広範な応用例・研究事例を通して,強化学習の活用法を紹介.人間の行動や脳の動作を説明するモデルとしての理論・実験も解説.
――強化学習の基礎を学びたい方,発展的手法に触れたい方,応用可能性を一望したい方に最適な1冊!
◆電子版が発行されました/詳細は,森北出版Webサイトにて
【目次】
第1章 強化学習の基礎的理論
1.1 強化学習とは
1.2 強化学習の構成要素
1.3 価値反復に基づくアルゴリズム
1.4 方策勾配に基づくアルゴリズム
1.5 部分観測マルコフ決定過程と強化学習
第2章 強化学習の発展的理論
2.1 統計学習の観点から見たTD学習
2.2 強化学習アルゴリズムの理論性能解析とベイズ統計による強化学習のモデル化
2.3 逆強化学習(Inverse Reinforcement Learning)
2.4 試行錯誤回数の低減を指向した手法:経験強化型学習XoL
2.5 群強化学習法
2.6 リスク考慮型強化学習
2.7 複利型強化学習
第3章 強化学習の工学応用
3.1 高次元・実環境における強化学習
3.2 連続的な状態・行動空間への拡張:マルチロボットシステムへの適用
3.3 対話処理における強化学習
3.4 マルチエージェント系の報酬設計
3.5 自然言語処理における逆強化学習・模倣学習の適用
3.6 医療臨床データ分析への応用
3.7 深層学習を用いたQ関数の学習: Atari 2600と囲碁への応用
第4章 知能のモデルとしての強化学習
4.1 脳の意思決定機構と強化学習
4.2 内発的動機付けによるエージェントの学習と発達
おわりに
索引
人工知能,金融工学,ロボット制御,言語処理,生産現場やサービスの最適化,あらゆる分野に応用が広がる強化学習.十分なデータが与えられることが前提とされる他の機械学習法と異なり「,足りないデータを集めながら最適化すること」に力点を置く強化学習は,ビッグデータの先を行くための重要な技術となることが期待されます.
◆強化学習の「いま」を知り「,これから」を切り拓くための1冊.
本書では,この分野を代表する執筆陣が集い,強化学習の基礎・発展・応用を多面的に解説します.
・基礎:強化学習の動作原理と基本アルゴリズムを,初学者でも分かるように導入.
・発展:より複雑な問題に対処し,高度な研究に進むための,さまざまな発展的手法を解説<.br> ・応用:マルチロボットシステムの制御,対話処理,医療データ分析,囲碁の対局など広範な応用例・研究事例を通して,強化学習の活用法を紹介.人間の行動や脳の動作を説明するモデルとしての理論・実験も解説.
――強化学習の基礎を学びたい方,発展的手法に触れたい方,応用可能性を一望したい方に最適な1冊!
◆電子版が発行されました/詳細は,森北出版Webサイトにて
【目次】
第1章 強化学習の基礎的理論
1.1 強化学習とは
1.2 強化学習の構成要素
1.3 価値反復に基づくアルゴリズム
1.4 方策勾配に基づくアルゴリズム
1.5 部分観測マルコフ決定過程と強化学習
第2章 強化学習の発展的理論
2.1 統計学習の観点から見たTD学習
2.2 強化学習アルゴリズムの理論性能解析とベイズ統計による強化学習のモデル化
2.3 逆強化学習(Inverse Reinforcement Learning)
2.4 試行錯誤回数の低減を指向した手法:経験強化型学習XoL
2.5 群強化学習法
2.6 リスク考慮型強化学習
2.7 複利型強化学習
第3章 強化学習の工学応用
3.1 高次元・実環境における強化学習
3.2 連続的な状態・行動空間への拡張:マルチロボットシステムへの適用
3.3 対話処理における強化学習
3.4 マルチエージェント系の報酬設計
3.5 自然言語処理における逆強化学習・模倣学習の適用
3.6 医療臨床データ分析への応用
3.7 深層学習を用いたQ関数の学習: Atari 2600と囲碁への応用
第4章 知能のモデルとしての強化学習
4.1 脳の意思決定機構と強化学習
4.2 内発的動機付けによるエージェントの学習と発達
おわりに
索引
- 本の長さ320ページ
- 言語日本語
- 出版社森北出版
- 発売日2016/10/27
- 寸法15.7 x 1.7 x 22 cm
- ISBN-104627880316
- ISBN-13978-4627880313
よく一緒に購入されている商品

対象商品: これからの強化学習
¥4,620¥4,620
最短で4月8日 火曜日のお届け予定です
残り2点 ご注文はお早めに
¥3,300¥3,300
最短で4月8日 火曜日のお届け予定です
残り2点(入荷予定あり)
総額: $00$00
当社の価格を見るには、これら商品をカートに追加してください。
ポイントの合計:
pt
もう一度お試しください
追加されました
一緒に購入する商品を選択してください。
似た商品をお近くから配送可能
ページ: 1 / 1 最初に戻るページ: 1 / 1
商品の説明
出版社からのコメント
◆電子版が発行されました/詳細は,森北出版Webサイトにて
著者について
牧野貴樹 グーグル株式会社
澁谷長史 筑波大学 助教
白川真一 横浜国立大学 講師
浅田稔 大阪大学 教授
麻生英樹 産業技術総合研究所
荒井幸代 千葉大学 教授
飯間等 京都工芸繊維大学 准教授
伊藤真 沖縄科学技術大学院大学
大倉和博 広島大学 教授
黒江康明 京都工芸繊維大学 教授
杉本徳和 情報通信研究機構
坪井祐太 日本IBM東京基礎研究所
銅谷賢治 沖縄科学技術大学院大学 教授
前田新一 京都大学 助教
松井藤五郎 中部大学 准教授
南泰浩 電気通信大学 教授
宮崎和光 独立行政法人大学改革支援・学位授与機構 准教授
目黒豊美 NTTコミュニケーション科学基礎研究所
森村哲郎 日本IBM東京基礎研究所
森本淳 ATR脳情報研究所
保田俊行 広島大学 助教
吉本潤一郎 奈良先端科学技術大学院大学 准教授
澁谷長史 筑波大学 助教
白川真一 横浜国立大学 講師
浅田稔 大阪大学 教授
麻生英樹 産業技術総合研究所
荒井幸代 千葉大学 教授
飯間等 京都工芸繊維大学 准教授
伊藤真 沖縄科学技術大学院大学
大倉和博 広島大学 教授
黒江康明 京都工芸繊維大学 教授
杉本徳和 情報通信研究機構
坪井祐太 日本IBM東京基礎研究所
銅谷賢治 沖縄科学技術大学院大学 教授
前田新一 京都大学 助教
松井藤五郎 中部大学 准教授
南泰浩 電気通信大学 教授
宮崎和光 独立行政法人大学改革支援・学位授与機構 准教授
目黒豊美 NTTコミュニケーション科学基礎研究所
森村哲郎 日本IBM東京基礎研究所
森本淳 ATR脳情報研究所
保田俊行 広島大学 助教
吉本潤一郎 奈良先端科学技術大学院大学 准教授
登録情報
- 出版社 : 森北出版 (2016/10/27)
- 発売日 : 2016/10/27
- 言語 : 日本語
- 単行本(ソフトカバー) : 320ページ
- ISBN-10 : 4627880316
- ISBN-13 : 978-4627880313
- 寸法 : 15.7 x 1.7 x 22 cm
- Amazon 売れ筋ランキング: - 416,816位本 (本の売れ筋ランキングを見る)
- - 1,292位人工知能
- カスタマーレビュー:
著者について
著者をフォローして、新作のアップデートや改善されたおすすめを入手してください。

著者の本をもっと見つけたり、似たような著者を調べたり、おすすめの本を読んだりできます。
カスタマーレビュー
星5つ中4.1つ
5つのうち4.1つ
12グローバルレーティング
評価はどのように計算されますか?
全体的な星の評価と星ごとの割合の内訳を計算するために、単純な平均は使用されません。その代わり、レビューの日時がどれだけ新しいかや、レビューアーがAmazonで商品を購入したかどうかなどが考慮されます。また、レビューを分析して信頼性が検証されます。
上位レビュー、対象国: 日本
レビューのフィルタリング中にエラーが発生しました。ページを再読み込みしてください。
- 2017年4月15日に日本でレビュー済みAmazonで購入
- 2018年5月27日に日本でレビュー済みAmazonで購入強化学習の本はあまり多くないので、まとまった内容でしかも翻訳でない専門書はありがたいのですが、残念なことに間違いが多すぎます。出版社から正誤表(https://www.morikita.co.jp/exclusive/download/1890)がでていますが、刷が増えるたびに修正が増えているような。。。決定的な式の間違いに気づかないまま出版されたことが不思議です。
どこかで読んだことがあると思ったら、内容は2013年に計測自動制御学会にリレー解説された内容のようです。著者が個別に書いた解説がほぼそのまま載せられているので、繰り返し説明されている部分も多く、他の本のように体系化されてはいませんでした。
ある程度強化学習を知っていて、間違いを自己訂正しながら読める人であればいいと思います。初学者は悩むと思います。
- 2019年8月18日に日本でレビュー済み1.4節の「方策勾配に基づくアルゴリズム」の説明は丁寧で、大変参考になった。というのも、Policyベースのアルゴリズムは理解が難しく、その説明に関して適切な書籍があまり見当たらなかった。
本書では、Policyベースの中で代表的な「方策勾配を用いたアルゴリズム」の基本的な考え方を、「価値反復に基づいたアルゴリズム」と比較しながら、わかりやすく説明している。
さらに、そこから「方策勾配法」を導出し、さらにその近似例である「REINFORCEアルゴリズム」との関係もわかりやすい。
- 2019年2月23日に日本でレビュー済みSuttonの「強化学習」では,昨今の強化学習を捉えられなくなった.これまでの歴史を踏まえて,基礎的なことから具体例を示しながら,かつ数学的にもわかりやすく示されている.Suttonの「強化学習」では整理しづらかった理論も,よくまとめられている.大学2~4年生くらいの数学は必要となりますが,本質を理解するにはその数学をもう一度少し復習する,あるいは独学するくらいのことを行う必要はある気がします.研究室のゼミに使用させてもらっています.日本で強化学習を学問的に積み上げるために重要な一冊.大学などで強化学習の研究を進める人,企業の研究所で働いている方には参考となる一冊だと思います.
現在,DeepLearningを中心とする教師あり学習が花盛りだが,NeuralNetworkのuniversalな関数近似能力によるところが大きい.Deep-Q-Learningも同様であり,たとえ教師あり学習としての関数近似能力が高くても,強化学習はその外側のより包括的な枠組み(強化学習の一部で価値関数の近似をおこなっている)ため,様々な強化学習の側面を理解・認識するには,このような多面的な書籍が役立つと思います.
ただ,数式の間違いもあり,最近出てきた他の書も合わせて検討するのがよいかもしれません.