强化学习：原理与Python实战最新章节全文无弹窗在线阅读-QQ阅读女生青春网

QQ阅读现言女生网

现言女生网

达人推广书架浏览历史

登录 | 注册

书籍简介

本书从原理和实战两个方面介绍了强化学习。原理方面，深入介绍了主流强化学习理论和算法，覆盖资格迹等经典算法和MuZero等深度强化学习算法；实战方面，每章都配套了编程案例，以方便读者学习。全书从逻辑上分为三部分。第1章：从零开始介绍强化学习的背景知识，介绍环境库Gym的使用。第2～15章：基于折扣奖励离散时间Markov决策过程模型，介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论，进而在理论的基础上讲解算法，并为算法提供配套代码实现。基础理论的讲解突出主干部分，算法讲解全面覆盖主流的强化学习算法，包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应，还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章：介绍其他强化学习模型，包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等，以便更好了解强化学习研究的全貌。

品牌：机械工业出版社

上架时间：2023-08-01 00:00:00

出版社：机械工业出版社

本书数字版权由机械工业出版社提供，并由其授权上海阅文信息技术有限公司制作发行

最新章节

肖智清

最新上架

大模型垂直领域低算力迁移：微调、部署与优化
本书是一本深度探讨大模型在低算力环境下实现迁移与微调的实践指南，并深入讲解了大模型的部署与优化策略。书中结合多个垂直领域的应用场景，从理论到技术实现，全程详尽讲解了如何应对大模型在行业落地中的技术挑战，帮助读者逐步掌握大模型的迁移与微调核心技术。无论你是大模型开发者、人工智能研究人员，还是对垂直领域AI应用感兴趣的行业专家，本书都将带你深入大模型的核心领域，提供从构建、优化到部署的全流程指导，助你
程戈计算机13.7万字
会员
大模型实战：微调、优化与私有化部署
本书深入浅出地介绍了现代大型人工智能（ArtificialIntelligence，AI）模型技术，从对话机器人的发展历程和人工智能的理念出发，详细阐述了大模型私有化部署过程，深入剖析了Transformer架构，旨在帮助读者领悟大模型的核心原理和技术细节。本书的讲解风格独树一帜，将深奥的技术术语转化为简洁明了的语言，案例叙述既严谨又充满趣味，让读者在轻松愉快的阅读体验中自然而然地吸收和理解AI
庄建腾海云庄金兰计算机15.8万字
会员
情感计算
在人工智能的研究中，既包括对于人类理性思维的模拟，还包括对人类感性思维的计算。本书重点讲述的文本情感分析技术就属于后者。该技术源于自然语言处理领域，但也有别于一般的自然语言处理任务。文本情感分析面向的处理对象是社交媒体中产生的用户评论文本，该文本的特点是带有大量的用户主观情感信息，因此该技术的核心是通过自动分析评论文本来进行情感的理解。文本情感分析技术已有20余年的研究历史，凝聚成了多项研究任务和
秦兵赵妍妍林鸿飞王素格徐睿峰计算机23.3万字
会员
GPT图解：大模型是怎样构建的
人工智能（AI），尤其是生成式语言模型和生成式人工智能（AIGC）模型，正以惊人的速度改变着我们的世界。驾驭这股潮流的关键，莫过于探究自然语言处理（NLP）技术的深奥秘境。本书将带领读者踏上一段扣人心弦的探索之旅，让其亲身感受，并动手搭建语言模型。本书主要内容包括N-Gram，词袋模型（BoW），Word2Vec（W2V），神经概率语言模型（NPLM），循环神经网络（RNN），Seq2Seq（S2
黄佳计算机14万字
会员
生成式AI实战
本书由浅入深地介绍了生成式AI的理论与实践，内容涉及从基础原理到前沿应用，为读者提供了一个系统的认知框架。本书从生成式AI技术的基础工具入手，逐步深入到Transformer模型与GPT的原理和应用，详细介绍了图像生成模型StableDiffusion，以及LangChain与AIAgent的相关知识。书中结合开源代码分析，展示了生成式AI在各行各业的实际应用，并探讨了其在高速发展过程中所面临
欧阳植昊梁菁菁吕云翔主编计算机11.7万字
会员
智能控制与强化学习：先进值迭代评判设计
在人工智能技术的大力驱动下，智能控制与强化学习发展迅猛，先进自动化设计与控制日新月异。本书针对复杂离散时间系统的优化调节、最优跟踪、零和博弈等问题，以实现稳定学习、演化学习和快速学习为目标，建立一套先进的值迭代评判学习控制理论与设计方法。首先，对先进值迭代框架下迭代策略的稳定性进行全面深入的分析，建立一系列适用于不同场景的稳定性判据，从理论层面揭示值迭代算法能够实现离线最优控制和在线演化控制。其次
王鼎赵明明哈明鸣任进计算机8.7万字
会员
洞察AIGC：智能创作的应用、机遇与挑战
《洞察AIGC：智能创作的应用、机遇与挑战》内容分为3篇：第1篇AIGC的蜕变讲述AIGC的发展历史及其背后的智能；第2篇AIGC的应用讲述AIGC在文学创作、日常办公、知识管理、科研出版、工业制造、健康医疗、金融服务、品牌营销领域的应用现状及常用工具；第3篇AIGC的机遇与挑战讲述AIGC的资本与技术前景，同时提出需要注意的风险。
李海俊计算机13.9万字
会员
PyTorch 2.0深度学习从零开始学
PyTorch是一个开源的机器学习框架，它提供了动态计算图的支持，让用户能够自定义和训练自己的神经网络，目前是机器学习领域中的框架之一。《PyTorch2.0深度学习从零开始学》共分15章，内容包括PyTorch概述、开发环境搭建、基于PyTorch的MNIST分类实战、深度学习理论基础、MNIST分类实战、数据处理与模型可视化、基于PyTorch卷积层的分类实战、PyTorch数据处理与模型可
王晓华计算机11.3万字
会员
ChatGPT漫谈
本书深度探讨了构建和训练ChatGPT模型涉及的核心技术，以及ChatGPT在各种实际应用中的作用。全书精心划分为三部分，其中第1章为第1部分，第2章为第2部分，第3章和第4章为第3部分。首先，详细阐述了机器学习的历史演变与各种学习范式，同时也揭示了在人工智能生成内容（AIGC）领域下，图像处理和自然语言处理技术的历史发展趋势；接下来，对ChatGPT的运行机制和关键算法进行深度解析，包括大规模模
邱才明凌泽南冯湛搏杨昊编著计算机10.8万字

同类书籍最近更新

会员
计算社会学：系统应用篇
自2009年至今，计算社会学步入了发展的黄金时期。多学科的深度交叉融合，以人工智能为代表的数据科学方法的快速发展以及跨空间、多模态数据的快速富集等都使得计算社会学得到蓬勃发展，让社会科学研究呈现出崭新面貌，为解释人类行为、群体认知、社会演化等提供了重要的理论和方法支撑。本书采用渐进式的组织思路，以人工智能的经典模型为基础理论支撑，从社交网络分析、网络动力学、社交媒体挖掘与社群智能三个维度进行延伸，
郭斌梁韵基於志文人工智能24.6万字
会员
人工智能原理与实践
人工智能的日益广泛的应用和普及，而要深入理解人工智能，我们必须全面理解底层的各类机器学习算法基本原理并能驾驭人工智能各种应用。《人工智能原理与实践》分为13章，前7章为原理篇。原理篇中，我们重点讨论机器学习模型建模的全部流程，各类常用的机器学习算法原理，深度学习和强化学习原理，机器学习涉及的优化论原理，以及机器学习和自然语言处理技术。后面6章为实战篇，我们重点讨论信用卡场景中的客户细分，保险行业中
刘春雷人工智能15.9万字
会员
深入理解XGBoost：高效机器学习算法与进阶
本书主要介绍：XGBoost相关的机器学习基础算法；XGBoost安装编译与简单使用；XGBoost的实现原理与理论证明；XGBoost基于CPU多线程的实现以及分布式训练方法；剖析XGBoost源码，从代码层面洞彻XGBoost的实现原理，以及XGBoost的应用与调优，通过典型示例为读者提供使用参考，掌握实战技能。通过阅读本书，不仅能使读者理解XGBoost的原理，将XGBoost应用到业务场
何龙人工智能16.2万字
会员
强化学习：原理与Python实战
本书从原理和实战两个方面介绍了强化学习。原理方面，深入介绍了主流强化学习理论和算法，覆盖资格迹等经典算法和MuZero等深度强化学习算法；实战方面，每章都配套了编程案例，以方便读者学习。全书从逻辑上分为三部分。第1章：从零开始介绍强化学习的背景知识，介绍环境库Gym的使用。第2～15章：基于折扣奖励离散时间Markov决策过程模型，介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理
肖智清人工智能17.2万字
会员
人工智能技术基础
《人工智能技术基础》按照人工智能在不同领域的研究特点，通过专项应用来研究相关技术。全书分为11章，第1章介绍人工智能领域的基本概念，第2章说明Python语言编程工具的使用，第3章到第10章分别从应答机器人、物体识别、人脸识别、语音识别、视频识别、生成对抗神经网络、无人驾驶、区块链和大数据等方面对人工智能从原理到实战一步一步进行介绍，第11章提取了部分人工智能方面的面试题，供未来从事人工智能研究工
李刚编著人工智能9.7万字
会员
基于深度学习的道路短期交通状态时空序列预测
这本书系统阐述了深度学习方法论在道路短期交通状态时空序列预测领域的最新研究成果。需要着重说明以下几点：1.领域限定在了道路交通，因为交通是个大系统，存在着航空、水运、道路等多种运输方式，而本书所阐述的研究均是针对道路交通领域的数据以及面向道路交通领域的应用；2.本书所讨论的研究问题是道路短期交通状态时空序列预测问题，该问题是时空数据挖掘领域中时空预测问题的一个重要子集，在本书的第1章中将会对这个问
崔建勋等编著人工智能11.4万字

关于腾讯About Tencent服务协议开放平台广告服务腾讯招聘腾讯公益客服中心违规举报

达人推广合作：https://kol.yuewen.com

网站合作：傅女士 fuli.a@yuewen.com

双新用户（设备和账号都新为双新用户）下载并登录后1-20天最多可免费领取20本会员/单订书且可免费读10天

Copyright (C) 2025 mag.qq.com All Rights Reserved 上海阅文信息技术有限公司版权所有
粤公网安备 44030002000001号增值电信业务经营许可证：粤B2-20090059 互联网ICP备案号：粤B2-20090059-5 沪ICP备14016804号-3 举报电话：010-59357051 营业执照
网络文化经营许可证：沪网文 (2023) 3296-228号网络出版服务许可证：（署）网出证（沪）字第055号互联网宗教信息服务许可证：沪（2023）0000015