有没有最新的深度学习和深度强化学习的教学资源?( 三 )


语言理解
来自CMU的GrahamNeubig主讲这门课《自然语言理解》,共分为三部分:语言建模、序列传导(sequencetransduction)和语言分析 。从现象到原理到解决方案,由浅入深,图文并茂 。语言建模部分介绍了NLP中的一些基本知识:词袋模型(BOW)、连续词袋模型(CBOW)、DeepCBOW、Bagofn-grams、池化、NLP预测任务中的神经网络基本思路等 。此外,这部分还介绍了用于NLP任务时CNN、RNN的优缺点 。序列传导部分介绍了条件语言模型(ConditionedLanguageModel)、生成问题、句子表征和注意力机制 。第三部分语言分析介绍了三个分析任务:标注、句法分析和语义分析 。
多模型学习
GoogleAI研究科学家JamieKiros主讲这门课,主要介绍GroundedLanguageLearning,共分为三个部分:GroundingandScope、构造块(包括当前最佳实践),以及与其他研究之间的关系 。第一部分介绍了naturallanguagegrounding的发展历史以及两种主要方法:Tietrainingandevaluationscopes、Growtrainingscope,evaluateinworldscope 。第二部分介绍了五个通用组件:编码、解码、交互(interaction)、预测/控制、目标函数;三种交互方式:Scoring、Fusion和Modulation 。第三部分介绍了与GroundedLanguageLearning相关的研究领域:Contextualization、Multi-aptrepresentations、RelevanceRealization、Specificity、自然语言生成和对话 。
计算神经科学
主题为「大脑中的深度学习」 。这门课从「为什么深度学习不止用于AI?」这个问题入手,指出深度学习研究的目标之一是理解大脑的运行原理 。然后指出深度学习需要什么:根据隐藏层对网络输出的贡献向神经突触分配信用(credit) 。接着介绍解决方案——反向传播,以及原版反向传播的生物问题 。最后介绍了四个问题:errorterm、下游权重(downstreamweight)、derivatvesofspikes和前向/反向传输 。
强化学习夏季课程另外一系列优秀的资源,它从强化学习的「启蒙」到深度强化学习与模仿学习介绍了RL的主要脉络与基础 。不过强化学习夏季课程可能需要一些数学基础,这样才能比较好地理解随机采样等具体方法 。
此外,读者也可以查看阿尔伯塔大学计算机系博士YuxiLi的深度强化学习手稿,这份150页的手稿从值函数、策略、奖赏和模型等六个核心元素详细介绍了深度强化学习的方向与细节 。
下图展示了强化学习夏季课程的主题与演讲者,我们只简要介绍RichardSutton给我们的强化学习「启蒙」 。
在Sutton的课程中,他首先介绍了在9月份正式发布的《ReiforcementLearning:AnIntrifuction》第二版,这本书的电子版同样可以从Sutton的主页获得 。随后Sutton从生物学基础开始介绍了什么是强化学习,即给定环境和状态的情况下智能体会采取某个行动,而这个行动又会影响到环境,因此影响后的环境将反馈给智能体一些奖励或惩罚,这样智能体在不同的环境下就知道该采取什么样的行动 。
当然Sutton还介绍了强化学习的很多基本概念,包括什么是智能体、环境和策略等,此外也讨论了很多基本的强化学习方法,包括马尔可夫决策过程和Q学习等 。
该课程最近还放出了课程视频,不过这些视频并没有带英文字幕,因此考验你们听力的时候到了 。
视频地址:http://videolectures.net/DLRLsummerschool2018_toronto/
深度学习夏季课程
强化学习夏季课程
每一个视频在边栏都提供了对应的课程资料,且视频只包含讲师的介绍而不包含对应的PPT,所以如果读者要学习的话,不仅听力要好,同时还得根据内容手动翻PPT 。

有没有最新的深度学习和深度强化学习的教学资源?

文章插图
推荐一本《深度强化学习落地指南》,电子工业出版社2021年出版的新书 。


特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。