今天看啥  ›  专栏  ›  Hic Rhodus, hic salta

人脸识别:人脑认知与计算机算法<4>

Hic Rhodus, hic salta  · 知乎专栏  · AI  · 2016-08-24 17:46
    

文章预览

本篇主题: 生成、 反馈 与 判别 人类学习的过程中伴随着 模仿(生成)、评估(判别或反馈)以及改进,反馈和评估来地越准确越高效,学习的效率也会越高[1]。没有任何形式的反馈,我们不能习得任何能力,而是闭门造车、不断的重复同样的错误,如悲剧性的西西弗斯一般[2]。在强化学习(Reinforcement Learning)中, Agent的学习需要不断的与环境交换信息,从自己的行动产生的结果(评估和反馈)和新的探索选项(Trial and Error)中得到下一步的行走策略。行动产生的结果由回报函数产生,训练的目的和过程在于使汇报函数最大,而不在乎每步训练的精确步骤和策略[3]。人工智能领域的强化学习算法是通过模拟人类学习过程的特征得来的[4]。 在人工智能领域,按照功能可以划分出两类主要的模型:生成模型(Generative Model)和判别模型(Discriminative Model). 生成模 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览