1. 方法概论

1.1. 学习任务

  • 监督学习
    • 回归
    • 分类
  • 强化学习:输出是动作/动作序列,唯一的监督信号是偶然的常量反馈。
    • 反馈通常有延迟,所以不知道什么时候开始错\对了。
    • 常量反馈本身没有多少信息量。
  • 无监督学习:创造输入的内部表示,帮助接下来的监督学习和强化学习

1.2. 信道(Channel)

深度学习模型的输入数据可以有多个信道。图像就是个典型的例子,它有红、绿和蓝三个颜色信道。一个图像可以被表示成一个三维的张量(Tensor),其中的维度对应于信道、高度和宽度。自然语言数据也可以有多个信道,比如在不同类型的嵌入(embedding)形式中。

2. 贝叶斯

贝叶斯决策论是概率框架下实施决策的基本方法。

results matching ""

    No results matching ""