方法概论
学习任务
- 监督学习
- 回归
- 分类
- 强化学习:输出是动作/动作序列,唯一的监督信号是偶然的常量反馈。
- 反馈通常有延迟,所以不知道什么时候开始错\对了。
- 常量反馈本身没有多少信息量。
- 无监督学习:创造输入的内部表示,帮助接下来的监督学习和强化学习
信道(Channel)
深度学习模型的输入数据可以有多个信道。图像就是个典型的例子,它有红、绿和蓝三个颜色信道。一个图像可以被表示成一个三维的张量(Tensor),其中的维度对应于信道、高度和宽度。自然语言数据也可以有多个信道,比如在不同类型的嵌入(embedding)形式中。
贝叶斯
贝叶斯决策论是概率框架下实施决策的基本方法。