- 编码器 解码器:RNN
- 编码器输出context向量 ,长度取决于RNN隐藏神经元数量
- RNN处理:
-
假设序列输入是一个句子,这个句子可以由个词表示:。
-
RNN首先将句子中的每一个词映射成为一个向量得到一个向量序列:,每个单词映射得到的向量通常又叫做:word embedding。
-
然后在处理第个时间步的序列输入时,RNN网络的输入和输出可以表示为:
- 输入:RNN在时间步的输入之一为单词经过映射得到的向量。
- 输入:RNN另一个输入为上一个时间步得到的hidden state向量,同样是一个向量。
- 输出:RNN在时间步的输出为 hidden state向量。
-
- word embedding?:
- 提前训练好 或在自有数据集上训练word
- 缺点:所有信息编码到一个context向量中,很难包含所有文本序列的信息→ 002 attention