1.解码器产生输出前,做一个额外attention: context 向量对应各hidden state加权求和