束搜索 :label: 在 :numref: 中,我们逐个预测输出序列, 直到预测序列中出现特定的序列结束词元“<eos>”。 本节将首先介绍贪心搜索(greedy search)策略, 并探讨其存在的问题,然后对比其他替代策略: 穷举搜索(exhaustive search)和束搜索(beam search)。 在正式介绍贪心搜索之前,我们使用与 :numref: 中 相同的数学符号定义搜索问题。 在任意时间步$t'$,解码器输出$y{t'}$的概率取决于 时间步$t'$之前的输出子序列$y1, \ldots, y{t'-1}$ 和对输入序列的信息进行编码得到的上下文变量$\mathbf{c}$。