条件去噪扩散概率模型

                     

贡献者: xzllxls; addis

预备知识 去噪扩散概率模型

   条件去噪扩散概率模型(Conditional Denoising Diffusion Model)是去噪扩散概率模型的一个改进版本,通过将源图像信息纳入到模型当中,使得模型可以学习一个从源图像域到目标图像域的映射。

   假设有一个图像转换过程,源图像域图像为 $x$,目标图像域图像为 $y$.

   正向扩散过程的概率转移公式如下:

\begin{equation} q({y_{1:T}}|{y_0}) = \prod\limits_{t = 1}^T {q({y_t}|{y_{t - 1},x})}~, \end{equation}
\begin{equation} q({y_t}|{y_{t - 1}}) = {N}({y_t};\sqrt {\alpha_t} {y_{t - 1}},(1-\alpha_t) \boldsymbol{\mathbf{I}} )~. \end{equation}
其中,$\alpha_t$ 是超参数,决定每轮迭代所添加噪音的方差,其取值范围为 $(0,1)$。

   反向去噪过程的概率转移公式如下:

\begin{equation} {p_\theta }({y_{0:T}|x}) = p({y_T})\prod\limits_{t = 1}^T {{p_\theta }({y_{t - 1}}|{y_t,x})}~, \end{equation}
\begin{equation} {p_\theta }({y_{t - 1}}|{y_t,x}) = N({y_{t - 1}};{\mu _\theta }({x,y_t,\gamma_t}),\sigma_t^2 \boldsymbol{\mathbf{I}} )~. \end{equation}
其中,$y_0$ 为随机采样的高斯噪音,$y_0$~$q(y_0)$;$x$ 为源图像;$p_\theta$ 为参数化的概率转移规则,即为深度神经网络模型所表示,$\gamma_t=\prod\limits_{i=1}^t\alpha_i$。

   参考文献:

  1. C. Saharia, J. Ho, W. Chan, T. Salimans, D. J. Fleet, and M. Norouzi, “Image Super-Resolution via Iterative Refinement,” IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 45, no. 4, pp. 4713–4726, 2023, doi: 10.1109/TPAMI.2022.3204461.

                     

© 小时科技 保留一切权利