Digit Image Process-HDR曝光融合

Tom Mertens、Jan Kautz等人在”Exposure Fusion”这篇paper中提出了一种简单有效的曝光融合方法,通过将一组不同曝光的图像序列进行直接融合得到一副高质量图像,而不需要先将这些图像序列转化为HDR。传统的HDR做法采用多重曝光获得图像序列,需要将其转换为辐照度估计的radiance map,也就是HDR格式的高动态范围图像,然后再进行tone mapping,将高动态范围图像映射为低动态范围的显示设备能够显示的图像。本文对paper的方法进行介绍,并以python代码进行实作

paper介绍

结果展示

论文中以威尼斯水城的3张不同曝光图像序列作为输入,如下图所示

处理后的图像如下

输入序列中的3幅图像,第1幅曝光时间最短,天空和水面的纹理细节得以保留,而建筑物和船只的很多细节都丢失了。第2幅图像曝光时间适中,天空和水面仍有部分细节,建筑物细节和船只的细节增多。第3幅图曝光时间最长,天空过曝,水面有部分细节,建筑物和船只的细节最为充分。可以看出,经过融合之后的图像结合了3副图像各自的优势,每幅图像不同区域的细节都得以保留,而信息丢失的部分已经尽可能丢弃掉了,效果非常好

该方法的优势

  • pipeline得以简化:通常的HDR做法需要从多张曝光图像序列中合成高动态范围图像,需要恢复相机特定的响应曲线。另外,由于大多数显示设备动态范围有限,不能直接显示HDR图像,需要通过tone mapping压缩动态范围以适应显示设备的动态范围。而本方法则简单很多

  • 不需要担心相机的校准问题,也不需要记录每张照片的曝光时间(响应曲线的校准需要知道每张照片的曝光时间)

  • 曝光序列中可以允许过度曝光的部分,传统HDR方法由于要恢复响应曲线,存在过曝的图像不能使用

Exposure Fusion

曝光融合通过只保留多次曝光图像序列中的“最佳”部分来计算所需的图像。什么是“最佳”是由一组质量度量指标来确定的,通过这些指标来对图像进行衡量并分配权重。最后合成的图像是利用拉普拉斯金字塔进行融合的。该paper中假定所有图像序列都是对齐的

质量衡量标准

由于曝光不足和过度曝光,序列中会包含很多平坦和无色的区域。这样的区域权重应该尽可能少,而颜色鲜艳和细节丰富的区域应该得到充分保留

paper中提出了以下3种指标

  • 对比度(Contrast):将拉普拉斯滤波器应用到每张图像,并取滤波器响应的绝对值,将其作为对比度的简单指标C。对比度越高表明纹理和边缘越多,这部分像素的权重应该更高

  • 饱和度(Saturation):在每个像素位置上进行饱和度测量S,计算方式为R、G、B三通道的标准差

  • 良好曝光(Well-exposedness):希望每个像素位置良好曝光(既不要曝光不足也不要曝光过度),即认为像素值接近中间为最好,例如归一化的像素值为0~1,那么0.5为最好,使用一个均值为0.5的高斯曲线来衡量像素值离0.5的距离,越近代表越好,得到指标E

每个像素不同度量信息相乘,得到每张图像的权重,使用一个幂函数来控制每个指标的影响程度

其中表示曝光序列中的第次曝光,表示像素位置,表示第次曝光图像的像素处的权重

融合

计算每个像素的加权平均值来融合N个图像。需要对权重进行正则化

\begin{equation}
\hat(W{ij,k}) = [\sum{\acute{k}=1}^{N}W{ij,\acute{k}}]^{-1}W{ij,k}
\end{equation}

paper中提到,如果使用简单的权重和图像进行加权平均,得到的融合图像并不让人满意,会在边界产生光晕和接缝问题。最终paper中选择拉普拉斯金字塔来进行多个图像的融合

普拉斯金字塔的详细介绍见另一篇文章Digit Image Process-图像金字塔

python实作

首先导入依赖库

1
2
3
4
import cv2
import copy
import numpy as np
from matplotlib import pyplot as plt

读入图像并显示

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
image_list = [
'images/Balloon-01.jpg',
'images/Balloon-02.jpg',
'images/Balloon-03.jpg',
'images/Balloon-04.jpg',
]
images = np.stack([cv2.imread(name) for name in image_list])

# show sequence
plt.figure(figsize=(16, 12))
for i, im in enumerate(images):
plt.subplot(2,2,i+1)
im = cv2.cvtColor(im, cv2.COLOR_BGR2RGB)
plt.xticks([])
plt.yticks([])
plt.title('image-0{}'.format(i))
plt.imshow(im)

定义对比度、饱和度和良好曝光的权重函数

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
def contrast_weights(im):
# 转为灰度图
gray = cv2.cvtColor(im, cv2.COLOR_BGR2GRAY)
# 进行拉普拉斯算子处理
contrast = cv2.Laplacian(gray, cv2.CV_32F)
# 取绝对值
weights = np.abs(contrast)
return weights

def saturation_weights(im):
# 计算标准差
return im.std(axis=2, dtype=np.float32)

def well_exposedmess_weights(im, sigma=0.2):
return np.prod(np.exp(-((im - 0.5)**2)/(2*sigma)), axis=2, dtype=np.float32)

对图像序列进行权重计算并显示权重图片

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
for i, im in enumerate(images):
plt.figure(figsize=(12, 8))
# origin image
plt.subplot(2,2,1)
im = cv2.cvtColor(im, cv2.COLOR_BGR2RGB)
plt.xticks([])
plt.yticks([])
plt.title('origin')
plt.imshow(im)
c_weights = contrast_weights2(im)
s_weights = saturation_weights2(im)
e_weights = well_exposedmess_weights2(im)
plt.subplot(2,2,2)
plt.xticks([])
plt.yticks([])
plt.title('contrast')
plt.imshow(c_weights, cmap='gray')
plt.subplot(2,2,3)
plt.xticks([])
plt.yticks([])
plt.title('saturation')
plt.imshow(s_weights, cmap='gray')
plt.subplot(2,2,4)
plt.xticks([])
plt.yticks([])
plt.title('well-exposedmess')
plt.imshow(e_weights, cmap='gray')

图像1的原图、对比度图、饱和度图以及曝光良好图

图像2的原图、对比度图、饱和度图以及曝光良好图

图像3的原图、对比度图、饱和度图以及曝光良好图

图像4的原图、对比度图、饱和度图以及曝光良好图

可以看到对比度图能够提取图像明显的边缘细节,对比度图能够踢球色彩艳丽的区域,曝光良好图能够提取亮度适中的区域

定义曝光融合函数

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
def exposure_fusion(images, measure_weights=(1.0, 1.0, 1.0), best_expo=0.5, sigma=0.2, 
layers_nr=7):
# 图像转为float32,归一化
images = np.stack([im.astype('float32')/255 for im in images], axis=0)
# 正则化函数
normalize = lambda x: x / np.expand_dims(np.sum(x, axis=0), axis=0)

# 权重计算
weights = []
for i in range(len(images)):
# 计算每幅图像的对比度
c_weights = contrast_weights2(images[i])
# 计算每幅图像的饱和度
s_weights = saturation_weights2(images[i])
# 计算每幅图像的曝光良好情况
e_weights = well_exposedmess_weights2(images[i])
# 对比度、饱和度、曝光良好融合
weight = np.power(c_weights, measure_weights[0]) * \
np.power(s_weights, measure_weights[1]) * \
np.power(e_weights, measure_weights[2])
#print(weight)
weights.append(weight)
#layers_show(weights)
weights = np.stack(weights, axis=0)
weights += 1e-12
# 权重归一化
weights = normalize(weights)

# 像素值恢复到0~255区间
images *= 255

# 计算图像的拉普拉斯金字塔
images_LPyrs = []
for i in range(len(images)):
LPyrs = laplace_pyramid(images[i], layers_nr)
images_LPyrs.append(LPyrs)
layers_info_print(images_LPyrs[0], 'images_LPyrs')

# 计算权重的高斯金字塔
weight_GPyrs = []
for i in range(len(weights)):
GPyrs = gaussian_pyramid(weights[i], layers_nr)
weight_GPyrs.append(GPyrs)
layers_info_print(weight_GPyrs[0], 'weight_GPyrs')

# 计算融合的拉普拉斯金字塔
fused_LPyrs = [np.sum([images_LPyrs[k][n] *
np.atleast_3d(weight_GPyrs[k][layers_nr - n -1]) for k in range(len(images))], axis=0) for n in range(layers_nr)]

# 迭代融合
start = fused_LPyrs[0]
#print('start shape:{}'.format(start.shape))
for i in range(1, layers_nr):
upsample = cv2.resize(start, (fused_LPyrs[i].shape[1], fused_LPyrs[i].shape[0]))
start = fused_LPyrs[i] + upsample
start = np.clip(start, 0, 255).astype("uint8")
plt.imshow(cv2.cvtColor(start, cv2.COLOR_BGR2RGB))

融合结果如下

Reference