slideWindowColorizationUsingOptimization/temp.py at master · LucasandElliot/slideWindowColorizationUsingOptimization · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
import os.path
import time

import cv2
import numpy as np
import cv2 as cv
import colorsys
import matplotlib.pyplot as plt
import scipy.sparse as sparse
from improvingMethod import cannyDection, DCTTransformer, waveletTransform, laplacian
from sympy import *
from scipy.sparse.linalg import gmres

from improvingMethod.improve_edges import improve_edges
from improvingMethod.sobel import soble
from sideWindow.slideWindowAlgorithm import find_best_window

padding = 2  # 窗口半径、图片填充大小
# src放置的是灰度图,marked是放置已经标记成果的图片
photo_name_list = ['example{}'.format(i) for i in range(1, 9)]
gray_data_dir = './data/original'
marked_data_dir = './data/marked'
exp_dir = './exp'
shape = (256, 256)
for photo_name in photo_name_list:
    photo_file_suffix = 'png'
    gray_filename = '{}.{}'.format(photo_name, photo_file_suffix)
    marked_filename = '{}_marked.{}'.format(photo_name, photo_file_suffix)
    src = cv.imread(os.path.join(gray_data_dir, gray_filename))# cv读取的是BGR格式
    # src = cv2.resize(src, shape)
    solve_name = 'grmse'
    model_name = "侧窗_{}_{}结果.jpg".format(photo_name, solve_name)
    fig, ax = plt.subplots(1, 6)
    # sobel检测
    soble_image = soble(src)
    ax[0].imshow(soble_image)
    # 使用Laplacian算子进行边缘检测
    laplacian_image = laplacian.laplacian(src)
    # laplacian = np.clip(laplacian, 0, 255)
    ax[1].imshow(laplacian_image, cmap='gray')
    # canny
    canny = cannyDection.canny_dection(src)
    ax[2].imshow(canny)
    # 小波变换提取高频信息
    waveletImg = waveletTransform.waveletTransform(src)
    ax[3].imshow(waveletImg)
    # DCT保留高频信息,而且在dctTransformer已经限定了范围所以不需要管阈值
    dctImg = DCTTransformer.dctTransformer(src)
    # dctImg = src - dctImg
    ax[4].imshow(dctImg, cmap='gray')
    # improve方法，具体查看md文档
    improve_edges_img = improve_edges(src)
    improve_edges_img = src - improve_edges_img
    ax[5].imshow(improve_edges_img, cmap='gray')

    plt.show()

    # 调整权重
    alpha = 1 / 100
    # src = - alpha * soble_image + src
    # src = - alpha * abs(laplacian_image) + src
    # src = alpha * canny + src
    # src = alpha * dctImg + src
    src = dctImg
    # src = alpha * waveletImg + src
    # src = alpha * improve_edges_img + src


    src = src[:, :, ::-1]  # 第一通道和第三通道互换，实现BGR到RGB转换
    _src = src.astype(float) / 255

    marked = cv.imread(os.path.join(marked_data_dir, marked_filename))
    # marked = cv2.resize(marked, shape)
    marked = marked[:, :, ::-1]
    _marked = marked.astype(float) / 255

    Y, _, _ = colorsys.rgb_to_yiq(_src[:, :, 0], _src[:, :, 1], _src[:, :, 2])  # Y通道是原灰度图的
    _, U, V = colorsys.rgb_to_yiq(_marked[:, :, 0], _marked[:, :, 1], _marked[:, :, 2])  # 待求的U和V是marked图像的
    yuv = colorsys.rgb_to_yiq(_marked[:, :, 0], _marked[:, :, 1], _marked[:, :, 2])
    yuv = np.stack(yuv, axis=2)
    y = yuv[:, :, 0]

    rows = _src.shape[0]
    cols = _src.shape[1]
    size = rows * cols
    # Lab空间优化
    # 转换到 CIELAB 颜色空间
    lab_image = cv2.cvtColor(marked, cv2.COLOR_RGB2Lab)
    # 提取其他通道
    hhash_copy = abs(lab_image[:, :, 1]) + abs(lab_image[:, :, 2]) > 1
    print("在Lab空间的出现差异个数为" + str(len([i for i in hhash_copy.flatten() if i == true])))
    # 统计marked图像中标记过颜色的像素位置
    hhash_copy = abs(_src - _marked).sum(2) > 1e-2
    print("在RGB归一化空间的出现差异个数为" + str(len([i for i in hhash_copy.flatten() if i == true])))
    # 灰度图的U和V为0，但是有颜色的话就会大于0
    hhash_copy = (abs(U) + abs(V)) > 1e-4
    print("在YUV空间上出现差异个数为" + str(len([i for i in hhash_copy.flatten() if i == true])))
    # YUV
    hhash = (abs(U) + abs(V)) > 1e-4
    # RGB归一化
    # hhash = abs(_src - _marked).sum(2) > 1e-2
    # LAB空间
    # hhash = abs(lab_image[:, :, 1]) + abs(lab_image[:, :, 2]) > 1

    print("在最后计算空间上出现差异个数为" + str(len([i for i in hhash.flatten() if i == true])))
    W = sparse.lil_matrix((size, size))
    print("-"*40)

    YY = np.zeros((Y.shape[0] + 2 * padding, Y.shape[1] + 2 * padding))
    for i in range(YY.shape[0]):
        for j in range(YY.shape[1]):
            YY[i, j] = -10  # 填充后可避免越界
    for i in range(Y.shape[0]):
        for j in range(Y.shape[1]):
            YY[i + padding, j + padding] = Y[i, j]

    def find_neighbors(center):  # centre [r,c,y]
        neighbors = []
        # 选出最优窗口
        r_min, r_max, c_min, c_max = find_best_window(YY, Y,  center, padding)
        # 遍历所有的邻居像素
        for r in range(r_min, r_max):
            for c in range(c_min, c_max):
                # 自己本身忽略
                if r == center[0] and c == center[1]:
                    continue
                # 存放邻居像素的xy位置，以及邻居像素的强度，用于后面计算权重的
                neighbors.append([r, c, Y[r, c]])
        return neighbors


    def affinity_a(neighbors, center):  # (r,c,y)
        # 创建一个新的数组，存放权重，同时保留邻居像素的信息，因此可以直接copy数组neighbors
        nbs = np.array(neighbors)
        # 1. 获取邻居像素的强度和中间像素的强度
        sY = nbs[:, 2]  # 邻居像素的强度
        cY = center[2]  # 中间像素的强度
        # 2. 强度差值
        diff = sY - cY
        # 3. 计算均方差
        sig = np.var(np.append(sY, cY))  # 维度相同才可以追加
        if sig < 1e-6:
            sig = 1e-6
        # 4. 根据公式求权重
        wrs = np.exp(- np.power(diff, 2) / (sig * 2))
        # 5. 加权求和，记得wrs是负数
        wrs = - wrs / np.sum(wrs)
        nbs[:, 2] = wrs  # 记录权重
        return nbs


    # 返回值为邻居的权重：[(r,c,w),(r,c,w)]

    # 创建索引
    def to_seq(r, c, cols):
        return r * cols + c
    # 遍历所有像素
    start_time = time.time()
    for r in range(rows):
        for c in range(cols):
            # 1. 将该像素的位置和其强度存在center里面，并计算索引
            center = [r, c, Y[r, c]]  # yuv[(r, c)][0]
            c_idx = to_seq(r, c, cols)
            # 2. 如果该像素没有上过色
            if not hhash[r, c]:
                # 2.1 找到该像素的邻居像素
                neighbors = find_neighbors(center)
                # 2.2 计算权重，weight[0]、weight[1]表示邻居的xy位置，weight[2]表示权重
                weights = affinity_a(neighbors, center)
                # 2.3 放入对应行，因为像素是按顺序遍历的，所以weightData存放的也是按顺序的
                for e in weights:
                    # 2.3.1 计算center像素和邻居像素的索引
                    n_idx = to_seq(e[0], e[1], cols)
                    # 多加入了转换，这里的话迭代的时间较长，所以需要注意
                    n_idx = int(n_idx)
                    c_idx = int(c_idx)
                    # 2.3.2 放入矩阵
                    W[c_idx, n_idx] = e[2]
            # 3. 如果该像素上过色，则直接放入自己本身的信息，权重为1
            W[c_idx, c_idx] = 1.0
    matA = W.tocsr()

    b_u = np.zeros(size)
    b_v = np.zeros(size)
    idx_colored = np.nonzero(hhash.reshape(size))
    u = yuv[:, :, 1].reshape(size)
    b_u[idx_colored] = u[idx_colored]
    v = yuv[:, :, 2].reshape(size)
    b_v[idx_colored] = v[idx_colored]

    # ansU = spsolve(matA, b_u).reshape(marked.shape[0], marked.shape[1])
    # ansV = spsolve(matA, b_v).reshape(marked.shape[0], marked.shape[1])
    ansU, _ = gmres(matA, b_u, maxiter=10000)
    ansU = ansU.reshape(marked.shape[0], marked.shape[1])
    ansV, _ = gmres(matA, b_v, maxiter=10000)
    ansV = ansV.reshape(marked.shape[0], marked.shape[1])

    # YUV转换成rgb格式
    r = Y + 0.9468822170900693 * ansU + 0.6235565819861433 * ansV
    r = np.clip(r, 0.0, 1.0)
    g = Y - 0.27478764629897834 * ansU - 0.6356910791873801 * ansV
    g = np.clip(g, 0.0, 1.0)
    b = Y - 1.1085450346420322 * ansU + 1.7090069284064666 * ansV
    b = np.clip(b, 0.0, 1.0)
    Ans = np.stack((r, g, b), axis=2)

    plt.imshow(Ans)
    plt.title("Colorized_with_sidewindow")
    plt.show()