如何使用OpenCV+Keras+Tensorflow實(shí)現(xiàn)去噪算法與自定義預(yù)處理函數(shù)
理解問(wèn)題在處理計(jì)算機(jī)視覺(jué)問(wèn)題時(shí),我們經(jīng)常遇到需要對(duì)整個(gè)數(shù)據(jù)集應(yīng)用某種形式的轉(zhuǎn)換的情況。Keras中的ImageDataGenerator類(lèi)提供了各種轉(zhuǎn)換,如翻轉(zhuǎn)、規(guī)格化等。然而,應(yīng)用在Keras中不可用的自定義轉(zhuǎn)換變得非常困難。
在我們的特定示例中,我們將對(duì)我們的數(shù)據(jù)集應(yīng)用去噪算法作為預(yù)處理轉(zhuǎn)換。一種簡(jiǎn)單的方法是對(duì)數(shù)據(jù)集中的所有圖像應(yīng)用去噪函數(shù),并將處理后的圖像保存在另一個(gè)目錄中。然而,這同時(shí)消耗了我們的時(shí)間和空間。另一種方法是使用preprocessing_function屬性動(dòng)態(tài)地執(zhí)行這個(gè)轉(zhuǎn)換。
為了加載用于訓(xùn)練的圖像,我使用了Keras中實(shí)現(xiàn)的.flow_from_directory()方法。使用OpenCV去噪是相當(dāng)簡(jiǎn)單的,OpenCV提供了幾個(gè)內(nèi)置算法來(lái)實(shí)現(xiàn)這一點(diǎn)。
在本文中,我將展示如何定義我們自己的預(yù)處理函數(shù),將其傳遞給訓(xùn)練生成器,并將圖像直接提供給模型,從而無(wú)需保存它們。本教程大致分為兩部分實(shí)現(xiàn)去噪算法擴(kuò)展預(yù)處理函數(shù)讓我們馬上開(kāi)始吧!第一部分 實(shí)現(xiàn)去噪算法讓我們準(zhǔn)備一個(gè)函數(shù),將圖像作為輸入,應(yīng)用內(nèi)置的去噪算法,并返回處理后的圖像。import cv2
import numpy as np
def preprocessing_fun(filename):
img = cv2.imread(filename)
dst = cv2.fastN1MeansDenoisingColored(img, None, 10, 10, 7, 21)
return dst
我們使用OpenCV的fastN1MeansDenoisingColored算法,因?yàn)樵撍惴ㄟm用于彩色圖像。OpenCV還提供了使用單通道處理圖像的其他算法。fastN1MeansDenoisingColored:https://docs.opencv.org/master/d1/d79/group__photo__denoise.html#ga03aa4189fc3e31dafd638d90de335617現(xiàn)在我們已經(jīng)實(shí)現(xiàn)了我們的算法,讓我們?cè)贗mageDataGenerator類(lèi)中使用它。第2部分 擴(kuò)展預(yù)處理函數(shù)這里,我們使用訓(xùn)練生成器中前一節(jié)定義的函數(shù)。img_datagen = ImageDataGenerator(rescale=1./255,
preprocessing_function = preprocessing_fun)
training_gen = img_datagen.flow_from_directory(PATH, target_size=(224,224),
color_mode='rgb',batch_size=32, shuffle=True)
在定義ImageDataGenerator對(duì)象的前兩行中,你可以注意到我們已經(jīng)將去噪函數(shù)傳遞給了preprocessing_function參數(shù)。通過(guò)這樣做,我們將指示我們的數(shù)據(jù)生成器在將圖像提供給模型之前,將這個(gè)函數(shù)應(yīng)用到每個(gè)圖像上作為預(yù)處理步驟。這樣,我們就不需要處理所有圖像并將它們寫(xiě)入一個(gè)單獨(dú)的目錄。專(zhuān)業(yè)提示:如果你需要執(zhí)行一系列在不同函數(shù)中定義的轉(zhuǎn)換,你可以在你的訓(xùn)練生成器中以以下方式使用它。def transform1(img):
#Applies a transformation such as horizontal flip and returns the image
return cv2.flip(img, 1)
def transform2(img):
#Applies a transformation such as vertical flip and returns the image
return cv2.flip(img, 0)
def transform3(img):
#Applies 180-degree rotation and returns the image
return cv2.rotate(img, cv2.ROTATE_180)
def our_preprocessing_function(filename):
#Combines all the transformations
img = cv2.imread(filename)
img1 = transform1(img)
img2 = transform2(img1)
final_img = transform3(img2)
return final_img
img_datagen = ImageDataGenerator(rescale=1./255,
preprocessing_function = our_preprocessing_function)
training_generator = img_datagen.flow_from_directory(PATH,
target_size=(224,224), color_mode='rgb', batch_size=32,
class_mode='categorical', shuffle=True)
通過(guò)這種方式,我們可以提供一系列自定義轉(zhuǎn)換,將它們包裝在一個(gè)函數(shù)中,并將它們應(yīng)用到我們的數(shù)據(jù)集。此方法簡(jiǎn)單但功能強(qiáng)大,在資源受限的環(huán)境中工作很方便。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
最新活動(dòng)更多
-
7月8日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車(chē)生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身智能機(jī)器人產(chǎn)業(yè)技術(shù)創(chuàng)新應(yīng)用論壇
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
-
即日-2025.8.1立即下載>> 《2024智能制造產(chǎn)業(yè)高端化、智能化、綠色化發(fā)展藍(lán)皮書(shū)》
推薦專(zhuān)題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
- 3 一文看懂視覺(jué)語(yǔ)言動(dòng)作模型(VLA)及其應(yīng)用
- 4 “支付+”時(shí)代,支付即生態(tài) | 2025中國(guó)跨境支付十大趨勢(shì)
- 5 中國(guó)最具實(shí)力AI公司TOP10
- 6 特斯拉Robotaxi上路,馬斯克端上畫(huà)了十年的餅
- 7 張勇等人退出阿里合伙人
- 8 AI的夏天:第四范式VS云從科技VS地平線機(jī)器人
- 9 深圳跑出40億超級(jí)隱形冠軍:賣(mài)機(jī)器人年入6.1億,港股上市
- 10 AI視頻,攪動(dòng)1.5萬(wàn)億市場(chǎng)