OCR文字識別其中的一大關(guān)鍵就是兩張圖片相似與否的判斷,所以我們希望尋找一種或多種算法來計(jì)算圖片的相似度。本文將對于項(xiàng)目中使用的比對算法進(jìn)行介紹,并將其聯(lián)合運(yùn)用進(jìn)行初步文字識別。
算法清單
像素點(diǎn)對比
重心對比
投影對比
分塊對比
前提知識
計(jì)算機(jī)處理圖片并不像人這樣可以直觀的理解處理,在計(jì)算機(jī)中的圖像可以看成一個(gè)矩陣,矩陣中的元素是一個(gè)顏色值,這個(gè)值由RGB三個(gè)參數(shù)構(gòu)成,這三個(gè)參數(shù)的取值范圍為0~255。當(dāng)然圖片的表示不只有RGB這一種,其他類型不再詳述。由于0~255的范圍太大了,我們應(yīng)該進(jìn)行圖片的降維——二值化。二值化將圖片變成只由黑色和白色,可以使用OTSU算法。我們再將黑色用1表示,白色用0表示,這樣就得到一個(gè)矩陣,矩陣中只有數(shù)字0和1組成。