在各種常見的行業(yè)應(yīng)用和智能相機(jī)的市場定位中,對OCR識別的需求一直是非常豐富的需求,也是大家關(guān)注的一個方向。本文以智能攝像機(jī)為產(chǎn)品,結(jié)合實(shí)際需求介紹了各種場景下的OCR識別。類型和方法。
首先,關(guān)注一個核心問題:在什么樣的場景中,應(yīng)該選擇哪種類型的智能相機(jī)來滿足OCR識別的要求,以及是否需要深入學(xué)習(xí)。
一、字符識別。
對于一些位置固定、OCR特征清晰明顯、對比度高、背景字符簡單的生產(chǎn)線產(chǎn)品,可以采用傳統(tǒng)的方式進(jìn)行讀取,即采用閾值分割的形式。蝕刻,浮雕字符。內(nèi)置模型已經(jīng)訓(xùn)練了數(shù)百萬個樣本,基本涵蓋了大部分應(yīng)用場景。
二、特征匹配(位置校正)+字符識別。
對于產(chǎn)品在視場中的位置可能發(fā)生變化的一些實(shí)際場景,產(chǎn)品的位置不是固定的,但前景與背景灰度差大,干擾少,可以開啟位置校正輔助字符識別定位,以保證產(chǎn)品移動、旋轉(zhuǎn)等。在每一種情況下,可以定位要識別的字符。附注:打開位置校正后,有必要確保模板區(qū)域始終在相機(jī)的視場內(nèi),否則特征將不匹配,并將繼續(xù)為NG。
三、DL字符識別。
在一些字符形狀和大小不一致、對比度低、背景干擾、字符粘連、變形等場景中,傳統(tǒng)方法效果不佳。這個時候,可以使用深度學(xué)習(xí)。在常見行業(yè)如食品藥品包裝、電子行業(yè)、煙草行業(yè)薄膜、半導(dǎo)體晶體源等都實(shí)現(xiàn)了全行業(yè)覆蓋,無需過多的模型訓(xùn)練就能實(shí)現(xiàn)字符的高效識別和檢測,準(zhǔn)確率基本在三個九以上。
四、DL字符定位+DL字符識別。
在許多實(shí)際的OCR檢測要求中,字符位置不固定,字符大小不均勻,甚至有些要求只檢測視野內(nèi)特定區(qū)域的字符。要應(yīng)對這樣的情況,往往需要深度學(xué)習(xí)定位和深度學(xué)習(xí)識別。使用提高準(zhǔn)確性和穩(wěn)定性,以達(dá)到預(yù)期的效果。
噴墨在食品工業(yè)中會導(dǎo)致字符的大小、深度、形狀和位置的變化。傳統(tǒng)的方法不能準(zhǔn)確定位字符。深度學(xué)習(xí)定位和深度學(xué)習(xí)識別的引入可以有效解決問題。面對只檢測紅框中字符(越界指NG)的實(shí)際需求,傳統(tǒng)的算法模塊無法滿足檢測需求。引入深度學(xué)習(xí)定位輔助,定位框架選擇目標(biāo)區(qū)域,匹配越界過濾器,完美解決應(yīng)用難點(diǎn)。
外包裝行業(yè)需要對盒型噴墨進(jìn)行OCR識別。字符的數(shù)量、長度、大小、位置和攝像頭距離都在變化,為了應(yīng)對字符分割、不同噴墨深度和劃痕等干擾,深度學(xué)習(xí)可以穩(wěn)定地定位和識別。
OCR識別仍然是智能相機(jī)的主要應(yīng)用方向之一。OCR識別的優(yōu)化和更新,也是智能相機(jī)的關(guān)鍵迭代方向。智能攝像機(jī)將結(jié)合市場需求和建議,不斷優(yōu)化算法庫,以適應(yīng)和解決日益多樣化的檢測。場景和任務(wù)。
【聯(lián)系我們】
更多應(yīng)用案例:
二維掃描模組xinzhuanghe.com
本文來自福建遠(yuǎn)景達(dá)xinzhuanghe.com,轉(zhuǎn)載請注明出處!
劉:15359409807