日前,由國(guó)家發(fā)改委批準(zhǔn),中國(guó)中小企業(yè)協(xié)會(huì)發(fā)起,聯(lián)合中國(guó)銀行業(yè)協(xié)會(huì)等國(guó)家級(jí)行業(yè)協(xié)會(huì)共同舉辦的第九屆中國(guó)中小企業(yè)投融資交易會(huì)在北京順利開幕。其中,“2021年金融服務(wù)中小微企業(yè)案例征集活動(dòng)”結(jié)果正式揭曉,易道博識(shí)憑借“智能結(jié)構(gòu)化平臺(tái)”獲得“2021年金融服務(wù)中小微企業(yè)優(yōu)秀案例”榮譽(yù)。
本次案例征集活動(dòng)得到了中國(guó)銀行業(yè)諸多金融機(jī)構(gòu)和科技企業(yè)的積極響應(yīng)和火熱參與,共收到308家金融機(jī)構(gòu)和科技企業(yè)申報(bào)的478個(gè)案例。征集活動(dòng)邀請(qǐng)了權(quán)威專家評(píng)委,對(duì)申報(bào)案例進(jìn)行全方位的細(xì)致評(píng)審,提煉總結(jié)金融機(jī)構(gòu)運(yùn)用數(shù)字化手段打通融資難點(diǎn)、堵點(diǎn),提升金融服務(wù)的覆蓋率、可得性、滿意度的各類嘗試、經(jīng)驗(yàn)和做法,有力樹立金融機(jī)構(gòu)支持中小微企業(yè)的典范。
解決90%以上的識(shí)別需求,且自主可控
隨著銀行業(yè)務(wù)的發(fā)展,越來越多的業(yè)務(wù)線中涉及的紙質(zhì)憑證影像需要用到OCR自動(dòng)處理,來進(jìn)一步提升業(yè)務(wù)辦理的效率。
這些憑證影像按照格式可以分為兩類:一類是固定格式的憑證(戶口本、港澳臺(tái)身份證、外國(guó)人永久居留證等);一類是非固定格式的憑證(銀行流水等)。其中固定格式業(yè)務(wù)類憑證占行內(nèi)90%以上,這些憑證存在以下特點(diǎn):
種類多:行內(nèi)在各個(gè)業(yè)務(wù)受理過程中涉及到的憑證都在百種以上,甚至多達(dá)幾百種;
更新頻繁:不少憑證會(huì)隨著業(yè)務(wù)需求或者監(jiān)管制度的變化而調(diào)整格式。
基于以上特點(diǎn),對(duì)憑證的OCR識(shí)別工作就特別復(fù)雜。目前存在兩種解決方案:
一種是委托技術(shù)提供商做定制開發(fā):按照憑證種類委托OCR廠商進(jìn)行定制開發(fā),逐一支持各類憑證;
另一種,是基于OCR底層能力進(jìn)行自研:基于OCR廠商提供的底層識(shí)別能力(文字、表格、手寫體、印章等識(shí)別能力),自己投入研發(fā)力量從代碼層面開發(fā)針對(duì)各類票據(jù)的OCR功能。
不過,以上兩種方式均存在一些缺陷:第一種方案,持續(xù)投入高,需要廠商就每一種憑證進(jìn)行定制化開發(fā)。第二種方案,成本投入更高,不僅需要采購(gòu)廠商底層能力,而且需要OCR專家團(tuán)隊(duì)的支持。因此,銀行迫切需要一個(gè)能夠減少后續(xù)投入,自主可控的解決方案。
易道博識(shí)智能結(jié)構(gòu)化平臺(tái)(簡(jiǎn)稱平臺(tái)),基于深度學(xué)習(xí)的計(jì)算機(jī)視覺技術(shù),自動(dòng)從非結(jié)構(gòu)化數(shù)字信息中抽取目標(biāo)數(shù)據(jù)。模板定制過程簡(jiǎn)單、直觀,無需硬編碼,全程可視化操作。只要將需要提取的信息選出加入訓(xùn)練即可,一個(gè)版式5-10分鐘可完成,并且根據(jù)答案進(jìn)行模板自行調(diào)整,不斷提升結(jié)構(gòu)化水平。
這種方案可以解決銀行90%以上的固定格式業(yè)務(wù)憑證的識(shí)別,為銀行已搭建的識(shí)別平臺(tái)提供結(jié)構(gòu)化方法,實(shí)現(xiàn)有效降低信息提取和錄入的人力成本。
切實(shí)降本增效,3大系統(tǒng)日均人工錄入量降至1%以下
在某銀行上線OCR智能識(shí)別平臺(tái)后,陸續(xù)有多個(gè)業(yè)務(wù)系統(tǒng)與OCR智能識(shí)別平臺(tái)對(duì)接,各系統(tǒng)應(yīng)用OCR前后對(duì)比圖如下:
在集成智能結(jié)構(gòu)化平臺(tái)之前,很多業(yè)務(wù)系統(tǒng)需要多人錄入數(shù)據(jù),耗時(shí)長(zhǎng)、效率低、出錯(cuò)率高;在應(yīng)用平臺(tái)之后,只需要將電子憑證上傳至平臺(tái),平臺(tái)可直接將電子化信息轉(zhuǎn)換為可編輯數(shù)據(jù)并返回至業(yè)務(wù)系統(tǒng),實(shí)現(xiàn)了錄入信息的自動(dòng)化,幾乎完全替代人工錄入,極大改善客戶體驗(yàn)。
而且,平臺(tái)通過對(duì)銀行憑證的定制化訓(xùn)練,實(shí)現(xiàn)數(shù)據(jù)結(jié)構(gòu)化目的,生成的模型仍在原OCR平臺(tái)運(yùn)行,架構(gòu)保持不變。流程及步驟如下:
在智能結(jié)構(gòu)化平臺(tái)中,智能模板管理系統(tǒng)的主要功能是快速生成目標(biāo)版式的結(jié)構(gòu)化模板,為識(shí)別平臺(tái)提供結(jié)構(gòu)化方法,并在本系統(tǒng)中存儲(chǔ)和管理這些模板。通過智能模板系統(tǒng)的可視化界面,可以定義模板的輸出字段,并進(jìn)行必要的圖像標(biāo)注工作,從而為智能模板算法提供元數(shù)據(jù)。
步驟一:模塊配置界面
模塊配置界面可以增加/刪除模塊,也能為模塊增加/刪除版式。
一個(gè)模型下可以定義任意數(shù)量的模塊,單個(gè)模塊下又可以包含數(shù)個(gè)版式。需要特別說明的是,模型的概念相當(dāng)于一個(gè)統(tǒng)一的接口,通過固定的接口滿足自己的識(shí)別需求。
模塊的概念相當(dāng)于樣本的類別,如身份證、軍官證、結(jié)婚證、完稅證明、營(yíng)業(yè)執(zhí)照等。版式的概念相當(dāng)于樣本類別下不同的樣式,如營(yíng)業(yè)執(zhí)照下有橫版格式和豎版格式。
步驟二:標(biāo)注頁(yè)面
每一個(gè)版式都需要上傳樣本并標(biāo)注,將需要提取的數(shù)據(jù)標(biāo)記出來。
步驟三:模型構(gòu)建-生成模型界面
所有樣本標(biāo)注完成后,便可以生成模型。
步驟四:模型的部署和測(cè)試界面
模型構(gòu)建完成后,可以部署該模型到識(shí)別平臺(tái),并測(cè)試模型的效果。
智能結(jié)構(gòu)化平臺(tái)用于訓(xùn)練產(chǎn)生針對(duì)各種不同版式的OCR識(shí)別引擎,滿足銀行自動(dòng)化、專業(yè)化、模塊化、高性能等業(yè)務(wù)及技術(shù)要求,支持身份證、銀行卡等固定版式的結(jié)構(gòu)化,營(yíng)業(yè)執(zhí)照等多版式的結(jié)構(gòu)化,銀行回單、長(zhǎng)途客運(yùn)票等非固定版式的結(jié)構(gòu)化,支持銀行單據(jù)分類+識(shí)別等分類結(jié)構(gòu)化。
銀行各個(gè)業(yè)務(wù)受理過程中涉及到的憑證都在百種以上,甚至多達(dá)幾百種,且更新頻繁,不少憑證會(huì)隨著業(yè)務(wù)需求或者監(jiān)管制度的變化而調(diào)整格式。建設(shè)智能結(jié)構(gòu)化平臺(tái)可帶來以下幾點(diǎn)收益:
1、持續(xù)投入成本大幅減少,行內(nèi)持續(xù)投入成本大幅減少,大幅節(jié)省人員投入,且準(zhǔn)確率顯著提高。
2、新增憑證的開發(fā)投產(chǎn)時(shí)間大大縮減,以往行內(nèi)新增項(xiàng)目的從采購(gòu)、廠商入場(chǎng)開發(fā)、到上線,整個(gè)流程需要2個(gè)月以上。上線智能結(jié)構(gòu)化平臺(tái)后,5-10分鐘完成新增憑證模板定制,當(dāng)天就可完成模型的投產(chǎn)使用。
3、行內(nèi)完全自主可控,使用平臺(tái)開發(fā)的OCR憑證模型可以形成自有知識(shí)產(chǎn)權(quán)。
智能結(jié)構(gòu)化平臺(tái)可實(shí)現(xiàn)行內(nèi)新增業(yè)務(wù)憑證的OCR識(shí)別自主可控,從新增一個(gè)憑證模板定制、自訓(xùn)練到測(cè)試上線,完全可由行內(nèi)人員自主完成,無需廠商干預(yù)。解決了行內(nèi)新增板式OCR識(shí)別需要重新采購(gòu)或廠商定制開發(fā)的工作和費(fèi)用投入問題。
作為計(jì)算機(jī)視覺領(lǐng)域的重要分支,借助智能結(jié)構(gòu)化平臺(tái)可實(shí)現(xiàn)行內(nèi)90%以上的固定版式業(yè)務(wù)憑證的自主定制,構(gòu)建的OCR憑證模型識(shí)別率可達(dá)98%以。系統(tǒng)成熟且實(shí)施可行性高,系統(tǒng)開發(fā)完成后,將為各業(yè)務(wù)系統(tǒng)提供支撐服務(wù),實(shí)現(xiàn)降低人工成本、提高工作效率的目標(biāo)。