亚洲日韩精品a∨片无码加勒比-日产精品久久久一区二区-久久久久人妻精品一区蜜桃-又大又粗又爽a级毛片免费看-国产三级av在线播放

首頁(yè)
核心技術(shù)
產(chǎn)品體系
解決方案
動(dòng)態(tài)資訊
關(guān)于我們
搜索

北京衛(wèi)視專訪易道博識(shí):擁抱深度學(xué)習(xí)OCR,從服務(wù)器端到移動(dòng)端

來(lái)源:易道博識(shí) 發(fā)布時(shí)間:2022-06-20

自2021服貿(mào)會(huì)召開(kāi)以來(lái),北京衛(wèi)視一直在對(duì)會(huì)中涌現(xiàn)的服務(wù)創(chuàng)新型企業(yè)進(jìn)行深入關(guān)注。10月17日,在北京衛(wèi)視的財(cái)經(jīng)頻道中,播出了易道博識(shí)聯(lián)合創(chuàng)始人兼首席技術(shù)官康鐵鋼接受北京衛(wèi)視的采訪,并對(duì)易道博識(shí)的技術(shù)積累,產(chǎn)品服務(wù)和行業(yè)領(lǐng)先度等方面給予了高度認(rèn)可。


“深度學(xué)習(xí)的成熟,給文字識(shí)別,人臉識(shí)別的識(shí)別率帶來(lái)了巨大提升,除了涌現(xiàn)大量的AI初創(chuàng)公司,也有很多實(shí)際的落地場(chǎng)景,我們公司從創(chuàng)立開(kāi)始就擁抱深度學(xué)習(xí),并圍繞深度學(xué)習(xí)搭建了我們的產(chǎn)品矩陣。”康鐵鋼在采訪中介紹道。


但是,深度學(xué)習(xí)在實(shí)際應(yīng)用中條件很苛刻。人工智能模型的開(kāi)發(fā)與上線應(yīng)用需要經(jīng)歷從業(yè)務(wù)理解、數(shù)據(jù)采標(biāo)及處理、模型訓(xùn)練與測(cè)試到運(yùn)維監(jiān)控等一系列流程。過(guò)程中需要大量的AI算力、高質(zhì)量數(shù)據(jù)源、Al應(yīng)用算法研發(fā)及Al技術(shù)人員的支持。


事實(shí)上,大部分中小企業(yè)用戶并不具備在“算力、數(shù)據(jù)、算法”三維度從0到1部署的能力,而財(cái)力雄厚的大型企業(yè)亦需高性價(jià)比的AI開(kāi)發(fā)部署方案。


所以,如何AI基礎(chǔ)層服務(wù)在多環(huán)節(jié)提升技術(shù)價(jià)值,AI產(chǎn)業(yè)如何進(jìn)入低技術(shù)門檻、低部署成本、各產(chǎn)業(yè)深度參與雙向共建的效率化生產(chǎn)階段,是企業(yè)當(dāng)下面臨的重要問(wèn)題。


十年磨劍,如何用好深度學(xué)習(xí)這柄“利劍”?



假如,每次開(kāi)發(fā)模型都需要算法工程師單獨(dú)完成從生產(chǎn)到上線的全流程招建,就會(huì)導(dǎo)取很多時(shí)間的耗損與AI模型開(kāi)發(fā)成本的浪費(fèi)。所以集標(biāo)注、訓(xùn)練、推理于一體的賽博(Cybot)深度學(xué)習(xí)平臺(tái)應(yīng)運(yùn)而生。


賽博學(xué)習(xí)平臺(tái)是易道博識(shí)基于深度學(xué)習(xí)自主研發(fā)的全棧式數(shù)據(jù)服務(wù)平臺(tái),包含數(shù)據(jù)標(biāo)注平臺(tái)、訓(xùn)練平臺(tái)、推理平臺(tái)、接口平臺(tái)、管理平臺(tái)5大部分,涵蓋數(shù)據(jù)標(biāo)注,數(shù)據(jù)訓(xùn)練、推理服務(wù)三大數(shù)據(jù)服務(wù)環(huán)節(jié),可提供模型開(kāi)放及模型訓(xùn)練的流水線定制化服務(wù)。


賽博學(xué)習(xí)平臺(tái)的出現(xiàn)凝聚了易道博識(shí)2013年創(chuàng)立以來(lái),在文字識(shí)別,圖像識(shí)別等核心技術(shù)上近十年的技術(shù)沉淀和經(jīng)驗(yàn)積累,也與驅(qū)動(dòng)AI業(yè)務(wù)的外因以及企業(yè)自身的內(nèi)因緊密相關(guān)。從外因看,規(guī)模化多場(chǎng)景的業(yè)務(wù)不斷衍生出長(zhǎng)尾需求,原有的應(yīng)用需及時(shí)更新;從內(nèi)因看,囿于開(kāi)發(fā)企業(yè)有限的經(jīng)營(yíng)成本與AI技術(shù)人才,其資源主要投放到現(xiàn)階段的主營(yíng)業(yè)務(wù),現(xiàn)有人員難以推動(dòng)業(yè)務(wù)的智能化改造。


其中,智能結(jié)構(gòu)化推理平臺(tái)用于訓(xùn)練產(chǎn)生針對(duì)各種不同版式的OCR識(shí)別引擎,自動(dòng)從非結(jié)構(gòu)化數(shù)字信息中抽取目標(biāo)數(shù)據(jù),為識(shí)別平臺(tái)提供結(jié)構(gòu)化方法,一個(gè)版式3~5分鐘內(nèi)即可完成,可以賦予客戶自主解決80%以上的固定格式業(yè)務(wù)憑證的識(shí)別問(wèn)題。


而其中的API接口平臺(tái)屬于API資源的一種,其可幫助技術(shù)領(lǐng)先企業(yè)開(kāi)放AI能力與先進(jìn)資源,從而延伸價(jià)值鏈、構(gòu)造產(chǎn)業(yè)生態(tài),形成規(guī)模經(jīng)濟(jì)與長(zhǎng)尾經(jīng)濟(jì),且利用開(kāi)發(fā)者的創(chuàng)新應(yīng)用來(lái)反哺開(kāi)放平臺(tái);同時(shí),其亦可在減輕基礎(chǔ)設(shè)施建設(shè)投入的條件下協(xié)助開(kāi)發(fā)者打造自身產(chǎn)品或服務(wù),節(jié)省開(kāi)發(fā)時(shí)間。

從總體上看,賽博學(xué)習(xí)平臺(tái)可提供較為前沿的技術(shù)、經(jīng)濟(jì)合理的模型生產(chǎn)經(jīng)驗(yàn)以及為實(shí)現(xiàn)敏捷開(kāi)發(fā)而打包的數(shù)據(jù)、算力與算法資源。具體而言,其采用自動(dòng)機(jī)器學(xué)習(xí)技術(shù),很大程度上降低了機(jī)器學(xué)習(xí)的編程工作量、節(jié)約了AI開(kāi)發(fā)時(shí)間、減輕了對(duì)專業(yè)數(shù)據(jù)科學(xué)家與算法工程師的依賴,讓缺乏機(jī)器學(xué)習(xí)經(jīng)驗(yàn)的開(kāi)發(fā)者用上AI,加快開(kāi)發(fā)效率。


春風(fēng)化雨,把深度學(xué)習(xí)OCR帶給移動(dòng)端


國(guó)內(nèi)首份OCR白皮書《智能文字識(shí)別(OCR)能力測(cè)評(píng)與應(yīng)用白皮書》中指出:大量的OCR應(yīng)用需要在資源受限的移動(dòng)端設(shè)備上運(yùn)行,當(dāng)前移動(dòng)端OCR算法大多以犧牲一定的算法精度來(lái)?yè)Q取運(yùn)行速度,針對(duì)移動(dòng)設(shè)備設(shè)計(jì)兼顧性能和效率的輕量OCR模型將是未來(lái)發(fā)展的重要方向。


早在去年,易道博識(shí)就察覺(jué)到了行業(yè)上的輕量級(jí)趨勢(shì)和需求,并在今年成功推出了移動(dòng)端深度學(xué)習(xí)OCR ——DOM(,Deep OCR of Mobile),也就是手機(jī)端的深度學(xué)習(xí)OCR版本。


DOM是一款可以在移動(dòng)端實(shí)現(xiàn)深度學(xué)習(xí)的OCR產(chǎn)品,可以支持在任意方向或角度以及苛刻背景條件下的超高速證件識(shí)別。DOM最大的特點(diǎn)體現(xiàn)在兩方面:高精度,輕量級(jí)。他可以10M左右的內(nèi)存環(huán)境,在保證高精度的前提下,深度學(xué)習(xí)的高速度優(yōu)勢(shì)完美展現(xiàn),在手機(jī)上實(shí)現(xiàn)了原來(lái)在服務(wù)端上才能支持的精度與速度。



相比傳統(tǒng) SDK 中基于四邊定位的的方法,深度學(xué)習(xí)的方法能夠更好地排除 背景噪聲的干擾,如存在背景線條或背景特征與證件接近的情況,從而可以得到更精確的證件輪廓信息。在識(shí)別能力上,基于深度學(xué)習(xí)技術(shù)的 DOM SDK識(shí)別核心具有大幅度領(lǐng)先的識(shí)別精度,具體表現(xiàn)在如生僻字、少數(shù)民族證件等場(chǎng)景下更好的識(shí)別效果。


DOM SDK的市場(chǎng)需求非常大,證券開(kāi)戶,銀行開(kāi)戶,投保理賠,汽車金融……等大量應(yīng)用卡證識(shí)別,且移動(dòng)端需求量極大的業(yè)務(wù),都是DOM SDK的應(yīng)用場(chǎng)景。這些場(chǎng)景對(duì)識(shí)別速度、識(shí)別精度的要求非常高,客戶容忍度低,注重用戶體驗(yàn),對(duì)產(chǎn)品的魯棒性要求很高。


與人臉識(shí)別等其它識(shí)別任務(wù)不同,OCR技術(shù)不僅需要卷積神經(jīng)網(wǎng)絡(luò)(CNN),還需要更復(fù)雜、計(jì)算量更大的遞歸神經(jīng)網(wǎng)絡(luò)(RNN、LSTM),這需要強(qiáng)大算力為支撐,而手機(jī)并不像服務(wù)器端一樣擁有GPU。在不依賴算力和GPU的情況下,大幅度提升識(shí)別精度,顯著改善用戶體驗(yàn),這正是DOM SDK的技術(shù)價(jià)值所在。


潤(rùn)物無(wú)聲,瞄準(zhǔn)市場(chǎng)風(fēng)口,賦能更多行業(yè)


道阻且長(zhǎng),行則將至。易道博識(shí)作為一名在AI路上已近10年的棋手,在賽博平臺(tái)和移動(dòng)端OCR 無(wú)疑是兩手好棋。


首先,二者均從業(yè)務(wù)前端發(fā)掘潛在及外顯的市場(chǎng)需求,針對(duì)剛需應(yīng)用與高價(jià)值環(huán)節(jié)延伸出多條增量建設(shè)與運(yùn)行需求業(yè)務(wù)線,瞄準(zhǔn)市場(chǎng)風(fēng)口的同時(shí),敏捷、經(jīng)濟(jì)地消化個(gè)性化和碎片化需求,根據(jù)需求柔性匹配生產(chǎn)。


而在兩手好棋的背后,易道博識(shí)也在構(gòu)筑自己的 “珍瓏棋局”。


從 2020 年至今,易道博識(shí)與華為建立了密切的合作關(guān)系。不僅與華為在產(chǎn)品上達(dá)成兼容,還基于各自領(lǐng)域的技術(shù)與資源優(yōu)勢(shì),在解決方案層上積極探索實(shí)踐。其中,易道博識(shí)的Deep OCR技術(shù)為Atlas 800推理服務(wù)器提供了“每秒20張A4紙”量級(jí)的文本識(shí)別能力,因性能提高帶來(lái)的資源節(jié)省使得機(jī)房空間下降了60%,資源能耗下降了30%。現(xiàn)已得到華為昇騰智能OCR解決方案的Compatible技術(shù)認(rèn)證證書。


并且今年,易道博識(shí)已經(jīng)和英特爾創(chuàng)新孵化器達(dá)成戰(zhàn)略合作,目前就產(chǎn)品研發(fā)和應(yīng)用上和英特爾的CPU技術(shù)框架進(jìn)行適配,目前階段性進(jìn)展順利,POC技術(shù)合作部分已取得了滿意的優(yōu)化結(jié)果,下一階段會(huì)逐步應(yīng)用到更多的產(chǎn)品類型上。


在線留言