易道博識掌握具有自主知識產權的核心算法,覆蓋文字識別、文檔處理、圖像處理、自然語言處理,結合領域模型學習能力,駕馭算力資源,不斷實現數據驅動下的模型升級,持續打造更強大的AI能力。
文字識別
表格識別
印章識別
勾選識別
簽名比對
印刷、手寫、中文、英文、數字識別
基于深度學習全新DeepOCR識別流程,大幅提升識別速度及精度,
卡證類< 300ms,單張發票< 1s,A4幅面票據混掃< 3s,
漢字字符識別率> 99.5%,數字字符識別率> 99.9%,
英文字符識別率> 99.7%,手寫整行識別率> 95.2%
有線、無線、列位偏移、多列重疊
多形狀、多方向、曲線行、模糊、遮擋
重疊 、小印章
符號檢測、內容識別
簽名檢測、簽名比對
版面分析:標題、段落、表格、印章、簽名、信息塊、圖表
文檔分類:固定格式、非固定格式、富格式文檔、長文本文檔
文檔抽取:實體、關系、表格、印章、簽名
文檔比對:關鍵信息、段落、表格、結構
圖像檢測、圖像分割
圖像質檢:模糊、反光、拍屏、水印、復印、篡改、變形、切邊、遠距離、遮擋
噪聲和干擾去除:圖像噪聲、水印、陰影、印章、痕跡去除
文本分析:分詞、詞向量表示、依存句法分析、命名體識別、文本相似度
語言理解:文本分類、信息抽取、情感分析
依托GPT、BERT等大規模語言模型,基于海量文本語料自動學習,具備更好的文本理解和文本生成能力。
基于LayoutLM、ERNIE等大規模文檔版式預訓練模型,利用大量文檔樣本自監督學習,更好地理解各種文檔結構、內容和語義。
以大規模語言模型和版式預訓練模型為基礎結合領域數據,通過下游任務學習,快速生成領域中小規模模型,并輸出場景AI能力。
針對本地化、私有化等生產部署場景,利用知識蒸餾等模型輕量化技術,解決算力局限性問題實現業務場景深度融合。