近日,為貫徹落實(shí)國(guó)家“十四五”發(fā)展規(guī)劃和《金融科技發(fā)展規(guī)劃(2022—2025 年)》等相關(guān)政策要求,由北京金融科技產(chǎn)業(yè)聯(lián)盟、北京金融信息化研究所聯(lián)合舉辦的2023金融科技安全與創(chuàng)新大會(huì)在山東濟(jì)南成功舉行。來(lái)自金融科技政產(chǎn)學(xué)研用各領(lǐng)域領(lǐng)導(dǎo)和專(zhuān)家共聚一堂,聚焦金融數(shù)據(jù)安全、數(shù)字基礎(chǔ)設(shè)施防護(hù)、新一代人工智能等議題,分享行業(yè)經(jīng)驗(yàn)和最佳實(shí)踐,探索金融科技安全與創(chuàng)新發(fā)展的有效路徑。
易道博識(shí)受邀出席,并參與金融行業(yè)大模型一體機(jī)發(fā)布儀式,發(fā)布面向金融行業(yè)的滄海大語(yǔ)言模型。
滄海大模型是以開(kāi)源大語(yǔ)言模型為基礎(chǔ),在大規(guī)模金融非結(jié)構(gòu)化文本數(shù)據(jù)集上精調(diào),具備金融領(lǐng)域知識(shí),適用于金融領(lǐng)域場(chǎng)景應(yīng)用的生成式大語(yǔ)言模型。滄海大模型對(duì)金融業(yè)務(wù)場(chǎng)景具有深刻的語(yǔ)義理解能力。模型支持部署在不同硬件環(huán)境中,可廣泛應(yīng)用于智能知識(shí)庫(kù)問(wèn)答和檢索、智能文檔處理、非結(jié)構(gòu)化文本數(shù)據(jù)清洗等多個(gè)場(chǎng)景,助力金融機(jī)構(gòu)實(shí)現(xiàn)業(yè)務(wù)創(chuàng)新,推動(dòng)數(shù)字化轉(zhuǎn)型。
滄海大模型具有以下幾點(diǎn)突出優(yōu)勢(shì):
首先,強(qiáng)大的語(yǔ)料庫(kù)支撐其效果。滄海大模型使用了超過(guò)1.5T的中英文語(yǔ)料進(jìn)行預(yù)訓(xùn)練,該語(yǔ)料庫(kù)包括來(lái)自大量金融領(lǐng)域文檔圖像和富格式文檔的非結(jié)構(gòu)化文本語(yǔ)料,如證件、票據(jù)、憑證、表單、合同、法律文書(shū)、報(bào)告等。這為模型熟悉金融業(yè)務(wù)語(yǔ)義,準(zhǔn)確理解業(yè)務(wù)需求奠定了堅(jiān)實(shí)基礎(chǔ)。
其次,支持本地化和輕量級(jí)部署。滄海大模型支持INT8、INT4量化,最低顯存需求僅為6G,具有高效的推理速度和低成本部署優(yōu)勢(shì),最大上下文長(zhǎng)度32K,可以滿(mǎn)足更長(zhǎng)的提示和上下文輸入。提供6B、15B等大小模型,滿(mǎn)足不同部署應(yīng)用場(chǎng)景需求。
最后,通過(guò)賽博智能學(xué)習(xí)平臺(tái),滄海大語(yǔ)言模型能夠滿(mǎn)足基于DCU服務(wù)器的訓(xùn)練與推理。利用DCU本身對(duì)于生成式大語(yǔ)言模型在訓(xùn)練和推理方面的性能加速優(yōu)勢(shì),結(jié)合賽博平臺(tái)本身友好的可視化操作界面,能夠很好地滿(mǎn)足用戶(hù)快速模型訓(xùn)練和場(chǎng)景數(shù)據(jù)調(diào)優(yōu)的需求;進(jìn)一步通過(guò)模型一鍵部署功能,實(shí)現(xiàn)快速場(chǎng)景應(yīng)用。
作為國(guó)內(nèi)領(lǐng)先的人工智能技術(shù)及OCR智能識(shí)別方案服務(wù)商,易道博識(shí)將堅(jiān)持自主創(chuàng)新,持續(xù)研發(fā)領(lǐng)先的核心算法產(chǎn)品,以強(qiáng)大的技術(shù)能力助力金融客戶(hù)實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型目標(biāo),共同開(kāi)拓金融科技發(fā)展的新前景。