提起賽博,通常會想到“賽博朋克”。
其實,賽博朋克(英文:Cyberpunk)是“賽博”與“朋克”的結合詞。在英語中,賽博這個詞脫胎于Cybernetics(中文:自動控制論),起源于希臘語 kubernetes,意思是導航員、駕駛員。
而在科幻小說的范疇中,“賽博”廣義上涵蓋了這些主題:機器人、自動化、計算機、智能等等。如果進一步縮窄“賽博”的范圍,我們可以發現這個詞最常用于指代“人工智能的創建”。
在現實生活中,AI的本質就是生產力。而易道博識創立的初心,就是借助人工智能,來簡化復雜枯燥的工作。
我們在“賽博”這個詞上,傾注了許多我們美好的期許:我們希望并且相信,科技充當的角色不僅是一個簡單的技術提供者,我們希望不僅能授人以魚,還能授人以漁,我們希望能讓用戶擁有一個可以自主可控、成本可控的、可現場應用的平臺產品。
我們知道,開發一項人工智能模型并上線應用大致需經歷從業務理解、數據采標及處理、模型訓練與測試到運維監控等一系列流程。?
過程中,不僅需要大量的AI算力、高質量數據源,還需要AI應用算法研發及AI技術人員的支持,但大部分中小企業用戶并不具備在“算力、數據、算法”三維度從0到1部署的能力,而財力雄厚的大型企業亦需高性價比的AI開發部署方案。
智能化轉型趨勢下,企業部署AI項目的需求正經歷著變化,對數據質量、模型生產周期、模型自學習水平、模型部署方式、人力成本及資金投入、投資回報率等的要求都逐步走高。
假如,每次開發模型都需要算法工程師單獨完成從生產到上線的全流程招建,就會導取很多時間的耗損與AI模型開發成本的浪費。所以集標注、訓練、推理于一體的賽博(CyberBot)深度學習平臺應運而生。
數據閉環,自成有機整體
賽博學習平臺是易道博識基于深度學習自主研發的一站式機器學習訓練平臺。賽博平臺集數據管理、數據標注、模型訓練和模型應用于一身,提供及時、現場化的數據驅動模型應用解決方案。
賽博平臺充分利用現有的經過長期迭代的基礎模型能力,包括圖像、OCR和NLP等,在少量樣本的驅動下,利用遷移學習和小樣本學習等技術,高效完成增量模型的訓練,生成最優的模型文件,并通過推理平臺實現模型的快速部署與生產應用。
產品組成上,賽博平臺由管理中心CyberCenter、數據標注平臺 CyberData、深度學習訓練平臺 CyberLearning和深度學習推理平臺 CyberServing幾個子平臺組成,各子平臺依次承擔平臺管理、數據管理與標注、模型訓練和模型服務的功能,各個子平臺之間相互獨立又有效配合,形成一個有機整體,從而有效支撐數據驅動模型應用的整體功能。
賽博平臺設計中充分考慮并兼顧了企業應用的綜合性復雜場景以及C端客戶相對單一的場景。通過對各種應用場景的深入研究與有效融合,以及先進的架構設計和技術選型,平臺最大化兼顧了專業性與易用性,從而在滿足各種應用場景需求的前提下,提供最佳的用戶操作體驗。
值得一提的是,賽博平臺打造了數據驅動模型應用的閉環。推理平臺支持對于自身所產生的生產數據根據不同的條件進行自動采集的功能,采集后的數據可以方便地導入標注平臺,形成數據集,并支持進一步的數據處理與標注。標注完成的數據集可以用于模型的訓練調優,從而得到性能更佳的模型,用于更新推理平臺生產模型,從而形成一個完整的數據閉環。
數據標注平臺 CyberData
數據平臺主要功能包括數據管理、數據處理、樣本擴充、數據標注與采集。數據平臺內置exLabeler標注客戶端,提供強大專業的CV、OCR、結構化和NLP任務標注功能。同時,數據平臺還支持單人和團隊標注模式。
用戶可以通過exLabeler客戶端完成樣本的標注。exLabeler支持CV、OCR、結構化和NLP等領域算法的標注。標注完成的數據集可以直接用于模型訓練,或進一步做后處理(如圖像處理、樣本擴充等),然后再用于模型訓練。
深度學習訓練平臺 CyberLearning
訓練平臺通過自身對于訓練資源池的集中管理與分配,以及與管理平臺的無縫對接,可以方便地實現訓練基礎設施的管理,從而減輕用戶的管理維護工作。同時,利用自動超參搜索等技術,訓練平臺可以自動搜索到最佳性能的模型。
通過分布式訓練與多框架支持,訓練平臺可以最大化利用計算資源,加速模型訓練。同時,利用自動超參搜索等技術,訓練平臺可以自動搜索到最佳性能的模型。最后,對于訓練所得的最優模型,訓練平臺支持一鍵部署到推理平臺,實現模型的快速應用。
深度學習推理平臺 CyberServing
推理平臺主要完成各種識別功能的部署。業務系統通過調用推理平臺提供的RESTful API提交圖像并獲得識別結果。整體上講,推理平臺產品需求可分解為模型管理、API過程定義、識別數據查看,接口統計和其它非功能項等部分。其中模型管理和API管理模塊屬于基礎核心模塊。
推理平臺對同一模型不同版本的管理,并支持在模型服務中同時加載和運行多個版本的模型。推理平臺還支持一個API綁定多個模型服務。模型升級時,用戶可以選擇先在部分服務中激活新版本的模型,完成測試驗證后再升級其他服務。