眾所周知,文檔資料承載著一個企業(yè)的發(fā)展記憶、經(jīng)驗以及成果,一般管理只停留在個人或部門層面,這些重要的文檔會因為員工離職而丟失,因為時間推移而失去記憶,也會因為使用不規(guī)范而出現(xiàn)遺失、損壞,更有被惡意擴散導(dǎo)致形成損失的可能。紹林科技通過30余年的努力已成為知識管理解決方案的開發(fā)、供應(yīng)與運營專家,能為客戶提供各式各樣的知識類信息管理解決方案,紹林科技自主研發(fā)的知識管理系統(tǒng)品牌會博通能夠提供圖片、PDF文件的在線OCR服務(wù),正確配置好OCR服務(wù)的相關(guān)參數(shù)后,當(dāng)用戶上傳掃描圖片文件后,系統(tǒng)將會分派一個后臺任務(wù),在系統(tǒng)空閑的時候,對文件進行文字識別成為文本文件,以方便系統(tǒng)進行全文檢索和再利用。
會博通文檔一體化管理系統(tǒng)的用戶也可以在文件屬性頁面,或郵件的附件列表頁面,查看OCR的成果文件(按鈕名稱為文本)。
因為進行OCR識別需要訪問百度智能云AI服務(wù)器,所以,系統(tǒng)管理員應(yīng)確認是否具備互聯(lián)網(wǎng)連接條件,并預(yù)先申請百度智能云賬號,配置好系統(tǒng)參數(shù)。OCR的識別效果,與圖片的質(zhì)量密切相關(guān)。
注冊百度智能云帳號
登錄百度AI官網(wǎng)然后注冊百度智能云AI帳號,點擊控制臺-文字識別-創(chuàng)建應(yīng)用。然后填寫應(yīng)用程序名和應(yīng)用類型,創(chuàng)建應(yīng)用。進入應(yīng)用列表后可以查看應(yīng)用的API Key和Secret Key。
百度AI,一般普通識別,提供每天5萬次的免費識別額度,對于一般用戶已經(jīng)足夠,如果有特殊需求的用戶也可以購買百度的OCR額度。具體可以參考百度的相關(guān)資料或咨詢百度客服。
配置會博通OCR
說明:
會博通文檔一體化管理系統(tǒng)對于相關(guān)文件的處理:
1、 會將圖片文件通過OCR轉(zhuǎn)換為文本文件,以供搜索與利用。
2、 會將PDF文件里面的圖片通過OCR轉(zhuǎn)換為文本,并聯(lián)同PDF文件中已有的格式文本,轉(zhuǎn)換為文本文件。
3、 會將CAD文件中的文本抽取出來,保存為文本文件,以供搜索和再利用。
4、 OCR結(jié)果文本文件的瀏覽按鈕位于屬性和郵件中的文件列表的右側(cè),名稱為文本。