隨著公司產品沒有廢話全色肉的黃文:藝賽旗的影響力在國內外不斷增強,與合作伙伴簽訂的合同也變得越來越多,故此導致業務人員對合同關鍵信息的提取工作,變得日益繁重。基于此,公司內部關于電子合同信息提取的自動化需求應運而生。
以下是關于電子合同信息提取的流程視圖。
基于電子合同信息的提取,根據文件類型,分為兩大類:Word和PDF。
Word類的,會直接用沒有廢話全色肉的黃文:RPA機器人藝賽旗從信息里面根據字符規則提取出關鍵信息,生成結構化數據,當然,也會遇見有些Word文檔是補充協議等,沒有相關要提取的信息,這類會根據業務規則直接在流程里面,根據模板判斷劃分出來。
PDF類的,會根據里面信息分為兩類,一類是文字型,一類是圖片型。
文字的可以使用藝賽旗的窗口元素中的預制組件 獲取元素文本 或者 文本中的獲取文本 來提取關鍵信息。(需要注意的是使用Acrobat的時候,需要在編輯中選擇輔助工具來做如下圖操作)
圖片類的,就必須要使用OCR來進行識別,然后進行信息提取,因為上面有蓋章等不同因素的影響,正確率并不能保證百分之百,甚至也沒有關鍵性可以回流驗證的信息,所以生成的結構化數據仍需要人工二次效驗,才可以錄入系統,所以基于圖片類的電子合同,并沒有為業務人員節省多少時間,無非是圖片類的電子合同占比并不高,所以影響不大。
當然此類電子合同都是使用公司固定的統一模板,所以總體業務并不復雜,但如果合同模板不能統一,各有特色,可能就需要根據各個模板的類型來做歸類劃分和業務異常處理。另一方面,就技術上來說,也可以直接用源碼模式來引用Office(Word,PDF文字類)的對象直接后臺處理,相比較而言,處理速度會比較快一些。
企業平臺
發現評估
自動化
行業解決方案
通用解決方案
合作伙伴
生態聯盟
咨詢服務
培訓服務
交流社區
客戶成功
公司介紹
新聞列表
聯系我們
加入我們