近期,上海合合信息科技股份有限公司(以下簡稱“合合信息”)啟動IPO引發(fā)了眾多關(guān)注。說起合合信息,大家可能比較陌生,但談起掃描全能王,相信很多人都比較熟悉,其母公司便是合合信息。作為一款智能掃描及文字識別APP,掃描全能王的用戶可以說是遍布全球。
以掃描全能王“文件轉(zhuǎn)換excel”相關(guān)功能為例,自推出以來已被調(diào)用百萬次,“文件轉(zhuǎn)換excel”功能的技術(shù)支撐是合合信息深耕多年的智能文字識別技術(shù)。
無論是工作還是學習中,表格處理的任務(wù)都不輕松,尤其是復雜場景下的表格識別,難上加難。洞悉于此,合合信息利用高精確度的表格識別技術(shù)幫助用戶節(jié)省文件處理時間。這也是合合信息智能文字識別技術(shù)中,圖像處理和復雜場景文字識別技術(shù)的重要應(yīng)用。
近年來人工智能技術(shù)飛速發(fā)展,計算機視覺(CV)、自然語言處理(NLP)和圖神經(jīng)網(wǎng)絡(luò)等深度學習方法被廣泛引入表格識別任務(wù)中,例如語義分割、目標檢測、序列預測等。在16年領(lǐng)域深耕中,合合信息智能文字識別技術(shù)覆蓋了圖片、PDF格式文檔中多種類的表格識別需求,包括有線表,三線表,無線表等,并且支持合并單元格、多表格并存等復雜情況的識別。
基于分治思想,合合信息引入深度學習技術(shù),將表格識別分為有線表識別和無線表識別兩種方案。有線表識別中,合合信息利用語義分割、角點回歸等技術(shù)方案還原有線表,在財報相關(guān)表格識別測試中,有線表識別單元格結(jié)構(gòu)準確率高于98%。
無線表缺少表格線,直接套用有線表識別方案無法得到理想的表格結(jié)構(gòu)。合合信息無線表識別采用序列模型、規(guī)則匹配等方案,通過自研模型直接預測表格的邏輯結(jié)構(gòu),再得到表格的物理結(jié)構(gòu),在保證表格區(qū)域內(nèi)容的完整性的同時,檢測準確率較傳統(tǒng)方法顯著提升。
除了應(yīng)用在掃描全能王APP中,合合信息的表格識別技術(shù)還已落地在保險、銀行、證券等行業(yè)中,應(yīng)用于合同、銀行流水、物流單據(jù)識別等多個場景。曾助力全球知名汽車零配件供應(yīng)商偉巴斯特實現(xiàn)票據(jù)智能掃描、識別、驗真、合規(guī)自動檢查、發(fā)票與訂單數(shù)據(jù)匹配、數(shù)字化數(shù)據(jù)、影像留存等全流程財稅管理,作業(yè)效率提升500%~1000%。
據(jù)悉,合合信息是一家人工智能及大數(shù)據(jù)科技企業(yè),從2006年創(chuàng)立至今,堅持深耕智能文字識別應(yīng)用及商業(yè)大數(shù)據(jù)核心技術(shù)領(lǐng)域,通過C端、B端產(chǎn)品以及行業(yè)解決方案,為全球百余個國家和地區(qū)的億級用戶及近30個行業(yè)的企業(yè)客戶提供創(chuàng)新的數(shù)字化、智能化服務(wù)。
除了智能文字識別外,合合信息在商業(yè)大數(shù)據(jù)領(lǐng)域基于大數(shù)據(jù)挖掘、知識圖譜、NLP技術(shù)開發(fā)了啟信寶APP,以及可服務(wù)于多種行業(yè)、多類型企業(yè)客戶的商業(yè)大數(shù)據(jù)服務(wù),通過“數(shù)據(jù)-信息-知識-智能”4個層次,挖掘商業(yè)數(shù)據(jù)背后蘊藏的價值,賦能各行各業(yè)。
合合信息對于AI和大數(shù)據(jù)的布局,是基于對這兩項技術(shù)和行業(yè)需求的深入理解。據(jù)稱,這兩項技術(shù)相輔相成,海量的大數(shù)據(jù)可以幫助深度學習算法模型的設(shè)計和優(yōu)化,同時AI模型也可實現(xiàn)更高效、深層的數(shù)據(jù)挖掘。并且,AI與大數(shù)據(jù)業(yè)務(wù)的客戶需求也具有一定程度的重疊,兩者協(xié)同耦合可以實現(xiàn)更多應(yīng)用,能更好的解決各行業(yè)數(shù)字化轉(zhuǎn)型遇到的問題。
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據(jù)。
關(guān)鍵詞: