ABBYY InfoExtractor SDK

激活妳的數據

通過強大的信息提取技術,揭示了實體、事件和跨越非結構化文本的關係。

ABBYY InfoExtractor SDK使新一代專案管理和智慧業務流程應用程式能夠從非結構化內容:實體、事件和他們的之間的關係中自動識別和提取與業務相關的信息。ABBYY InfoExtractor將提取的信息整合,確保重建的情節隱藏在複雜冗長的文件中。

深入洞察實體、事件和關聯,使企業客戶和軟件開發人員能夠自動化處理文檔工作及耗時的合同審批,提高合規管理和其他內容密集型任務。

ABBYY Compreno自然語言處理技術,在技術層面來說,infoExtractor提供高精度的文本分析結果。其基於語言的能力能夠通過片面和可靠的內容理解能力,開闢新機遇,提高運營效率,降低風險並推動稅收來支援業務流程。

典型案例

降低信貸和保險風險

資訊整合處理需要律師、銀行家、風險經理和其他專業人員能夠快速有效的評估複雜的文件。infoExtractor的文檔智慧理解功能能讓這些高技能專業人士直接操控起決定性作用的的事物。

提高建築業的合規性

資訊提取能夠説明設計師和工程師在項目文檔中確定特殊的設備,聯通他們的原理和特性,從而確保遵守行業標準和法規,有助於避免專案文檔的錯誤,並降低成本和安全風險。

解決方案亮點

準確地提取實體、事件、事實

識別關鍵文本要素,比如人員、公司、日期、地理位置,事件提取揭示演講活動、商業交易、犯罪情況或基本情況如國籍、職業、家庭關係。採用先進的自然語言處理技術,ABBYY InfoExtractor在他們的理解層面進行區分實體和事件。

確定實體和事件之間的關系

InfoExtractor SDK通過基於深層語言分析文檔揭示實體和事件之間的關係。實體提取是很重要的,但是識別一個實體已經被代名詞取代或者跟蹤其提及的整個文本,能讓你分析整個情景:比如查找一個買家和一個賣家交易環節,識別相關財務圖表或者其他資訊。

根據實際情況添加自定義字符

為了確保可靠實體識別,InfoExtractor能夠創建使用者本體字典來為業務鑒定提取實體的複雜例子(比如像Aditya Prasad Kola一樣複雜的名字,或像蒙牛一樣的公司)。SDK文檔中的一個簡單運算描述有助於在現有的實體類型中添加缺失的概念。這些概念將自動提交提取規則,提高實體識別的複雜情況。

為行業解決方案使用自定義本體

除了基本本體以外,在最常見的領域、特定的行業的本體和事件能夠被提取本體或者能夠通過ABBYY專業語言服務從頭開始定制或者推進流程。

不限文本格式

ABBYY舉世聞名的光學字符識別技術(OCR)與InfoExtractor SDK整合能夠解析掃描文檔(tiff、jepg和其他圖片格式)和PDF文檔。同樣,如果需要處理大量的掃描文檔,InfoExtractor SDK能夠與ABBYY識別服務器無縫對接。

適用範圍

業務流程優化

ABBYY InfoExtractor通過識別日期、金額、技術特點和法律、會記或技術文檔中大量的其他數據來提高運作效率。復雜文檔的自動化處理可以有效的的審核是否包含關鍵數據,是否需要核實,或者他們的業務規則或流程是否實施。

增加搜索能力

ABBYY InfoExtractor SDK豐富的文檔元數據和具有先進的搜索能力的搜索工具提供準確的實體和相關事件的提取。

工作流程自動化

非結構化文檔如客戶需求或者前期協議的自動化分配和提醒能夠有效的融入到公司的工作流程讓工作流程更高效,包括更快的應對和增強客戶服務。