ABBYY InfoExtractor SDK

激活你的数据

通过强大的信息提取技术,揭示了实体、事件和跨越非结构化文本的关系。

ABBYY InfoExtractor SDK使新一代项目管理和智能业务流程应用程序能够从非结构化内容:实体、事件和他们的之间的关系中自动识别和提取和业务相关的信息。ABBYY InfoExtractor将提取的信息整合,确保重建的情节隐藏在复杂冗长的文件中。

深入洞察实体、事件和关联,使企业客户和软件开发人员能够自动化处理文档工作,耗时的合同审批,提高合规管理和其他内容密集型任务。

ABBYY Compreno自然语言处理技术,在技术层面来说,infoExtractor提供高精度的文本分析结果。其基于语言的能力能够通过片面和可靠的内容理解能力,开辟新机遇,提高运营效率,降低风险并推动税收来支持业务流程。

典型案例

降低信贷和保险风险

信息整合处理需要律师、银行家、风险经理和其他专业人员能够快速有效的评估复杂的文件。infoExtractor的文件智能理解功能能让这些高技能专业人士直接操控起决定性作用的的事物。

提高建筑业的合规性

信息提取能够帮助设计师和工程师在项目文档中确定特殊的设备,联通他们的原理和特性,从而确保遵守行业标准和法规,有助于避免项目文档的错误,并降低成本和安全风险。

解决方案亮点

准确提取实体、事件和事实

实体识别关键文本要素,比如人员、公司、日期、地理位置,事件提取揭示演讲活动、商业交易、犯罪情况或基本情况如国籍、职业、家庭关系。采用先进的自然语言处理技术,ABBYY InfoExtractor在他们的理解层面进行区分实体和事件。

确定实体和事件之间的关系

InfoExtractor SDK通过基于深层语言分析文档揭示实体和事件之间的关系。实体提取是很重要的,但是识别一个实体已经被代名词取代或者跟踪其提及的整个文本,能让你分析整个情景:比如查找一个买家和一个卖家交易环节,识别相关财务图表或者其他信息。

根据实际情况添加自定义字符

为了确保可靠实体识别,InfoExtractor能够创建用户本体字典来为业务鉴定提取实体的复杂例子(比如像Aditya Prasad Kola一样复杂的名字,像蒙牛一样的公司)。SDK文档中的一个简单运算描述有助于在现有的实体类型中添加缺失的概念。这些概念将自动提交提取规则,提高实体识别的复杂情况。

为行业解决方案使用自定义本体

除了基本本体以外,在最常见的领域、特定的行业的本体和事件能够被提取本体或者能够通过ABBYY专业语言服务从头开始定制或者推进流程。

不限文本格式

ABBYY举世闻名的光学字符识别技术(OCR)与InfoExtractor SDK整合能够解析扫描文档(tiff、jepg和其他图片格式)和PDF文档。同样,如果需要处理大量的扫描文档,InfoExtractor SDK能够与ABBYY识别服务器无缝对接。

适用范围

业务流程优化

ABBYY InfoExtractor通过识别日期、金额、技术特点和法律、会记或技术文档中大量的其他数据来提高运作效率。复杂文档的自动化处理可以有效的的审核是否包含关键数据,是否需要核实,或者他们的业务规则或流程是否实施。

增加搜索能力

ABBYY InfoExtractor SDK丰富的文档元数据和具有先进的搜索能力的搜索工具提供准确的实体和相关事件的提取。

工作流程自动化

非结构化文档如客户需求或者前期协议的自动化分配和提醒能够有效的融入到公司的工作流程让工作流程更高效,包括更快的应对和增强客户服务。