各个软件厂商提供数据接口 , 实现数据采集汇聚 。
实现过程:
· 协调多方软件厂商工程师到场 , 了解所有系统业务流程以及数据库相关的表结构设计等 , 细节推敲 , 确定可行性方案;
· 编码
· 测试、调试阶段
· 交付使用
接口对接方式的数据可靠性与价值较高 , 一般不存在数据重复的情况;数据通过接口实时传输 , 满足数据实时性的要求 。
接口对接方式的缺点是接口开发费用高;协调各个软件厂商 , 协调难度大、投入能力大;扩展性不高 , 如:由于业务需要各软件系统开发出新的业务模块 , 其和大数据平台之间的数据接口也需做相应修改和变动 , 甚至要推翻以前的所有数据接口编码 , 工作量大、耗时长 。
(2)开放数据库方式
实现数据的采集汇聚 , 开放数据库是最直接的一种方式 。
两个系统分别有各自的数据库 , 同类型的数据库之间是比较方便的:
1. 如果两个数据库在同一个服务器上 , 只要用户名设置的没有问题 , 就可以直接相互访问 , 需要在from后将其数据库名称及表的架构所有者带上即可 。 select * from DATABASE1.dbo.table1
2. 如果两个系统的数据库不在一个服务器上 , 建议采用链接服务器的形式处理 , 或者使用openset和opendatasource的方式 , 这个需要对数据库的访问进行外围服务器的配置 。

文章插图
而不同类型的数据库之间的连接就比较麻烦 , 需要做很多设置才能生效 , 这里不做详细说明 。
开放数据库方式可以直接从目标数据库中获取需要的数据 , 准确性高 , 实时性也能得到保证 , 是最直接、便捷的一种方式 。
但开放数据库方式也需要协调各个软件厂商开放数据库 , 难度大;一个平台如果同时连接多个软件厂商的数据库 , 并实时获取数据 , 这对平台性能也是巨大挑战 。 不过 , 出于安全性考虑 , 软件厂商一般不会开放自己的数据库 。
(3)基于底层数据交换的数据直接采集方式
通过获取软件系统的底层数据交换、软件客户端和数据库之间的网络流量包 , 基于底层IO请求与网络分析等技术 , 采集目标软件产生的所有数据 , 将数据转换与重新结构化 , 输出到新的数据库 , 供软件系统调用 。
技术特点如下:
1. 无需原软件厂商配合;
2. 实时数据采集 , 数据端到端的响应速度达秒级;
3. 兼容性强 , 可采集汇聚Windows平台各种软件系统数据;
4. 输出结构化数据 , 作为数据挖掘、大数据分析应用的基础;
5. 自动建立数据间关联 , 实施周期短、简单高效;
6. 支持自动导入历史数据 , 通过I/O人工智能自动将数据写入目标软件;
7. 配置简单、实施周期短 。

文章插图
基于底层数据交换的数据直接采集方式 , 摆脱对软件厂商的依赖 , 不需要软件厂商配合 , 不仅需要投入大量的时间、精力与资金 , 不用担心系统开发团队解体、源代码丢失等原因导致系统数据采集成死局 。
特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
