海量数据源接入:解决企业数分散、复杂、异构数据源的灵活适配和数据处理,满足多渠道数据无缝衔接,以帮助实现日益复杂的业务需求。
精准数据治理:规范数据标准、数据血缘、数据质量、数据模型,快捷有效的进行数据资产融合管理
智能化高效率:预置各类行业模型、模型可服用,通过算子化和流程化持续挖掘数据价值。
可视化低门槛:数据可视化智能推导引擎,用户无需编写繁琐的代码,只用简单地拖曳,就能轻松地创建数据模型制作图表,灵活地进行多维分析,便捷地分享分析结果。
OceanSource数据治理平台支持各类主流的数据源及定制化的数据类型。具体如下:
文本接入:本地接入/FTP接入(增量/全量)/HDFS接入等,支持多种文本格式,如excel、txt、csv、avro、asn1、tlv、zip包等;
传统数据库接入:SQLServer接入(全量/增量)、mysql接入、oracle接入、DB2接入、Access接入等;
大数据库接入:ElasticSearch接入、远程数据仓库接入、HDFS读取文件列表(全量/增量)、本地数据仓库接入、Hbase接入、GreenPlum接入、MPP接入、远程HIVE数据仓库导入(全量/增量);
kafka流式接入:接入结构化数据、接入二进制数据等。
元数据管理自动化获取整改企业的数据业务含义,帮助理解数据,增加分析的敏捷性;
降低数据的复杂性、提供基础数据的复用性、让用户更容易理解数据的含义;
以元数据为驱动,形成数据标准、质量标准、安全标准、服务标准;
元数据命名规范确保元数据按照统一要求命名。
以业务数据为出发点,经过详细的数据调研、访谈、设计、评审等制定出数据标准;
遵循“循序渐进,不断完善”的原则;
根据数据探查结果,智能匹配数据标准。并针对数据元匹配数据标准的结果,指导质量规则和数据字典的调整;
数据字典的共享和私有,保证数据的机密性。支持手动创建、外部接入和离线导入;
数据标准应对企业数据需求,做到数据标准有理有据,数据标准绝不孤立存在。
数据质量管理包括质量检查数据采样、数据质量检核、问题发现及跟踪和数据质量服务。
格式检查:检查字段是否符合正则的比例;
校验规则:填写正则表达式,特殊字符需要转义;
范围检查:检查字段在范围中的比例;
疏密检查:字段中等于疏密阀值得比例;
疏密阀值:需要和字段中数据对比的;
系统中通过质量评分功能,结合质量规则,可以对接入数据的完整性、有效性、正确性、及时性、唯一性各个维度进行评分。根据规则运行的结果,对每张表在不同时段,不同规则的统计结果进行统计分析。
支持Kerberos认证;
支持对结构化、非结构化数据进行共享,零编码构建服务,支持通过WS、JBDC、ODBC、FTP获取数据;
支持数据的在线查看、预览、订阅、推送等多种使用方式;
提供数据服务安全审计,确保使用数据的合规合法性,并能实时预警非法访问。提供安全日志。
提供可视化的建模工具,支持异构数据库之间表结构同步。
支持快速获取数据库中已存在的表结构,并以拖拽的方式实现表结构和表关系创建。
提供自定义计算字段、数理统计、函数。
地址:南京市江宁区正方中路888号中新赛克大楼
EMAIL: sales@sinovatio.com