概述
ETL软件完成不同数据源的数据进行抽取、特征提取、字段清洗规整和脏数据的过滤,并将清洗过的数据最终加载到大数据平台存储模块中,为后续进行数据分析挖掘、数据展示奠定数据基础。
功能特点
-
支持获取数据的数据源包括,文本文件(txt,csv,xml,json)等,关系型数据如Oracle、Sql Server、Mysql、DB2等,支持JDBC、ODBC数据驱动连接数据源。
-
支持对特殊数据源和应用需求,可以自定义输入插件。
-
支持多种应用系统,如ERP、供应链、财务系统等。
-
通过图形界面方式设计、运行、调试作业(Job)与转换(Transformation),Transformation完成针对数据的基础转换,Job则完成整个工作流的控制。
技术优势
-
可以将分布、异构数据源中的数据进行抽取、清洗、转换、集成,最后加载到数据仓库或数据集市中提供数据应用服务。
-
通过整合数据, 把数据转换成信息、知识,成为报表展示、联机分析处理、数据挖掘的基础。