|
Post by account_disabled on Apr 8, 2024 8:28:49 GMT
存储库中的数据。在此步骤中数据将转换为单一格式并准备进行转换。必须进行清洁或净化处理这将有助于我们避免污染它们的错误。数据转换过程将数据转换为我们在数据仓库中定义的结构。转换步骤包括对业务规则的验证操作技术验证重复完整性空值代码规范化和同质化格式更改以及排序过滤交叉和聚合。数据加载加载阶段是该过程的最后阶段转换后的数。 据开始加载到数据仓库中在那里它们被注册可以被审计并且始终具有一段时间的历史记录。由于过程的复杂性并且根据每个组织的特点我们可以找到几种处理类型。工具有哪些处理类型数据一个文件被分成小文件以便可以并行处理。管道分段允许同一文件中的多个。 组件同时操作。例如您可以在处理文件的第二列和第三列的同时处理文件的第一列从而使其速度更快。组件同一工作站上不同数据流的多个进程同时运行。进行过程时最重要的方面之一是工具的选择因为它将取决于组织的规模成本和存储位置。顶级工具选择提取转。
|
|