数据管道
本文列出在构建数据管道时,可能遇到的问题及相关解决方案,包含数据复制任务、数据转换任务、数据校验等功能模块。
通用问题
数据复制和数据转换有什么区别?
数据复制主要用于整库或多表的数据同步,可满足数据库迁移上云、数据库升级、数据库备份等业务需求。
数据转换主要用于数 据建模、数据 ETL、数据清理、数据合并(包括多表合并到单表)、宽表建设等业务场景,最大的不同点是数据开发的目标通常只能是单表。
数据复制/转换任务会在网络中断后自动恢复吗?
是的,大多数情况下任务可以自动恢复,具体如下:
- 管理端和引擎之间断网: 云版不会影响任务运行,网络恢复后自动继续;企业版短时间断网没影响,但如果超过 10 分钟,任务会自动转移至其他可用的引擎进行执行,全量任务会从头开始,增量任务会从断点继续。
- 引擎和数据源之间断网: 系统会在设置的重试时间内自动尝试连接,恢复后任务继续运行;如果超时未恢复,任务会停止,网络恢复后全量任务从头开始,增量任务从断点继续。
是否支持跨区域、跨网络的数据同步?
支持。TapData Cloud 通过 Agent 来连接源和目标,仅通过开放有限的网络服务,即可实现同步需求。
是否支持源和目标为同一对象的数据同步?
支持。只需要同步操作的数据对象开放相应数据权限。
是否支持跨时区/字符集的数据同步?
支持。
是否支持分库分表的数据同步?
支持。TapData Cloud 可以从多源同时同步到同一目标表。
是否支持更改数据同步对象在目标库中的名称?
支持。