产品运维
本文列出 TapData Enterprise 运维相关的常见问题。
如何进行 TapData 健康检查?
此检查清单用于验证 TapData 服务是否处于健康运行状态。
-
在左侧导航栏,选择系统管理 > 集群管理,查看各组件的运行状态,主要检查:
- TapData 服务相关进程:Tapdata管理器、Tapdata引擎、Tapdata API服务器是否运行正常。
- 检查 CPU 和内存使用率是否处于健康水平(低于70%)
-
单击左侧导航栏的数 据复制或数据转换,查看任务列表,主要检查各任务的状态是否均为运行中。 此外,您还可以单击任务名称,查看任务详细监控信息,确认任务运行正常,同步延迟是否在可接受范围内,任务 QPS 是否大于0。 如果任务出现异常,请跟随下述步骤排查:
- 检查任务报错信息:如果遇到任务异常,您可以通过任务的监控页面的底部查看相关日志信息,根据日志提示进行故障排除。更多介绍,见任务故障排查。
- 检查任务关联的数据库连接:单击左侧的连接管理,找到对应的数据源连接,单击其测试连接按钮以验证连通性,如遇异常,请根据提示进行故障排除(如密码错误)。
- 检查任务增量延迟:如果 QPS 突增持续 30 分钟以上,可能是源端批量操作或业务高峰引起,请评估任务是否需扩容;如果目标库无增量写入或写入耗时异常,请检查 CDC 的前提准备是否正确设置,以 MySQL 数据库为例,需确认是否开启了 binlog 并设置为 ROW 模式,具体设置可参考对应的创建连接文档。此外,任务日志中如出现主键冲突,需确认是否有配置改动。
如经过上述流程排查,任务仍异常,请联系 Tapdata 支持。
如何启停服务?
登录 TapData 平台后,在系统管理 >