快速入门
本文将演示如何使用 TapFlow 构建最简单的数据流任务,以帮助您快速掌握数据复制和流式处理的操作流程。如需了解如何利用 TapFlow 的多表处理功能来实现更复杂的业务需求(如实时宽表),推荐阅读典型案例。
步骤一:初始化 TapFlow
-
下载并启动 TapShell。
- 源码安装
- 二进制安装
-
下载并安装 Python 3,版本为 Python 3.6 及以上。
-
执行下述命令创建虚拟环境,以便隔离依赖包,避免与系统 Python 环境冲突。
python3 -m venv tapflow_env -
执行下述命令激活虚拟环境,安装 TapFlow 及其所需的依赖包。
# 激活虚拟环境
source tapflow_env/bin/activate
# 安装 TapShell
pip3 install tapflow
# 或者
pip install tapflow至此已完成安装,退出命令行后再次使用 TapShell 前,需要先激活虚拟环境。除本方法外,您也可以使用 pipx 安装 TapFlow,只需运行
pipx install tapflow,pipx 会自动创建并管理虚拟环境。 -
输入
tap启动 TapShell 。
-
根据您的操作系统选择对应的二进制包下载。
-
启动 TapShell。
-
Ubuntu 20.04 +:赋予执行权限并启动 TapShell
chmod +x tap-shell
./tap-shell -
Windows:双击
tap-shell.exe启动 TapShell。
-
-
基于 TapData 部署方式选择要连接产品系列,然后设置连接所需的认证信息,本案例以连接至 TapData Cloud 平台为例:
Tap Flow requires TapData Live Data Platform(LDP) cluster to run.
If you would like to use with TapData Enterprise or TapData Community, type L to continue.
If you would like to use TapData Cloud, or you are new to TapData, type C or press ENTER to continue.
(if selected L)
Please enter server:port of TapData LDP server:
Please enter access code
(if pressed enter/C)
# You may obtain the keys by log onto TapFlow Cloud, and click: "User Center" on the top right, then copy & paste the accesskey and secret key pair.
# You can sign up for a new account from: https://cloud.tapdata.io if you don't have one
#
Enter AK:
Enter SK:-
输入
C或回车键:即连接至 TapData Cloud 平台,此时需要输入访问密钥(Access Key)和密钥(Secret Key),输入时字符不可见,输入完成按回车键即可。 -
输入
L:即连接至本地部署的 TapData Enterprise 平台,此时需要请输入服务器地址和访问码。如何获取访问密钥?
- TapData Cloud 平台
- TapData Enterprise 平台
注册并登录 TapData Cloud 平台,单击右上角的用户名并选择用户中心,即可获取 Access Key 和 Secret Key 信息。

联系管理员获取 TapData Enterprise 平台的登录地址,完成登录后单击右上角的用户名并选择个人设置,即可获取访问码。

-
密钥信息验证通过后,命令行将打印欢迎信息和当前的 Agent 等信息,表示已成功连接到 TapData 实时数据平台,此时可通过 h 命令查看帮助信息。
Mon Oct 21 15:53:50 CST 2024 connecting remote server: https://cloud.tapdata.net ...
Mon Oct 21 15:53:50 CST 2024 Welcome to TapData Live Data Platform, Enjoy Your Data Trip !
========================================================================================================================
TapData Cloud Service Running Agent: 1
Agent name: agent-192*****67, ip: 172.17.0.3, cpu usage: 16%
默认情况下,TapFlow 会在 ~/.tapflow/config.ini 生成配置文件,您可以通过编辑该文件来调整认证信息,或使用 tap -c <filename> 指定自定义的配置文件路径。