BR 技术头条 技术链接、资讯与社区分享流
yq yq.aliyun.com / 2019-12-30 15:48 / by @可耐芊小仙女

在 Flink 算子中使用多线程如何保证不丢数据?

打开原文 喜欢 1 请先微博登录后参与 0 条评论
本机暂存
笔者线上有一个 Flink 任务消费 Kafka 数据,将数据转换后,在 Flink 的 Sink 算子内部调用第三方 api 将数据上报到第三方的数据分析平台。这里使用批量同步 api,即:每 50 条数据请求一次第三方接口,可以通过批量 api 来提高请求效率。由于调用的外网接口,所以每次调用 api 比较耗时。假如批次大小为 50,且请求接口的平均响应时间为 50ms,使用同步 api,因此第一次请求响应以后才会发起第二次请求。

赞过的人

@技术头条

发表评论

请先微博登录后参与