BR 技术头条

技术头条

技术链接、资讯与社区分享流

yq yq.aliyun.com / 2019-12-30 15:48 / by @可耐芊小仙女

在 Flink 算子中使用多线程如何保证不丢数据?

笔者线上有一个 Flink 任务消费 Kafka 数据,将数据转换后,在 Flink 的 Sink 算子内部调用第三方 api 将数据上报到第三方的数据分析平台。这里使用批量同步 api,即:每 50 条数据请求一次第三方接口,可以通过批量 api 来提高请求效率。由于调用的外网接口,所以每次调用 api 比较耗时。假如批次大小为 50,且请求接口的平均响应时间为 50ms,使用同步 api,因此第一次请求响应以后才会发起第二次请求。

赞过的人

@技术头条

发表评论