大数据“重磅炸弹”——实时计算框架 Flink (mp.weixin.qq.com)

【简介】

Flink 多篇博客和问题以及资料分享,《从1到100深入学习Flink》源码学习这个系列文章,《从0到1学习Flink》的案例文章也会优先在知识星球更新,让大家先通过一些 demo 学习 Flink,再去深入源码学习

点击查看全文 >>

@zhisheng_tian 2019-04-03 19:38分享 / 0个评论
赞过的人: 技术头条 zhisheng_tian
要不要再学学下面的文章?
DRDS 数据恢复重磅发布,全方位保障您的数据安全 (yq.aliyun.com)
数据库存储着企业的核心数据,在企业中占据非常重要的位置,一旦出现SQL注入,数据误删的情况,影响的不仅仅是业务,还会泄露用户的个人信息。因此,数据库的数据安全问题十分重要。当数据库迁移到云端,其安全问题又被进一步放大,云数据库能否高效、便捷地备份数据库,当发生故障或者数据误删时,及时高效地恢复数据,成为企业用户关心的重要问题,影响着他们迁移数据库上云的信心。
by @可耐芊小仙女 1小时前 分享 查看详情
Flink 中这样管理配置,你知道? (mp.weixin.qq.com)
如果你了解 Apache Flink 的话,那么你应该熟悉该如何像 Flink 发送数据或者如何从 Flink 获取数据。但是在某些情况下,我们需要将配置数据发送到 Flink 集群并从中接收一些额外的数据。

在本文的前部分,我将描述如何将配置数据发送到 Flink 集群。我们需要配置很多东西:方法参数、配置文件、机器学习模型。Flink 提供了几种不同的方法,我们将介绍如何使用它们以及何时使用它们。在本文的后部分,我将描述如何从 Flink 集群中获取数据。
by @zhisheng_tian 20小时前 分享 查看详情
Flink 不可以连续 Split(分流)? (mp.weixin.qq.com)
今天上午被 Flink 的一个算子困惑了下,具体问题是什么呢?

我有这么个需求:有不同种类型的告警数据流(包含恢复数据),然后我要将这些数据流做一个拆分,拆分后的话,每种告警里面的数据又想将告警数据和恢复数据拆分出来。

结果,这个需求用 Flink 的 Split 运算符出现了问题。
by @zhisheng_tian 20小时前 分享 查看详情
Flink 从0到1学习—— 分享四本 Flink 的书和二十多篇 Paper 论文 (mp.weixin.qq.com)
之前也分享了不少自己的文章,但是对于 Flink 来说,还是有不少新入门的朋友,这里给大家分享点 Flink 相关的资料(国外数据 pdf 和流处理相关的 Paper),期望可以帮你更好的理解 Flink。
by @zhisheng_tian 20小时前 分享 查看详情
360深度实践:Flink与Storm协议级对比 (mp.weixin.qq.com)
本文从数据传输和数据可靠性的角度出发,对比测试了Storm与Flink在流处理上的性能,并对测试结果进行分析,给出在使用Flink时提高性能的建议。
by @zhisheng_tian 20小时前 分享 查看详情
Java 通用爬虫框架中多线程的使用 (www.jianshu.com)
本文总结了通用爬虫框架 NetDiscovery 在某些特定场景中如何使用多线程。
by @Tony沈哲 2019-06-16 22:33 分享 查看详情
云计算,从何而来,正向哪里而去 (insights.thoughtworks.cn)
我们在这里对于云计算的简单回顾,希望可以帮助大家更好地理解这个趋势从何而来,正在向哪里而去。
by @ThoughtWorks 2019-06-14 16:42 分享 查看详情
优酷背后的大数据秘密 (yq.aliyun.com)
大家好,我是门德亮,现在在优酷数据中台做数据相关的事情。很荣幸,我正好见证了优酷从没有MaxCompute到有的这样一个历程,因为刚刚好我就是入职优酷差不多5年的时间,我们正好是在快到5年的时候,去做了从Hadoop到MaxCompute的这样一个升级。这个是2016年5月到2019年现在的5月优酷的发展历程,上面是计算资源,下面是储存资源。大家可以看到整个用户数,还有表的数据,实际上是在呈一个指数式增长的。但是在2017年5月,当优酷完成了整个Hadoop迁移MaxCompute后,优酷的计算消耗,还有储存的消耗实际上是呈下降趋势的,整个迁移得到了一个非常大的收益。
by @可耐芊小仙女 2019-06-13 15:39 分享 查看详情
一条数据的漫游 -- X-Engine SIGMOD Paper Introduction (yq.aliyun.com)
X-Engine是阿里数据库产品事业部自研的OLTP数据库存储引擎,作为自研数据库POLARDB X的存储引擎,已经广泛应用在阿里集团内部诸多业务系统中,其中包括交易历史库,钉钉历史库等核心应用,为业务大幅缩减了成本,同时也作为双十一大促的关键数据库技术,挺过了数百倍平时流量的冲击。
by @可耐芊小仙女 2019-06-12 15:59 分享 查看详情
如何利用边缘计算,实现低延时、高质量的互动课堂体验? (yq.aliyun.com)
据《2019中国在线教育行业市场前瞻分析报告》显示:未来几年,在线教育用户规模将保持15%左右的速度继续增长,到2024年预计突破4亿人,总体市场规模将突破4500亿元。相比于传统线下,在线教育优势十分明显,它不受地域的限制,学生可利用互联网时代的碎片化时间学习,老师不用亲临现场授课,节省多方成本,同时也解决了传统优质教育资源分布不均的难题。
by @可耐芊小仙女 2019-06-10 15:19 分享 查看详情