通过DataWorks数据集成归档日志服务数据至MaxCompute进行离线分析 (yq.aliyun.com)

【简介】

消费点位也可以按照自定义设置5分钟调度一次,从00:00到23:59,startTime=系统前分钟到[yyyymmddhh24miss-5/24/60]系统前5分钟时间(注意与上图消费数据定位不同),那么应该配置为ds=[yyyymmdd-5/24/60],hr=[hh24-5/24/60],min=[mi-5/24/60]。

点击查看全文 >>

@可耐芊小仙女 2019-04-09 15:57分享 / 0个评论
要不要再学学下面的文章?
从零开始入门 K8s | 应用存储和持久化数据卷:存储快照与拓扑调度 (yq.aliyun.com)
在使用存储时,为了提高数据操作的容错性,我们通常有需要对线上数据进行 snapshot ,以及能快速 restore 的能力。另外,当需要对线上数据进行快速的复制以及迁移等动作,如进行环境的复制、数据开发等功能时,都可以通过存储快照来满足需求,而 K8s 中通过 CSI Snapshotter controller 来实现存储快照的功能。
by @技术小编443 2019-10-16 16:19 分享 查看详情
从零开始入门 K8s | 应用存储和持久化数据卷:核心知识 (yq.aliyun.com)
介绍了 K8s Volume 的使用场景,以及本身局限性;
通过介绍 K8s 的 PVC 和 PV 体系,说明 K8s 通过 PVC 和 PV 体系增强了 K8s Volumes 在多 Pod 共享/迁移/存储扩展等场景下的能力的必要性以及设计思想;
通过介绍 PV(存储)的不同供给模式 (static and dynamic),学习了如何通过不同方式为集群中的 Pod 供给所需的存储;
通过 PVC&PV 在 K8s 中完整的处理流程,深入理解 PVC&PV 的工作原理 。
by @技术小编443 2019-10-16 11:36 分享 查看详情
从零开始入门 K8s | 应用存储和持久化数据卷:存储快照与拓扑调度 (yq.aliyun.com)
在使用存储时,为了提高数据操作的容错性,我们通常有需要对线上数据进行 snapshot ,以及能快速 restore 的能力。另外,当需要对线上数据进行快速的复制以及迁移等动作,如进行环境的复制、数据开发等功能时,都可以通过存储快照来满足需求,而 K8s 中通过 CSI Snapshotter controller 来实现存储快照的功能。
by @可耐芊小仙女 2019-10-15 17:34 分享 查看详情
从零开始入门 K8s | 应用存储和持久化数据卷:核心知识 (yq.aliyun.com)
文内场景中,通过 Pod Volumes 很难准确地表达它的复用/共享语义,对它的扩展也比较困难。因此 K8s 中又引入了 Persistent Volumes 概念,它可以将存储和计算分离,通过不同的组件来管理存储资源和计算资源,然后解耦 pod 和 Volume 之间生命周期的关联。这样,当把 pod 删除之后,它使用的 PV 仍然存在,还可以被新建的 pod 复用。
by @可耐芊小仙女 2019-10-15 17:33 分享 查看详情
如何构建批流一体数据融合平台的一致性语义保证? (yq.aliyun.com)
本文根据陈肃老师在 Apache Kafka x Flink Meetup 深圳站的分享整理而成,文章首先将从数据融合角度,谈一下 DataPipeline 对批流一体架构的看法,以及如何设计和使用一个基础框架。其次,数据的一致性是进行数据融合时最基础的问题。如果数据无法实现一致,即使同步再快,支持的功能再丰富,都没有意义。
by @技术小编443 2019-10-15 10:29 分享 查看详情
阿里巴巴高级技术专家章剑锋:大数据发展的 8 个要点 (yq.aliyun.com)
笔者从 2008 年开始工作到现在也有 11 个年头了,一路走来都在和数据打交道,做过大数据底层框架内核的开发(Hadoop,Pig,Tez,Spark,Livy),也做过上层大数据应用开发(写 MapReduce Job 做 ETL ,用 Hive 做 Ad hocquery,用 Tableau 做数据可视化,用 R 做数据分析)。今天我想借此机会和大家聊聊我所理解的大数据现状和未来。
by @技术小编443 2019-10-14 13:42 分享 查看详情
阿里云重磅发布全域集成解决方案,帮助提升5倍全域集成效率 (yq.aliyun.com)
9月26日,在云栖大会SaaS加速器专场上,阿里云重磅发布了全域集成解决方案。作为一款强大的集成中台产品,它能够提升5倍全域集成效率,更好地解决现代企业在数字化转型过程中面临的日益增多的IT系统间的协同需求。
by @技术小编443 2019-10-12 11:22 分享 查看详情
阿里巴巴高级技术专家章剑锋:大数据发展的 8 个要点 (yq.aliyun.com)
笔者从 2008 年开始工作到现在也有 11 个年头了,一路走来都在和数据打交道,做过大数据底层框架内核的开发(Hadoop,Pig,Tez,Spark,Livy),也做过上层大数据应用开发(写 MapReduce Job 做 ETL ,用 Hive 做 Ad hocquery,用 Tableau 做数据可视化,用 R 做数据分析)。今天我想借此机会和大家聊聊我所理解的大数据现状和未来。
by @可耐芊小仙女 2019-10-10 16:40 分享 查看详情
如何构建批流一体数据融合平台的一致性语义保证? (yq.aliyun.com)
本文根据陈肃老师在 Apache Kafka x Flink Meetup 深圳站的分享整理而成,文章首先将从数据融合角度,谈一下 DataPipeline 对批流一体架构的看法,以及如何设计和使用一个基础框架。其次,数据的一致性是进行数据融合时最基础的问题。如果数据无法实现一致,即使同步再快,支持的功能再丰富,都没有意义。
by @可耐芊小仙女 2019-10-10 16:38 分享 查看详情
阿里云重磅发布全域集成解决方案,帮助提升5倍全域集成效率 (yq.aliyun.com)
9月26日,在云栖大会SaaS加速器专场上,阿里云重磅发布了全域集成解决方案。作为一款强大的集成中台产品,它能够提升5倍全域集成效率,更好地解决现代企业在数字化转型过程中面临的日益增多的IT系统间的协同需求。
by @可耐芊小仙女 2019-10-09 15:38 分享 查看详情