使用Data Lake Analytics + OSS分析CSV格式的TPC-H数据集 (yq.aliyun.com)

【简介】

至此,本教程一步一步教您如何利用Data Lake Analytics云产品分析您OSS上的CSV格式的数据文件。除了CSV文件外,Data Lake Analytics还支持Parquet、ORC、json、RCFile、AVRO等多种格式文件的数据分析能力。特别是Parquet、ORC,相比CSV文件,有极大的性能和成本优势(同样内容的数据集,拥有更小的存储空间、更快的查询性能,这也意味着更低的分析成本)。

点击查看全文 >>

@可耐芊小仙女 2019-03-11 15:34分享 / 0个评论
要不要再学学下面的文章?
BigData NoSQL —— ApsaraDB HBase数据存储与分析平台概览 (yq.aliyun.com)
越来越多的数据库会做云原生(CloudNative),会不断利用新的硬件及云本身的优势打造CloudNative数据库,国内以阿里云的Cloud HBase、POLARDB为代表,此块文章会有一定的引述,但不是本文的重点。
by @可耐芊小仙女 2019-05-22 15:09 分享 查看详情
Windows 使用之那些你还不知道操作 (mp.weixin.qq.com)
建议更换 win10 系统

可能很多朋友看到这个建议,心里很不爽,还很不服气,别急,且看官方给出的信息。
by @code小生 2019-05-19 09:58 分享 查看详情
死磕 Java集合之ArrayList源码分析 (mp.weixin.qq.com)
简介
ArrayList是一种以数组实现的List,与数组相比,它具有动态扩展的能力,因此也可称之为动态数组。

继承体系
by @zhisheng_tian 2019-05-17 19:59 分享 查看详情
死磕 java集合之CopyOnWriteArrayList源码分析 (mp.weixin.qq.com)
简介
CopyOnWriteArrayList是ArrayList的线程安全版本,内部也是通过数组实现,每次对数组的修改都完全拷贝一份新的数组来修改,修改完了再替换掉老数组,这样保证了只阻塞写操作,不阻塞读操作,实现读写分离。
by @zhisheng_tian 2019-05-17 19:57 分享 查看详情
对比MySQL,一文看透HBase的能力及使用场景 (yq.aliyun.com)
MySQL + HBase 是我们日常应用中常用的两个数据库,分别解决应用的在线事务问题和大数据场景的海量存储问题。本文内容适合初次理解HBase的读者,包括技术、功能及场景,也欢迎老司机们补充和温故。
by @可耐芊小仙女 2019-05-16 15:18 分享 查看详情
使用DataX同步MaxCompute数据到TableStore(原OTS)优化指南 (yq.aliyun.com)
现在越来越多的技术架构下会组合使用MaxCompute和TableStore,用MaxCompute作大数据分析,计算的结果会导出到TableStore提供在线访问。MaxCompute提供海量数据计算的能力,而TableStore提供海量数据高并发低延迟读写的能力。将 MaxCompute内数据导出至TableStore,目前可选的几种主要途径包括:
by @可耐芊小仙女 2019-05-14 16:07 分享 查看详情
阿里云Kubernetes服务上使用Tekton完成应用发布初体验 (yq.aliyun.com)
Tekton 是一个功能强大且灵活的 Kubernetes 原生开源框架,用于创建持续集成和交付(CI/CD)系统。通过抽象底层实现细节,用户可以跨多云平台和本地系统进行构建、测试和部署。本文是基于阿里云Kubernetes服务部署Tekton Pipeline,并使用它完成源码拉取、应用打包、镜像推送和应用部署的实践过程。
by @可耐芊小仙女 2019-05-14 16:05 分享 查看详情
MaxCompute Studio使用心得系列7—作业对比 (yq.aliyun.com)
在数据开发过程中,我们通常需要将两个作业进行对比从而定位作业运行性能或者结果有差异的问题,但是对比作业时需要同时打开两个studio 的tab页,或者两个Logview页,不停切换进行对比,使用起来非常的不方便。MaxCompute Studio从3.1.0版本开始支持作业对比,可以在一个页面同时比较两个作业,并且能自动标注出作业的差异点。
by @可耐芊小仙女 2019-05-13 15:38 分享 查看详情
Data V数据可视化:一屏在手万物可视,企业如何在数据浪潮中脱颖而出? (yq.aliyun.com)
数据可视化是指将数据以视觉的形式来呈现,以帮助人们了解这些数据的意义。人类大脑对视觉信息的处理优于对文本的处理,因此使用图表、图形和设计元素把数据进行可视化,可以帮助人们更容易地解释数据模式、趋势、统计规律和数据相关性。
by @可耐芊小仙女 2019-05-05 16:25 分享 查看详情
招商银行为什么使用MySQL (wubx.net)
对于金融行业使用MySQL可以说也比较早,例如腾讯的财富通从开始到现都是基于MySQL构建,但对于传统银行企业使用MySQL我也是一直存在好奇的想法。 这次在3306π北京站有幸听了招商银行王龙的分享也解决了我几个疑问,特Mark一下。

招商银行在走向开源的道路为什么选择了MySQL,而不是其它数据库?
招商银行在使用MySQL大概的规模及情况是什么?
招商银行是如何管理他们的MySQL?
他们成功的心得是什么?
by @技术头条 2019-05-01 20:01 分享 查看详情