使用Data Lake Analytics从OSS清洗数据到AnalyticDB (yq.aliyun.com)

【简介】

必须是同一阿里云region的Data Lake Analytics(DLA)到AnalyticDB的才能进行清洗操作;
开通并初始化了该region的DLA服务;
开通并购买了AnalyticDB的实例,实例规模和数据清洗速度强相关,与AnalyticDB的实例资源规模基本成线性比例关系。

点击查看全文 >>

@可耐芊小仙女 2019-04-12 16:47分享 / 0个评论
要不要再学学下面的文章?
RDS for PostgreSQL 云盘加密功能使用方法 (yq.aliyun.com)
RDS for PostgreSQL支持数据盘的加密功能,提供更高的数据存储安全等级。(加密KEY可以由用户提供,也可以由KMS服务生成。)
by @可耐芊小仙女 2019-08-19 15:54 分享 查看详情
Android Study - 关于AIDL的使用学习 (mp.weixin.qq.com)
进程:一般指一个执行单元,在平台上指一个程序或一个应用;

线程:CPU调度的最小单位,也是一种资源,一个应用可包含多个线程;
by @code小生 2019-08-18 23:19 分享 查看详情
再也不怕数据丢失!阿里云RDS MySQL 8.0上线回收站功能 (yq.aliyun.com)
MySQL 在生产环境使用过程中,会伴随着开发和运维人员的误操作,比如 DROP TABLE / DATABASE,这类 DDL 语句不具有可操作的回滚特性,而导致数据丢失,AliSQL 8.0 新特性支持回收站功能(Recycle Bin),临时把删除清理的表转移到回收站,并保留可设置的时间,方便用户找回数据。为了方便,提供了 DBMS_RECYCLE package 作为管理接口。
by @可耐芊小仙女 2019-08-16 15:28 分享 查看详情
只要三步!阿里云DLA帮你处理海量JSON数据 (yq.aliyun.com)
您可能有大量应用程序产生的JSON数据,您可能需要对这些JSON数据进行整理,去除不想要的字段,或者只保留想要的字段,或者仅仅是进行数据查询。那么,利用阿里云Data Lake Analytics或许是目前能找到的云上最为便捷的达到这一目标的服务了。仅仅需要3步,就可以完成对海量JSON数据的处理,或者更为复杂的ETL流程。
by @可耐芊小仙女 2019-08-16 15:24 分享 查看详情
PAI-STUDIO通过Tensorflow处理MaxCompute表数据 (yq.aliyun.com)
PAI-STUDIO在支持OSS数据源的基础上,增加了对MaxCompute表的数据支持。用户可以直接使用PAI-STUDIO的Tensorflow组件读写MaxCompute数据,本教程将提供完整数据和代码供大家测试。
by @可耐芊小仙女 2019-08-15 15:51 分享 查看详情
荷畔微风 - 在函数计算FunctionCompute中使用WebAssembly (yq.aliyun.com)
WebAssembly 是一种新的W3C规范,无需插件可以在所有现代浏览器中实现近乎原生代码的性能。同时由于 WebAssembly 运行在轻量级的沙箱虚拟机上,在安全、可移植性上比原生进程更加具备优势。同时资源消耗小、启动速度快的特点也非常适合Serverless的场景。开发者们开始探索WebAssembly在Serverless的应用场景。
by @可耐芊小仙女 2019-08-12 15:43 分享 查看详情
悠星网络基于阿里云分析型数据库PostgreSQL版的数据实践 (yq.aliyun.com)
说到“大数据”,当下这个词很火,各行各业涉及到数据的,目前都在提大数据,提数据仓库,数据挖掘或者机器学习,但同时另外一个热门的名词也很火,那就是“云”。越来越多的企业都在搭建属于自己的云平台,也有一些会选择使用技术比较成熟的云商业化产品服务,比如阿里云的分析型数据库产品。本文将结合我们自己企业内部正在使用的阿里云产品分析型数据库PostgreSQL(下文都将称为AnalyticDB PostgreSQL版)来浅谈一下云业务场景下的数据实践。
by @可耐芊小仙女 2019-08-09 15:24 分享 查看详情
使用 Ngrox 实现内网穿透 (www.kymjs.com)
最近在做 Server 开发,需要将一个内网的服务暴露出去,使其在家也能访问到。

ngrok 是一个反向代理工具,官方有免费的可以使用,但是由于海外原因速度非常慢。好在这套服务都开源了,我们可以用开源代码搭建一个服务,自己使用。
by @技术头条 2019-08-06 22:28 分享 查看详情
阿里巴巴集团副总裁贾扬清:开源大数据生态前瞻 (developer.aliyun.com)
2019阿里云峰会·上海开发者大会于7月24日盛大开幕,本次峰会与未来世界的开发者们分享开源大数据、IT基础设施云化、数据库、云原生、物联网等领域的技术干货,共同探讨前沿科技趋势。本文整理自开源大数据专场中阿里巴巴集团副总裁,阿里巴巴计算平台事业部总裁贾扬清先生的精彩演讲,将为大家讲述开源大数据与人工智能生态前瞻,分享阿里云对开源的态度,以及对大数据和人工智能的未来规划。
by @可耐芊小仙女 2019-08-05 15:40 分享 查看详情
更简单易用的数据仓库,阿里云重磅推出分析型数据库3.0版 (yq.aliyun.com)
全新的AnalyticDB采⽤分布式云盘三副本机制,为企业客户提供99.9999999%的数据可靠性保证。此外,性能⼤幅度提升,基准测试写⼊性能提升50%,查询性能提升40%。实例存储空间可变,灵活控制CPU、存储和内存配⽐。全⾯兼容MySQL、数据类型更完备。更简单易⽤,使得企业客户像开启MySQL⼀样,使⽤数据仓库!据介绍,阿⾥巴巴早些年先后尝试过单节点Oracle、Oracle RAC、Greenplum做准实时分析。为了 迎接更⼤数据集、更⾼并发、更⾼可⽤、更实时的数据应⽤发展趋势,从2011年开始,在线分析这个技术 领域,阿⾥实时数仓坚定的⾛上了⾃研之路。
by @可耐芊小仙女 2019-08-01 15:42 分享 查看详情