GitHub 开始阻止被制裁国的开发者使用 (kymjs.com)
上周五,国外新闻网站 ZDNet 发表了一篇报道GitHub与跟世界贸易摩擦国(例如中国、俄罗斯)的程序员关系的文章 —— GitHub starts blocking developers in countries facing US trade sanctions(GitHub 开始阻止被制裁国的开发者使用),具体内容如下:
by @kymjs张涛 2019-07-29 10:15 分享 查看详情
高效会议的十三条军规 (insights.thoughtworks.cn)
团队大了,总有各种会议和讨论,沟通成本上升不少。但是我们不能只是抱怨,如何提高开会的效率才是关键。本文通过故事的方式分享日常会议的常见问题,并试图从会前、会中、会后三个阶段来列一些相对比较基础的、比较容易落地执行的规则。
by @ThoughtWorks 2019-07-26 09:54 分享 查看详情
MaxCompute技术人背后的故事:从ApacheORC到AliORC (yq.aliyun.com)
2019大数据技术公开课第一季《技术人生专访》来袭,本季将带领开发者们探讨大数据技术,分享不同国家的工作体验。本文整理自阿里巴巴计算平台事业部高级技术专家吴刚的专访,将为大家介绍Apache ORC开源项目、主流的开源列存格式ORC和Parquet的区别以及MaxCompute选择ORC的原因。此外,吴还将分享他是如何一步步成为Apache开源项目的Committer和PMC的。
by @可耐芊小仙女 2019-07-25 16:41 分享 查看详情
Kubernetes 弹性伸缩全场景解读(二)- HPA 的原理与演进 (yq.aliyun.com)
我们介绍了在 Kubernetes 在处理弹性伸缩时的设计理念以及相关组件的布局,在今天这篇文章中,会为大家介绍在 Kubernetes 中弹性伸缩最常用的组件 HPA(Horizontal Pod Autoscaler)。HPA 是通过计算 Pod 的实际工作负载进行重新容量规划的组件,在资源池符合满足条件的前提下,HPA 可以很好的实现弹性伸缩的模型。HPA 到目前为止,已经演进了三个大版本,本文将会为大家详细解析 HPA 底层的原理以及在 Kubernetes 中弹性伸缩概念的演变历程。
by @可耐芊小仙女 2019-07-25 16:40 分享 查看详情
大数据心法来了!一站式玩转MaxCompute,还有开发者资源等你领! (yq.aliyun.com)
阿里云大数据计算平台开发者版2019年3月推出,MaxCompute正在成为开发者的免费大数据平台。今天,MaxCompute在企业构建自己的数据处理平台实践中起到了至关重要的作用,我们特别精选了企业的真实实践案例:从最大的兴趣社群平台小打卡;到90后、00后喜欢的克拉克拉;从互联网金融的典型天弘基金;到耳熟能详的二手车平台人人车……为你带来了超多的MaxCompute玩法。
by @可耐芊小仙女 2019-07-25 16:39 分享 查看详情
基于阿里云 MaxCompute 构建企业云数据仓库CDW的最佳实践建议 (yq.aliyun.com)
在这么长的客户工作过程中,作为产品PD,一定是跟客户在一起的。我经常被一些问题挑战:云郎,我们现在要建数据仓库,我该怎么去规划?云郎,我现在这边是大数据的建设团队,好像数据团队不怎么理我,什么情况?云郎,我们这边现在建了一个平台,现在性能好像有问题,是不是我们哪些地方设计的有问题,还是考虑的不够?可以看到,不同的客户在不同的阶段有不同的问题,在这么多的客户问题里,背后到底隐藏了什么规律?在这里面有没有一些最佳实践,我们可以总结出来,让大家去少走一些弯路,这是我的出发点。
by @可耐芊小仙女 2019-07-25 16:37 分享 查看详情
深入理解 Java 内存模型 (mp.weixin.qq.com)
《深入理解 Java 内存模型》程晓明著,该书在以前看过一遍,现在学的东西越多,感觉那块越重要,于是又再细看一遍,于是便有了下面的读书笔记总结。全书页数虽不多,内容讲得挺深的。细看的话,也是挺花时间的,看完收获绝对挺大的。也建议 Java 开发者都去看看。里面主要有 Java 内存模型的基础、重排序、顺序一致性、Volatile 关键字、锁、final。本文参考书中内容。
by @zhisheng_tian 2019-07-25 09:52 分享 查看详情
美团点评基于 Flink 的实时数仓建设实践 (mp.weixin.qq.com)
近些年,企业对数据服务实时化服务需求日益增多。本文整理了常见实时数据组件的性能特点和适用场景,介绍了美团如何通过 Flink 引擎构建实时数据仓库,从而提供高效、稳健的实时数据服务。此前我们美团技术博客发布过一篇文章《流计算框架 Flink 与 Storm 的性能对比》,对 Flink 和 Storm 两个引擎的计算性能进行了比较。本文主要阐述使用 Flink 在实际数据生产上的经验。
by @zhisheng_tian 2019-07-25 09:52 分享 查看详情
不好意思,我和 Java 内存模型杠上了! (mp.weixin.qq.com)
Java内存模型是在硬件内存模型上的更高层的抽象,它屏蔽了各种硬件和操作系统访问的差异性,保证了Java程序在各种平台下对内存的访问都能达到一致的效果。
by @zhisheng_tian 2019-07-25 09:51 分享 查看详情
Java开发最常犯的10个错误,打死都不要犯! (mp.weixin.qq.com)
Array转ArrayList

判断一个数组是否包含某个值

在循环内部删除List中的一个元素

HashTable与HashMap

使用集合原始类型(raw type)

访问级别

ArrayList和LinkedList

可变与不可变

父类和子类的构造方法

“”还是构造方法

未来工作

这个列表总结了10个Java开发人员最常犯的错误。
by @zhisheng_tian 2019-07-25 09:50 分享 查看详情
Flink 灵魂两百问,这谁顶得住? (mp.weixin.qq.com)
两百问一点都不夸张,这才光知识星球从创建到现在的问题总数,另外还有多个微信群的答疑解惑。有时候忍不住想给自己点个赞,咋能这么
by @zhisheng_tian 2019-07-25 09:49 分享 查看详情
看完这篇还不会 Elasticsearch,我跪搓衣板! (mp.weixin.qq.com)
搜索引擎是对数据的检索,所以我们先从生活中的数据说起。我们生活中的数据总体分为两种:

结构化数据

非结构化数据



结构化数据:也称作行数据,是由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范,主要通过关系型数据库进行存储和管理。指具有固定格式或有限长度的数据,如数据库,元数据等。
by @zhisheng_tian 2019-07-25 09:49 分享 查看详情
《2019年上半年Web应用安全报告》发布:90%以上攻击流量来源于扫描器,IP身份不再可信 (yq.aliyun.com)
Web应用安全依然是互联网安全的最大威胁来源之一,除了传统的网页和APP,API和各种小程序也作为新的流量入口快速崛起,更多的流量入口和更易用的调用方式在提高web应用开发效率的同时也带来了更多和更复杂的安全问题。一方面,传统的SQL注入、XSS、CC攻击等传统攻击手段和各种新爆出的web漏洞无时无刻不在考验着web应用安全方案的健壮性、灵活性和安全团队的快速反应能力,另一方面随着大数据技术和流量产业的成熟,互联网中来自自动化程序的流量占比也在迅速增长,爬虫也随之成为一个不容忽视的存在,伴随而来的数据泄露、流量作弊等问题也为各类业务带来了非常头痛的费用浪费、业务不可用以及各类业务安全类问题。
by @可耐芊小仙女 2019-07-24 15:49 分享 查看详情
《2019上半年DDoS攻击态势报告》发布:应用层攻击形势依然严峻,海量移动设备成新一代肉鸡 (yq.aliyun.com)
2019年上半年,阿里云安全团队平均每天帮助用户防御2500余次DDoS攻击,与2018年持平。目前阿里云承载着中国40%网站流量,为全球上百万客户提供基础安全防御。可以说,阿里云上的DDoS攻防态势是整个中国攻防态势的缩影。阿里云安全团队基于2019年上半年云上的DDoS攻击数据,从DDoS攻击事件、僵尸网络中控、DDoS肉鸡、攻击事件情况等多个维度做了统计分析,希望为政府和企业客户提供参考。
by @可耐芊小仙女 2019-07-24 15:47 分享 查看详情
更新与发展 | Alibaba Cloud Linux 2 特性与开发细节揭秘 (yq.aliyun.com)
2019 年 4 月,Alibaba Cloud Linux 2 (Aliyun Linux 2) 正式开源。时至今日,已经走过三个月的里程。在这段时间内,这个刚诞生不久的为阿里云 ECS 环境定制优化的 Linux 操作系统发行版的装机量稳步上升。我们经常接到内部和外部的客户咨询 Alibaba Cloud Linux 2 相关的问题,因此本文将重点介绍 Alibaba Cloud Linux 2 的特性更新;此外,我们认为云计算业务中,操作系统的角色相当于“水和空气”的地位,平日里的存在近乎透明,而一旦出问题却令人难以忍受,因此除了了解特性列表,本文也将介绍 Alibaba Cloud Linux 2 开发过程中的决策过程与质量保证细节,希望更高的透明度可以增强用户的信心。
by @可耐芊小仙女 2019-07-24 15:45 分享 查看详情
解锁云原生 AI 技能|在 Kubernetes 上构建机器学习系统 (yq.aliyun.com)
机器学习的工程复杂度,除了来自于常见的软件开发问题外,还和机器学习数据驱动的特点相关。而这就带来了其工作流程链路更长,数据版本失控,实验难以跟踪、结果难以重现,模型迭代成本巨大等一系列问题。为了解决这些机器学习固有的问题,很多企业构建了内部机器学习平台来管理机器学习生命周期,其中最有名的是 Google 的 Tensorflow Extended, Facebook 的 FBLearner Flow, Uber 的 Michelangelo,遗憾的是这些平台都需要绑定在公司内部的基础设施之上,无法彻底开源。而这些机器学习平台的骨架就是机器学习工作流系统,它可以让数据科学家灵活定义自己的机器学习流水线,重用已有的数据处理和模型训练能力,进而更好的管理机器学习生命周期。
by @可耐芊小仙女 2019-07-24 15:44 分享 查看详情
重磅!阿里云Promtheus 正式免费公测 (developer.aliyun.com)
XGBoost和Random-Forest(RF,随机森林)都属于集成学习(Ensemble Learning),集成学习的目的是通过结合多个基学习器的预测结果来改善单个学习器的泛化能力和鲁棒性,通过组合各个决策树的输出来进行预测(分类或回归)。而集成学习按照个体学习器的生成方式,可以大致分为两类:一类是个体学习器之间存在强依赖关系,必须串行生成序列的方法;以及个体学习器之间不存在强依赖关系,可同时生成的并行化方法。前者的代表就是XGBoost,后者的代表是Random-Forest。
by @可耐芊小仙女 2019-07-24 15:42 分享 查看详情
揭秘大数据安全 (insights.thoughtworks.cn)
数据是企业极力保护的核心资产之一,其重要性不言而喻。那大数据安全又是什么呢?是确保数据在收集、传输、处理和存储时的安全?那这个常见的数据安全又有何异同?本篇将对相关问题作出讨论。
by @ThoughtWorks 2019-07-24 10:55 分享 查看详情
读完这篇文章,5G 就没有秘密了 (zhuanlan.zhihu.com)
提起 5G ,相信各位的第一印象就是高带宽,这的确是最明显的、也是大家最能显著感受到的 5G 网络特点。前段时间,一位北京邮电大学的学生发布了自己测试学校5G 网络的视频。视频中,5G 手机的平均下载速率达到 700Mbps 左右,差不多是 4G 的十倍,下载音乐和应用基本上都是“秒”级,在线播放超高清视频可以随意拖拽进度条,毫无卡顿。
by @又拍云 2019-07-24 10:44 分享 查看详情
2019新款六级分销的影视双端APP源码 (www.sucaihuo.com)
2019新款六级分销的影视双端APP源码,可以一键登录、方便快捷。带有专属的邀请分享,极速播放的观影体验,是一款特别不错的影视视频源码。
by @素材火官网 2019-07-24 09:38 分享 查看详情