解锁云原生 AI 技能|在 Kubernetes 上构建机器学习系统 (yq.aliyun.com)
机器学习的工程复杂度,除了来自于常见的软件开发问题外,还和机器学习数据驱动的特点相关。而这就带来了其工作流程链路更长,数据版本失控,实验难以跟踪、结果难以重现,模型迭代成本巨大等一系列问题。为了解决这些机器学习固有的问题,很多企业构建了内部机器学习平台来管理机器学习生命周期,其中最有名的是 Google 的 Tensorflow Extended, Facebook 的 FBLearner Flow, Uber 的 Michelangelo,遗憾的是这些平台都需要绑定在公司内部的基础设施之上,无法彻底开源。而这些机器学习平台的骨架就是机器学习工作流系统,它可以让数据科学家灵活定义自己的机器学习流水线,重用已有的数据处理和模型训练能力,进而更好的管理机器学习生命周期。
by @可耐芊小仙女 2019-07-24 15:44 分享 查看详情
重磅!阿里云Promtheus 正式免费公测 (developer.aliyun.com)
XGBoost和Random-Forest(RF,随机森林)都属于集成学习(Ensemble Learning),集成学习的目的是通过结合多个基学习器的预测结果来改善单个学习器的泛化能力和鲁棒性,通过组合各个决策树的输出来进行预测(分类或回归)。而集成学习按照个体学习器的生成方式,可以大致分为两类:一类是个体学习器之间存在强依赖关系,必须串行生成序列的方法;以及个体学习器之间不存在强依赖关系,可同时生成的并行化方法。前者的代表就是XGBoost,后者的代表是Random-Forest。
by @可耐芊小仙女 2019-07-24 15:42 分享 查看详情
微服务开源生态报告 No.5 (yq.aliyun.com)
「微服务开源生态报告」,汇集各个开源项目近期的社区动态,帮助开发者们更高效的了解到各开源项目的最新进展。社区动态包括,但不限于:版本发布、人员动态、项目动态和规划、培训和活动。非常欢迎国内其他微服务领域的开源项目将近期的社区动态,投递给我们,我们将一同发布。
by @可耐芊小仙女 2019-07-23 15:58 分享 查看详情
弘康人寿基于 RocketMQ 构建微服务边界总线的实践 (yq.aliyun.com)
随着互联网+和平台化战略的兴起,各个行业的 IT 系统都在向互联网架构发展,涉及的主要技术包括微服务、消息和弹性计算等,采用微服务架构实现服务高内聚、低耦合,通过异步消息完成交易快速响应和高并发。由于微服务和消息是企业应用架构中用的比较多的,故希望通过本文探讨以下问题:
by @可耐芊小仙女 2019-07-23 15:56 分享 查看详情
技术人具备“结构化思维”意味着什么? (developer.aliyun.com)
所谓逻辑是指我们的结构之间必须是有逻辑关系的。例如,你说话的时候用“第一、第二、第三”这个逻辑顺序是合理的,但是,用“第一,第二,第四”就会显得很奇怪。当然,即使你用了”一、二、三”,也不一定就意味着你的内容有逻辑关系。想让内容有逻辑关系,我们要学会四种组织思想的逻辑关系:
by @可耐芊小仙女 2019-07-23 15:55 分享 查看详情
互联网商城的上云改造之旅 (developer.aliyun.com)
在中国,经过十年的发展,云计算产业已走过概念普及的1.0时期,进入“上云”和落地的2. 0阶段,企业上云意识不断增强,越来越多的企业选择部署多云和混合IT。如今,云计算生态一片繁荣,看似“全民云计算”时代已然到来,但在互联网支付行业,由于“合规、安全”的监管要求,以及对云计算价值的认知不足,众多企业对于云计算仍处于观望状态。
by @可耐芊小仙女 2019-07-23 15:53 分享 查看详情
并发模式与 RPS 模式之争,性能压测领域的星球大战 (yq.aliyun.com)
本文是《如何做好性能压测》系列专题分享的第四期,该专题将从性能压测的设计、实现、执行、监控、问题定位和分析、应用场景等多个纬度对性能压测的全过程进行拆解,以帮助大家构建完整的性能压测的理论体系,并提供有例可依的实战。该系列专题分享由阿里巴巴 PTS 团队出品,欢迎在文末处加入性能压测交流群,参与该系列的线上分享。
by @可耐芊小仙女 2019-07-23 15:52 分享 查看详情
Knative 基本功能深入剖析:Knative Serving 的流量灰度和版本管理 (yq.aliyun.com)
测试之前我们需要写一段 rest-api 的代码,并且还要能够区分不同的版本。下面我基于官方的例子进行了修改,为了使用方便去掉了 github.com/gorilla/mux 依赖,直接使用 Golang 系统包 net/http 替代。这段代码可以通过 RESOURCE 环境变量来区分不同的版本。
by @可耐芊小仙女 2019-07-22 15:41 分享 查看详情
OpenTelemetry-可观察性的新时代 (yq.aliyun.com)
OpenTracing制定了一套平台无关、厂商无关的Trace协议,使得开发人员能够方便的添加或更换分布式追踪系统的实现。在2016年11月的时候CNCF技术委员会投票接受OpenTracing作为Hosted项目,这是CNCF的第三个项目,第一个是Kubernetes,第二个是Prometheus,可见CNCF对OpenTracing背后可观察性的重视。比如大名鼎鼎的Zipkin、Jaeger都遵循OpenTracing协议。
by @可耐芊小仙女 2019-07-22 15:40 分享 查看详情
ACK容器服务虚拟节点使用阿里云日志服务来收集业务容器日志 (yq.aliyun.com)
按照这篇博文的介绍,可以在ACK集群上通过Helm的方式部署虚拟节点,提升集群的弹性能力。现在,通过虚拟节点部署的ECI弹性容器实例也支持将stdout输出、日志文件同步到阿里云日志服务(SLS)进行统一管理,所有日志能够被统一收集同一个日志服务project里面。并且,日志收集方式与集群上普通容器收集方式一致,无缝结合。本文将结合虚拟节点弹性伸缩的能力来介绍日志收集。
by @可耐芊小仙女 2019-07-22 15:39 分享 查看详情
阿里云应用高可用 AHAS 正式商用,可一键提升云上应用可用性 (yq.aliyun.com)
在分布式架构环境下,服务间的依赖日益复杂,可能没有人能说清单个故障对整个系统的影响,构建一个高可用的分布式系统面临着很大挑战。7月17日,阿里云应用高可用服务AHAS 正式商用,包含架构感知、流控降级和故障演练三大独立的功能模块,可快速提高应用的高可用能力,解决分布式架构下的高可用难题。
by @可耐芊小仙女 2019-07-22 15:37 分享 查看详情
Seata 0.7.0 正式发布 (yq.aliyun.com)
Seata 是 阿里巴巴 开源的 分布式事务中间件,以 高效 并且对业务 0 侵入 的方式,解决 微服务 场景下面临的分布式事务问题。Seata 0.7.0 已正式发布,本次共合并59pr,主要包括:protobuf 支持,mertric 支持,新协议重设计,bugfix 和代码优化等,本次更新内容如下:
by @可耐芊小仙女 2019-07-22 15:36 分享 查看详情
闲鱼Flutter&FaaS云端一体化架构 (yq.aliyun.com)
随着无线,IoT的发展,5G的到来,移动研发越发向多端化发展。传统的基于Native+Web+服务端的开发方式,研发效率低下,显然已经无法适应发展需要。我们希望探索闲鱼这样规模的独立APP的高效研发架构。主要思路是围绕Flutter解决多端问题,并使Flutter与FaaS等无服务容能力打通,形成云端一体化的研发能力,支持一云多端的发展需要。在某些场景已经取得效果,希望分享过程中的思考,与大家交流。
by @可耐芊小仙女 2019-07-19 15:23 分享 查看详情
重磅!容器集群监控利器 阿里云Prometheus 正式免费公测 (yq.aliyun.com)
Prometheus 作为容器生态下集群监控的首选方案,是一套开源的系统监控报警框架。它启发于 Google 的 borgmon 监控系统,并于 2015 年正式发布。2016 年,Prometheus 正式加入 Cloud Native Computing Foundation,成为受欢迎度仅次于 Kubernetes 的项目。7月3日,阿里云Promtheus云托管实例正式开始免费公测。针对容器集群监控场景,提供了完整的采集、存储、监控、告警、图表展现的数据监控服务。通过与 Kubernetes 平台运维解耦合,使得 Prometheus 监控服务不受被监控平台的性能、稳定性、可靠性等诸多因素的影响。
by @可耐芊小仙女 2019-07-19 15:21 分享 查看详情
阿里开源 KT Connnect,轻量级云原生测试环境治理平台来啦! (yq.aliyun.com)
目前越来越多的开发者开始采纳 Kubernetes 管理基础设施环境,并通过 Kubernetes 完成日常的开发,测试以及生产发布活动,为了能够有效的帮助开发者提升在 Kubernetes 场景下的本地开发测试效率,阿里巴巴研发效能云效团队面向原生 Kubernetes 开源了一款轻量级的开发者工具 KT Connect。KT Connect(Kubernetes Developer Tool) 是轻量级的面向 Kubernetes 用户的开发测试环境治理辅助工具。其核心是通过建立本地到集群以及集群到本地的双向通道,从而提升在持续交付生命周期中开发环节的效率问题以及开发测试环境的复用问题。
by @可耐芊小仙女 2019-07-19 15:19 分享 查看详情
5年时间,我从开发做到总裁的秘籍--如何提升技术型管理者的领导力 (developer.aliyun.com)
对于深耕技术的一线开发者而言,大多数都希望把技术工作进行到底,或者一直从事和技术技术相关性更高的工作。但随着年龄和经验的增长,我对管理和技术的思考越来越多、越来越深入,和大多数人一样,站在这个路口——到底继续做技术还是转型做管理——我也经历抉择,但现在回想看来,似乎在这条路上也没有选择。
by @可耐芊小仙女 2019-07-18 15:45 分享 查看详情
机器学习在高德起点抓路中的应用实践 (yq.aliyun.com)
高德地图作为中国领先的出行领域解决方案提供商,导航是其核心用户场景。路线规划作为导航的前提,是根据起点、终点以及路径策略设置,为用户量身定制出行方案。起点抓路,作为路线规划的初始必备环节,其准确率对于路线规划质量及用户体验至关重要。本文将介绍高德地图针对起点抓路准确率的提升,尤其是在引入机器学习算法模型方面所进行的一些探索与实践。
by @可耐芊小仙女 2019-07-18 15:44 分享 查看详情
阿里开源 Dragonwell JDK 重磅发布 GA 版本:生产环境可用 (yq.aliyun.com)
2019 年 3 月,Dragonwell JDK正式开源,发布预览 (Preview) 版本。近日,阿里巴巴重磅宣布 Dragonwell JDK 8.0.0-GA 正式发布,这意味着 Dragonwell JDK 已经完全具备在生产环境运行的能力。在过去三个月时间内,Dragonwell 收到了很多来自社区成员的反馈。那么,本次正式发布的 GA 版本加入了哪些新特性?对开发者而言意味着什么?
by @可耐芊小仙女 2019-07-18 15:43 分享 查看详情
Kubernetes 弹性伸缩全场景解析 (一):概念延伸与组件布局 (yq.aliyun.com)
弹性伸缩是 Kubernetes 中被大家关注的一大亮点,在讨论相关的组件和实现方案之前。首先想先给大家扩充下弹性伸缩的边界与定义,传统意义上来讲,弹性伸缩主要解决的问题是容量规划与实际负载的矛盾。
by @可耐芊小仙女 2019-07-18 15:42 分享 查看详情
使用Velero Restic快速完成云原生应用迁移至ACK集群 (yq.aliyun.com)
(1)创建GKE集群(或自建Kubernetes集群)
(2)在GKE集群上部署示例应用Jenkins Application并执行一个构建任务
(3)创建ACK集群
(4)在ACK集群中部署Minio Service用于应用迁移时数据中转服务
(5)在GKE上部署Velero并备份整个Jenkins Application
(6)把Jenkins Application使用的容器镜像同步到阿里云容器镜像仓库
(7)在ACK上创建Jenkins Application所使用的StorageClass
by @可耐芊小仙女 2019-07-18 15:41 分享 查看详情