独家 | 10个数据科学家常犯的编程错误(附解决方案) (developer.aliyun.com)

【简介】

数据科学家是“比软件工程师更擅长统计学,比统计学家更擅长软件工程的人”。许多数据科学家都具有统计学背景,但是在软件工程方面的经验甚少。我是一名资深数据科学家,在Stackoverflow的python编程方面排名前1%,并与许多(初级)数据科学家共事。以下是我经常看到的10大常见错误,本文将为你相关解决方案:

点击查看全文 >>

@可耐芊小仙女 2019-08-30 16:05分享 / 0个评论
要不要再学学下面的文章?
Android 组件化工程结构以及项目具体实施方案 (mp.weixin.qq.com)
组件化优点

1、代码解耦
2、方便多人协作开发
3、可复用性高,不同的APP可复用不同组件,提高开发效率
4、每个组件可独立运行,减少编译时间,方便开发调试
by @code小生 2020-02-03 16:49 分享 查看详情
5 种前途迷茫的编程语言 (mp.weixin.qq.com)
现在的开发人员都趋向于使用新的编程语言,那么旧的编程语言呢?它们的前途一般是这样两种:仍然可以使用,但逐渐不受大家欢迎;直接完全死去。和之前的十佳最受欢迎的编程语言相反,本文我们预测以下这几种编程语言面临着死亡威胁:
by @code小生 2020-02-03 16:43 分享 查看详情
十大编程语言,Java 未能榜首,第一你想不到 (mp.weixin.qq.com)
如果你是软件开发领域的新手,那么你会想到的第一个问题是“如何开始?”编程语言有数百种可供选择,但是你怎么发现哪个最适合你,你的兴趣和职业目标又在哪里呢?选择最佳编程语言以学习的最简单方法之一,是通过市场反响、技术趋势的发展…
by @code小生 2020-02-03 16:42 分享 查看详情
谁说编程都是英文的?看着文言文用起来多爽 (mp.weixin.qq.com)
这两天刷微博、朋友圈、公众号,发现大家都被一个文言文编程的项目圈粉了。
by @code小生 2020-02-03 16:41 分享 查看详情
CentOS7下解决SSH自动断开办法 (www.bizeway.net)
vim /etc/ssh/sshd_config
找到下面两行

ClientAliveInterval 0
ClientAliveCountMax 3
去掉注释,改成

ClientAliveInterval 30
ClientAliveCountMax 86400

这两行的意思分别是

1、客户端每隔多少秒向服务发送一个心跳数据

2、客户端多少秒没有相应,服务器自动断掉连接

重启sshd服务

service sshd restart
by @技术头条 2020-02-01 16:59 分享 查看详情
5 门前途美好的编程语言 (mp.weixin.qq.com)
前不久, Dice Insights(提供求职消息的技术职业消息服务的网站)研究了 TIOBE 和 RedMonk 的编程语言排名,以及自己网站的招聘信息数据库,得出了5 门可能走向衰落的编程语言。
by @code小生 2020-01-05 21:28 分享 查看详情
嗖的一下!只要一条命令,K8s监控数据一键写入时序数据库 (yq.aliyun.com)
这里的“快速”有多快呢?一条命令就能搞定!本文就介绍如何使用helm一键完成k8s监控数据到阿里云InfluxDB®的存储链路。对于helm的安装和使用,网上有很多资料,这里不赘述。有一点需要注意,虽然近期helm 3已经发布,但短期内不是所有的helm chart都兼容helm 3,比如社区的这个issue。本文依然使用helm 2来安装。
by @可耐芊小仙女 2019-12-30 15:50 分享 查看详情
在 Flink 算子中使用多线程如何保证不丢数据? (yq.aliyun.com)
笔者线上有一个 Flink 任务消费 Kafka 数据,将数据转换后,在 Flink 的 Sink 算子内部调用第三方 api 将数据上报到第三方的数据分析平台。这里使用批量同步 api,即:每 50 条数据请求一次第三方接口,可以通过批量 api 来提高请求效率。由于调用的外网接口,所以每次调用 api 比较耗时。假如批次大小为 50,且请求接口的平均响应时间为 50ms,使用同步 api,因此第一次请求响应以后才会发起第二次请求。
by @可耐芊小仙女 2019-12-30 15:48 分享 查看详情
日处理数据量超10亿:友信金服基于Flink构建实时用户画像系统的实践 (yq.aliyun.com)
当今生活节奏日益加快,企业面对不断增加的海量信息,其信息筛选和处理效率低下的困扰与日俱增。由于用户营销不够细化,企业 App 中许多不合时宜或不合偏好的消息推送很大程度上影响了用户体验,甚至引发了用户流失。在此背景下,友信金服公司推行全域的数据体系战略,通过打通和整合集团各个业务线数据,利用大数据、人工智能等技术构建统一的数据资产,如 ID-Mapping、用户标签等。友信金服用户画像项目正是以此为背景成立,旨在实现“数据驱动业务与运营”的集团战略。目前该系统支持日处理数据量超 10 亿,接入上百种合规数据源。
by @可耐芊小仙女 2019-12-30 15:47 分享 查看详情
可闭环、可沉淀、可持续的企业级数据赋能体系 (yq.aliyun.com)
如何让属于企业自己的不同触点的数据快速形成一个闭环,沉淀串联这些零散的数据能够快速应用去赋能业务?这涉及到四个关键词,一是业务数据化,企业所有触点是否为真,是否被打通。第二是数据资产化,能否可以像管理资产一样很好地管理数据。第三是资产应用化,企业的资产能否有效应用?如何借助数据资产赋能业务,最后是应用价值化。
by @可耐芊小仙女 2019-12-25 16:15 分享 查看详情