Springer 面向公众开放数据挖掘、编程、机器学习、数学、深度学习、数据科学等 65本电子书籍 (mp.weixin.qq.com)

【简介】

施普林格(Springer)是世界著名的科技期刊、图书出版公司,这次特殊时期期间面向公众免费开放了一批社科人文,自然科学等领域的正版电子书籍(据说是400多本),towardsdatascience 上有学者将其中65本机器学习和数据科学以及统计相关的免费教材下载链接整理了出来,我试了一下,无需注册,可以直接下载相关的PDF书籍,相当方便:Springer has released 65 Machine Learning and Data books for free(https://towardsdatascience.com/springer-has-released-65-machine-learning-and-data-books-for-free-961f8181f189)。

点击查看全文 >>

@code小生 2020-07-21 23:38分享 / 0个评论
赞过的人: code小生
要不要再学学下面的文章?
如何设计数据可视化平台 (insights.thoughtworks.cn)
当数据平台逐渐变成每个企业发展所依赖的重要因素,设计出好用的数据可视化平台便是体验设计师的职责,文章会从设计的角度回答三个问题:什么是数据可视化?为什么需要可视化设计?以及该从何处着手设计一个数据可视化平台?
by @Thoughtworks 4小时前 分享 查看详情
业务数据治理体系化思考与实践 (tech.meituan.com)
美团住宿数据治理团队从事数据治理工作多年,从最初的被动、单点治理,发展到后来的主动、专项治理,再发展到现在的体系化、自动化治理。一路走来,他们不断进行积累和沉淀,也在持续思考与实践。目前该团队取得了一些阶段性的成果,并得到美团多个业务线的认可和肯定。过程的经验与教训,希望能和大家分享,也希望能给从事数据治理工作的同学带来一些新思路。
by @技术头条 2022-06-19 23:26 分享 查看详情
绿盟数据安全整体建设思路 (blog.nsfocus.net)
绿盟科技从数据安全建设顶层设计出发,提出“一个中心,四个领域,五个阶段”的数据安全体系建设思路。以数据安全防护为中心,在组织建设、制度流程,技术工具和人员能力4个领域同时开展建设工作,通过“知、识、控、察、行”五个步骤进行数据安全落地建设。
by @技术头条 2022-06-19 23:23 分享 查看详情
蒙皮数据的压缩 (blog.codingnow.com)
传统的蒙皮数据需要在模型顶点上存两组数据,其一为该顶点受哪些骨头的影响,其二为受这些骨头影响的权重。因为 GPU 的对齐影响,通常游戏中会将同一顶点受影响的骨头数量上限设为 4 。如果不做任何优化,骨头总数在 256 以下时,每个顶点需要 4 个字节保存骨头编号,再用 4 个 float 表示分别的权重。

因为权重之和总是为 1 ,所以,只用 3 个 float 也是可以的(第四个权重通过简单的计算就可以得到)。

因为权重总是 0-1 之间的数字,所以 32bits float 的精度远超所需,我们也并不需要浮点数。所以用 16bits [0,65535) 甚至 8bits (0,255] 来表示 0-1 的权重也够了。

所以,蒙皮一般至少占用 64bit 的定点数据 (4+4 bytes) 。

如果想进一步压缩,就需要一些复杂的技巧了。
by @技术头条 2022-06-19 22:42 分享 查看详情
正确处理全球五大互联网注册机构的 IP 数据 (soulteary.com)
如果我们不需要精准判断服务请求来源和用户 IP 归属地,使用全球五大 RIR 机构每日更新的 IP 分配数据,相比较使用商业 IP 数据库而言,会是一个低成本的方案(免费)。本文将聊聊如何正确对 APNIC、ARIN、RIPE NCC、LACNIC 和 AFRINIC 这五个全球顶级互联网注册机构(RIR)的 IP 注册数据进行处理。
by @技术头条 2022-06-19 19:25 分享 查看详情
机器学习不是你想用,想用就能用 (insights.thoughtworks.cn)
机器学习的目的:更精准地替代经验以及更大面积复用人工。在这个文章中,要回答什么场景下该用机器学习,同时我们也需要回答一个更为本质的问题,什么是机器学习?
by @Thoughtworks 2022-06-10 10:21 分享 查看详情
4个Python编程游戏网站,玩嗨了~ (mp.weixin.qq.com)
学习编程虽然对有些人来说是件乐事,但是对大多数人来说仍然是一件比较枯燥困难的事情。当然,面临这样困惑的人并不是你一个。于是就出现了许多通过游戏来教你编程的平台,寓教于乐,让你快乐学习编程。
by @code小生 2022-05-30 21:09 分享 查看详情
一定用得到的C++资源,限时开放收藏! (mp.weixin.qq.com)
提到C/C++语言很多初学者都觉得,学到中间就进行不下去了,但是如果你最难啃的那几块硬骨头拿下,一切都会顺畅许多,而且C++诞生很久了,因此有大量可以免费阅读编程文档。近日,在Quora上发现一份免费的C ++资料列表,涉及到C++的各方各面。如果你对C++感兴趣,不妨继续往下看看看这些资料是不是你正需要的。
by @code小生 2022-05-30 21:06 分享 查看详情
4 个用来擦除数据的 Linux 工具 (linux.cn)
保持数据安全的最好方法之一是只向加密的硬盘驱动器写入数据。在一个标准的硬盘上,只要把硬盘挂载就可以查看数据,就像 U 盘一样,甚至可以用 Scalpel 和 Testdisk 等工具显示和恢复已删除的数据。但是在一个加密的驱动器上,如果没有解密密钥(通常是你在挂载驱动器时输入的密码),数据是无法被读取的。
加密可以在你安装操作系统时建立,有些操作系统甚至可以在安装后的任何时候激活加密功能。
但是,当你卖掉一台电脑或更换一个一开始就没有被加密的驱动器时,你该怎么办呢?
与从一开始就加密你的数据相比,最好的办法是在你用完硬盘后删除数据。
by @技术头条 2022-05-23 00:14 分享 查看详情
在 Apache Cassandra 中定义和优化数据分区 (linux.cn)
Apache Cassandra 是一个数据库,但又不是一个简单的数据库;它是一个复制数据库,专为可扩展性、高可用性、低延迟和良好性能而设计调整。Cassandra 可以帮你的数据在区域性中断、硬件故障时,以及很多管理员认为数据量过多的情况下幸免于难。

全面掌握数据分区知识,你就能让 Cassandra 集群实现良好的设计、极高的性能和可扩展性。在本文中,我将探究如何定义分区,Cassandra 如何使用这些分区,以及一些你应该了解的最佳实践方案和已知问题。
by @技术头条 2022-05-23 00:14 分享 查看详情