yq yq.aliyun.com / 2018-04-17 15:12 / by @幸运的猫耳

容器开启数据服务之旅系列（二）：Kubernetes如何助力Spark大数据分析

容器开启数据服务之旅系列（二）：Kubernetes如何助力Spark大数据分析（二）：Kubernetes如何助力Spark大数据分析概述本文为大家介绍一种容器化的数据服务Spark + OSS on ACK，允许Spark分布式计算节点对阿里云OSS对象存储的直接访问。

ix ixyzero.com / 2025-01-12 12:08

学习了解数据仓库中的分层概念

本文详细介绍了数据仓库的分层概念，包括数据运营层（ODS）、数据仓库层（DW）和数据应用层（APP）。其中，DW层进一步细分为数据明细层（DWD）、数据中间层（DWM）和数据服务层（DWS）。文章阐述了各层的功能和作用，并通过实例说明如何在实际业务中应用这些分层概念。该内容适合数据工程师、数据分析师、数据架构师以及对数据仓库设计和实现感兴趣的技术人员阅读。

查看详情

无图

ma mazhuang.org / 2025-01-12 12:05

Java｜如何用一个统一结构接收成员名称不固定的数据

文章通过企业微信接口示例，介绍用 Jackson 的 @JsonAlias 注解处理 Java 中不固定字段名的 JSON 数据，提升解析通用性。适合需统一处理多样 JSON 数据的 Java 开发者。

查看详情

无图

bl blog.delphij.net / 2025-01-03 00:15

数据的长期保存

这篇文章探讨了长期数据保存的策略与实践，详细分析了存储介质的选择、数据完整性保障方法以及常见的管理问题和解决方案。作者结合实践经验，提出了一套适用于个人和企业的数据保存规划。内容适合关注数据存储、安全备份及长期保存技术的开发者、IT 管理人员，以及对数据安全感兴趣的读者，提供了具有实用价值的参考建议。

查看详情

无图

so soulteary.com / 2025-01-02 23:58

ThinkPad + Redis：构建亿级数据毫秒级查询的平民方案

如何用普通设备实现海量数据的毫秒级查询？文章分享了在 ThinkPad 上构建 Redis 系统的完整方案，详细解析了数据分片、查询优化和资源调配等关键技术，还提供了针对高效查询的实际案例。轻量化实现，高性能表现，为开发者提供了实用的参考思路，值得深入学习！

查看详情

无图

ix ixyzero.com / 2024-11-02 16:52

Hive SQL如何找出连续日期数据之间的较大波动

本文介绍了在 Hive SQL 中如何识别连续日期数据的显著波动，适用于异常检测。使用窗口函数 `LAG` 和 `LEAD` 提取前后日期数据，通过对比当天与昨日、近几日的均值或分位数来判定异常。文中提供了查询示例，通过阈值设定（如倍数增加或p90分位数）识别异常值，帮助分析用户行为或数据波动，为风控和数据监控提供技术支持。

查看详情

无图

bl blog.yuanpei.me / 2024-11-02 16:40

容器技术驱动下的代码沙箱实践与思考

本文探讨了基于容器技术的代码沙箱应用，旨在隔离代码执行环境，提升安全性和稳定性。通过 Docker 容器创建语言镜像，支持多语言代码执行。文章介绍了使用 Jupyter 实现代码可视化，并借助 nbformat 和 nbconvert 管理和执行 Jupyter 笔记本，增强代码展示效果。此方案不仅提高了开发灵活性，还便于在 AI 编程中实时展示和分析结果。

查看详情

无图

te tech.meituan.com / 2024-11-02 16:22

大前端：如何突破动态化容器的天花板？

长久以来，容器要实现动态化和双端复用，难免要牺牲掉一些性能。有没有办法让动态化容器的性能尽可能接近原生？美团金服大前端团队给出了一种解决方案，尝试突破动态化容器的天花板。

查看详情

无图

te tech.meituan.com / 2024-11-02 16:18

新一代实验分析引擎：驱动履约平台的数据决策

本文介绍了美团履约技术平台的新一代实验分析引擎，该引擎对核心实验框架进行了标准化，并融合了众多先进解决方案，有效解决小样本挑战。同时，提供了多样化的溢出效应应对策略，并针对不同业务场景提供了精准的方差和P值计算方法，以规避统计误差。希望对大家有所帮助或启发。

查看详情

无图

te tech.meituan.com / 2024-09-09 23:41

Spark向量化计算在美团生产环境的实践

美团在 Spark 生产环境中引入了向量化计算，使用 Gluten 和 Velox 框架，实现了大数据任务的加速和资源优化。本文详细讲解了 Spark 向量化的原理、性能提升以及美团的实施过程和遇到的挑战，适合关注大数据优化的技术人员。

查看详情

无图

jo jokerbai.com / 2024-05-05 23:22

Kubernetes中的事件收集以及监控告警

随着微服务以及云原生的发展，越来越多的企业都将业务部署运行到Kubernetes中，主要是想依托Kubernetes的可扩展、可伸缩、自动化以及高稳定性来保障业务的稳定性。
然而，Kubernetes本身是一个复杂的管理系统，它既然是作为企业业务的基础设施，其本身以及运行在集群内部的业务系统对于企业来说都变得非常重要。

查看详情

无图

容器开启数据服务之旅系列（二）：Kubernetes如何助力Spark大数据分析

发表评论

相关分享