数据仓库项目中的数据建模和ETL日志体系 (insights.thoughtworks.cn)

【简介】

数据仓库项目跨功能需求开发不够完善,导致的各种问题,就我个人经验来说,主要体现在数据建模不够标准和ETL日志体系不够完善两个方面,本文会详细介绍一下,如何从跨功能需求的角度,构建标准的数据建模和完善的ETL日志体系。

点击查看原文 >>

@Thoughtworks 2021-01-08 10:35 / 0个评论
赞过的人: @IT技术博客大学习
要不要再学学下面的文章?
学习了解数据仓库中的分层概念 (ixyzero.com)
本文详细介绍了数据仓库的分层概念,包括数据运营层(ODS)、数据仓库层(DW)和数据应用层(APP)。其中,DW层进一步细分为数据明细层(DWD)、数据中间层(DWM)和数据服务层(DWS)。文章阐述了各层的功能和作用,并通过实例说明如何在实际业务中应用这些分层概念。该内容适合数据工程师、数据分析师、数据架构师以及对数据仓库设计和实现感兴趣的技术人员阅读。
by @技术头条 2025-01-12 12:08 查看详情
Java|如何用一个统一结构接收成员名称不固定的数据 (mazhuang.org)
文章通过企业微信接口示例,介绍用 Jackson 的 @JsonAlias 注解处理 Java 中不固定字段名的 JSON 数据,提升解析通用性。适合需统一处理多样 JSON 数据的 Java 开发者。
by @技术头条 2025-01-12 12:05 查看详情
数据的长期保存 (blog.delphij.net)
这篇文章探讨了长期数据保存的策略与实践,详细分析了存储介质的选择、数据完整性保障方法以及常见的管理问题和解决方案。作者结合实践经验,提出了一套适用于个人和企业的数据保存规划。内容适合关注数据存储、安全备份及长期保存技术的开发者、IT 管理人员,以及对数据安全感兴趣的读者,提供了具有实用价值的参考建议。
by @技术头条 2025-01-03 00:15 查看详情
ThinkPad + Redis:构建亿级数据毫秒级查询的平民方案 (soulteary.com)
如何用普通设备实现海量数据的毫秒级查询?文章分享了在 ThinkPad 上构建 Redis 系统的完整方案,详细解析了数据分片、查询优化和资源调配等关键技术,还提供了针对高效查询的实际案例。轻量化实现,高性能表现,为开发者提供了实用的参考思路,值得深入学习!
by @技术头条 2025-01-02 23:58 查看详情
使用开源软件搭建轻量的 NPM 私有仓库:Verdaccio (soulteary.com)
如何搭建轻量级 NPM 私有仓库?文章详细介绍了使用开源软件 Verdaccio 的实现方案,从环境准备到配置部署,再到权限管理和优化建议,完整覆盖每个步骤。同时分享了实际应用中的注意事项和性能调优经验,是团队项目管理和依赖控制的绝佳参考。值得尝试!
by @技术头条 2025-01-02 23:57 查看详情
AWS运维部署实践--使用sigma自建镜像仓库代替ECR (wiki.eryajf.net)
本文介绍了如何使用 `sigma` 替代 AWS 的 ECR 作为轻量级的镜像仓库解决方案。通过配置 `s3` 存储、端口监听等设置,实现了低资源占用下的高效镜像管理。文章详细提供了 `config.yaml` 文件的配置方案,以及 `sigma` 部署的具体步骤,适合在自建环境中替代 ECR 进行镜像管理。
by @技术头条 2024-11-02 17:03 查看详情
什么是 OWASP 安全项目 (dusays.com)
本文介绍了 OWASP 安全项目的核心内容,包括常见的十大安全风险,如注入攻击、身份验证失效、敏感数据暴露等。文章详细说明了每种风险的原理及其防护措施,例如注入攻击的过滤策略、跨站脚本(XSS)防护以及安全配置错误的避免方法。这些措施帮助开发者提高 Web 应用的安全性,避免常见漏洞的利用。
by @技术头条 2024-11-02 16:56 查看详情
Hive SQL如何找出连续日期数据之间的较大波动 (ixyzero.com)
本文介绍了在 Hive SQL 中如何识别连续日期数据的显著波动,适用于异常检测。使用窗口函数 `LAG` 和 `LEAD` 提取前后日期数据,通过对比当天与昨日、近几日的均值或分位数来判定异常。文中提供了查询示例,通过阈值设定(如倍数增加或p90分位数)识别异常值,帮助分析用户行为或数据波动,为风控和数据监控提供技术支持。
by @技术头条 2024-11-02 16:52 查看详情
基于 Docker 搭建开发环境(二):EFK 日志套件 (www.diguage.com)
本文介绍了如何使用 Docker 和 EFK(Elasticsearch、Fluentd、Kibana)套件构建日志管理系统,通过 Fluentd 将 NACOS 和业务日志集中发送至 Elasticsearch,方便数据分析和故障排查。文章提供了 `docker-compose.yml` 配置文件示例,解决了插件安装、权限设置和健康检查等常见问题,为构建灵活高效的日志管理系统提供了实用方法。
by @技术头条 2024-11-02 16:33 查看详情
全域用户建模在美团首页推荐的探索与实践 (tech.meituan.com)
本文详述了全域建模技术在美团首页推荐系统的发展和演进。美团首页推荐算法团队通过多阶段递进式探索验证,在召回与排序模块引入多展位、多应用渠道的多源用户交互数据,并在落地过程中解决了美团多展位、多业务、时空场景强相关性的特点导致的严重跨域信号负迁移挑战。
by @技术头条 2024-11-02 16:22 查看详情