de developer.aliyun.com / 2020-11-09 12:53 / by @可耐芊小仙女

基于 Flink SQL CDC 的实时数据同步方案

Flink 1.11 引入了 Flink SQL CDC，CDC 能给我们数据和业务间能带来什么变化？本文由 Apache Flink PMC，阿里巴巴技术专家伍翀 (云邪）分享，内容将从传统的数据同步方案，基于 Flink CDC 同步的解决方案以及更多的应用场景和 CDC 未来开发规划等方面进行介绍和演示。

赞过的人

@技术头条

ix ixyzero.com / 2025-01-12 12:08

学习了解数据仓库中的分层概念

本文详细介绍了数据仓库的分层概念，包括数据运营层（ODS）、数据仓库层（DW）和数据应用层（APP）。其中，DW层进一步细分为数据明细层（DWD）、数据中间层（DWM）和数据服务层（DWS）。文章阐述了各层的功能和作用，并通过实例说明如何在实际业务中应用这些分层概念。该内容适合数据工程师、数据分析师、数据架构师以及对数据仓库设计和实现感兴趣的技术人员阅读。

查看详情

无图

ix ixyzero.com / 2025-01-12 12:08

本文讨论了在 Hive SQL 中处理单引号和双引号的技巧。作者建议：
1、显示包含单引号的字符串：使用双引号括起来，因在单引号内直接显示单引号的方法尚未找到。
2、显示包含双引号的字符串：使用单引号括起来，或对内部的双引号进行转义。
3、减少麻烦：尽量使用双引号括起字符串，因为对双引号的转义更方便有效。
作者还提供了测试 SQL 示例，展示了不同情况下单双引号的使用效果。该内容适合从事 Hive SQL 开发的工程师、数据分析师以及需要处理 Hive SQL 字符串转义问题的技术人员阅读。

查看详情

无图

ma mazhuang.org / 2025-01-12 12:05

Java｜如何用一个统一结构接收成员名称不固定的数据

文章通过企业微信接口示例，介绍用 Jackson 的 @JsonAlias 注解处理 Java 中不固定字段名的 JSON 数据，提升解析通用性。适合需统一处理多样 JSON 数据的 Java 开发者。

查看详情

无图

bl blog.delphij.net / 2025-01-03 00:15

数据的长期保存

这篇文章探讨了长期数据保存的策略与实践，详细分析了存储介质的选择、数据完整性保障方法以及常见的管理问题和解决方案。作者结合实践经验，提出了一套适用于个人和企业的数据保存规划。内容适合关注数据存储、安全备份及长期保存技术的开发者、IT 管理人员，以及对数据安全感兴趣的读者，提供了具有实用价值的参考建议。

查看详情

无图

so soulteary.com / 2025-01-02 23:58

ThinkPad + Redis：构建亿级数据毫秒级查询的平民方案

如何用普通设备实现海量数据的毫秒级查询？文章分享了在 ThinkPad 上构建 Redis 系统的完整方案，详细解析了数据分片、查询优化和资源调配等关键技术，还提供了针对高效查询的实际案例。轻量化实现，高性能表现，为开发者提供了实用的参考思路，值得深入学习！

查看详情

无图

ix ixyzero.com / 2024-11-02 17:02

从Hive SQL的一个正则表达式说起

本文讨论了在 Hive SQL 中使用正则表达式筛选特定 IP 范围（172.16.0.0 到 172.31.255.255）的实现方法，详解了 `[16-31]` 范围的表达方式，给出了完整的正则表达式方案，帮助精准匹配指定的 IPv4 地址范围。

查看详情

无图

ix ixyzero.com / 2024-11-02 16:52

Hive SQL如何找出连续日期数据之间的较大波动

本文介绍了在 Hive SQL 中如何识别连续日期数据的显著波动，适用于异常检测。使用窗口函数 `LAG` 和 `LEAD` 提取前后日期数据，通过对比当天与昨日、近几日的均值或分位数来判定异常。文中提供了查询示例，通过阈值设定（如倍数增加或p90分位数）识别异常值，帮助分析用户行为或数据波动，为风控和数据监控提供技术支持。

查看详情

无图

ix ixyzero.com / 2024-11-02 16:50

Hive SQL如何找出最大的连续操作天数

本文探讨了在 Hive SQL 中计算用户的最大连续操作天数的实现方法。通过窗口函数和日期差计算，文章详细展示了如何找出连续在线的天数，适用于数据分析中的活跃用户筛选。同时还介绍了结合分位数和平均值分析操作频率的查询技巧。

查看详情

无图

ix ixyzero.com / 2024-11-02 16:50

Hive SQL 中的分号、下划线等tips整理

本文整理了 Hive SQL 中的一些实用技巧，包括使用 `\073` 替代分号进行字符串分割、通过转义实现下划线匹配、布尔类型的条件比较，以及在复杂类型字段（如数组或映射）中插入空值的操作方法。这些技巧可以帮助开发者在处理特殊符号和复杂数据类型时，避免语法错误和查询结果不准确的问题，为 Hive SQL 查询优化提供了实用参考。

查看详情

无图

bl blog.yuanpei.me / 2024-11-02 16:39

温故而知新：后端通用查询方案的再思考

本文探讨了后端通用查询方案的设计，通过 `Gridify` 库启发，提出基于泛型和接口的查询模型，优化分页和过滤功能。实现细节包括 `QueryParameter` 类和 `IQueryableFilter` 接口的使用，自定义模型绑定方式，使查询参数更灵活，支持多种前后端兼容格式。文章强调开发中平衡灵活性与规范性，并认为在 AI 辅助编程背景下，程序员应专注于复杂问题解决和生产关系的改善。

查看详情

无图

基于 Flink SQL CDC 的实时数据同步方案

赞过的人

发表评论

相关分享