yq yq.aliyun.com / 2019-04-09 15:57 / by @可耐芊小仙女

通过DataWorks数据集成归档日志服务数据至MaxCompute进行离线分析

消费点位也可以按照自定义设置5分钟调度一次，从00：00到23:59，startTime=系统前分钟到[yyyymmddhh24miss-5/24/60]系统前5分钟时间（注意与上图消费数据定位不同），那么应该配置为ds=[yyyymmdd-5/24/60]，hr=[hh24-5/24/60]，min=[mi-5/24/60]。

ix ixyzero.com / 2025-01-12 12:08

学习了解数据仓库中的分层概念

本文详细介绍了数据仓库的分层概念，包括数据运营层（ODS）、数据仓库层（DW）和数据应用层（APP）。其中，DW层进一步细分为数据明细层（DWD）、数据中间层（DWM）和数据服务层（DWS）。文章阐述了各层的功能和作用，并通过实例说明如何在实际业务中应用这些分层概念。该内容适合数据工程师、数据分析师、数据架构师以及对数据仓库设计和实现感兴趣的技术人员阅读。

查看详情

无图

ma mazhuang.org / 2025-01-12 12:05

Java｜如何用一个统一结构接收成员名称不固定的数据

文章通过企业微信接口示例，介绍用 Jackson 的 @JsonAlias 注解处理 Java 中不固定字段名的 JSON 数据，提升解析通用性。适合需统一处理多样 JSON 数据的 Java 开发者。

查看详情

无图

bl blog.delphij.net / 2025-01-03 00:15

数据的长期保存

这篇文章探讨了长期数据保存的策略与实践，详细分析了存储介质的选择、数据完整性保障方法以及常见的管理问题和解决方案。作者结合实践经验，提出了一套适用于个人和企业的数据保存规划。内容适合关注数据存储、安全备份及长期保存技术的开发者、IT 管理人员，以及对数据安全感兴趣的读者，提供了具有实用价值的参考建议。

查看详情

无图

so soulteary.com / 2025-01-02 23:58

ThinkPad + Redis：构建亿级数据毫秒级查询的平民方案

如何用普通设备实现海量数据的毫秒级查询？文章分享了在 ThinkPad 上构建 Redis 系统的完整方案，详细解析了数据分片、查询优化和资源调配等关键技术，还提供了针对高效查询的实际案例。轻量化实现，高性能表现，为开发者提供了实用的参考思路，值得深入学习！

查看详情

无图

ix ixyzero.com / 2024-11-02 16:52

Hive SQL如何找出连续日期数据之间的较大波动

本文介绍了在 Hive SQL 中如何识别连续日期数据的显著波动，适用于异常检测。使用窗口函数 `LAG` 和 `LEAD` 提取前后日期数据，通过对比当天与昨日、近几日的均值或分位数来判定异常。文中提供了查询示例，通过阈值设定（如倍数增加或p90分位数）识别异常值，帮助分析用户行为或数据波动，为风控和数据监控提供技术支持。

查看详情

无图

di www.diguage.com / 2024-11-02 16:33

基于 Docker 搭建开发环境（二）：EFK 日志套件

本文介绍了如何使用 Docker 和 EFK（Elasticsearch、Fluentd、Kibana）套件构建日志管理系统，通过 Fluentd 将 NACOS 和业务日志集中发送至 Elasticsearch，方便数据分析和故障排查。文章提供了 `docker-compose.yml` 配置文件示例，解决了插件安装、权限设置和健康检查等常见问题，为构建灵活高效的日志管理系统提供了实用方法。

查看详情

无图

te tech.meituan.com / 2024-11-02 16:18

新一代实验分析引擎：驱动履约平台的数据决策

本文介绍了美团履约技术平台的新一代实验分析引擎，该引擎对核心实验框架进行了标准化，并融合了众多先进解决方案，有效解决小样本挑战。同时，提供了多样化的溢出效应应对策略，并针对不同业务场景提供了精准的方差和P值计算方法，以规避统计误差。希望对大家有所帮助或启发。

查看详情

无图

cr crossoverjie.top / 2024-11-02 16:15

日志与追踪的完美融合：OpenTelemetry MDC 实践指南

本文介绍了如何在 OpenTelemetry 中使用 MDC（映射诊断上下文）实现日志与链路追踪的集成，帮助开发者快速定位问题。通过将 `trace_id` 等信息写入日志 MDC，实现日志和分布式追踪系统的无缝对接。在 Java 中结合 Logback 或 Log4j 并借助 OpenTelemetry agent，可以自动生成包含 MDC 的日志，便于多线程环境中的问题排查。

查看详情

无图

ix ixyzero.com / 2024-03-12 22:56

简单来说，就是数据安全左移，在每一个阶段都做卡点和检测，提高入侵/获取敏感数据的成本，减少后续阶段的日志告警量，提高告警检测准确率，利用自动化工具/平台提高响应的速度和效率。
未授权不可访问；有账号凭证要检测是否正常（常用设备、常用网络、常见时间、常见操作行为、……）；有账号也仅知其所需最小权限；梳理出的高权限账号的敏感操作进行重点关注。
数据尽量不落地，大部分操作在线即可完成，系统埋点要全面和准确；对于数据下载和外发格外关注，下载设备的DLP的健康状态和策略的有效性需要及时检查。

查看详情

无图

pa paper.seebug.org / 2024-03-12 22:49

通过漫游交换进行隐蔽访问的新型后门 GTPDOOR 分析

GTPDOOR 是一种基于 Linux 的恶意软件，旨在部署在邻近 GRX（GPRS 交换网络）的电信网络系统中，具有通过GTP-C（GPRS 隧道协议- 控制平面）信令消息传递 C2 流量的功能。这使得 C2 流量能够与正常流量混合，并重新利用可能对 GRX 网络开放且暴露的已允许端口。

查看详情

无图

通过DataWorks数据集成归档日志服务数据至MaxCompute进行离线分析

发表评论

相关分享