开放环境下的鲁棒异常检测 (blog.nsfocus.net)

【简介】

机器学习模型有效的前提假设是:训练阶段与模型部署阶段的数据分布一致,然而在真实世界中,数据往往是变化的,输入与输出之间的关联性也会发生变化,这种现象(概念漂移)会导致机器学习模型的表现下降;异常检测任务作为安全领域的一项重要任务,应用领域广泛,异常检测的模型同样会受概念漂移现象的影响。为了提高异常检测算法的鲁棒性,本文介绍一篇NDSS2023年的论文,该论文关注正常行为的变化情况,剔除过期正常行为,添加新增正常行为,从而使模型适应数据的变化,提高鲁棒性。

点击查看原文 >>

@技术头条 2023-04-09 21:42 / 原作者微博:@绿盟科技 / 0个评论
赞过的人: @IT技术博客大学习
要不要再学学下面的文章?
AWS运维部署实践--网络环境规划 (wiki.eryajf.net)
本文详述了 AWS 网络环境的规划,包括 VPC、子网、路由表的创建和管理。通过对公有、私有和内部子网的划分,以及 NAT 网关和 IGW 的配置,实现了不同网络的隔离与访问控制。同时,文章介绍了使用中转网关进行跨账号 VPC 打通的方法,为多账号和复杂网络环境提供了便捷的连接方案。这些规划为 AWS 运维部署打下了基础,有助于提升环境的安全性与可扩展性。
by @技术头条 2024-11-02 16:49 查看详情
StarRocks 开发环境搭建踩坑指北 (crossoverjie.top)
本文详细介绍了在本地搭建 StarRocks 开发环境的步骤,包括启动前端(FE)和后端(BE)的配置及调试方法。通过本地启动 FE 并使用 Docker 运行 BE,实现了本地调试和测试。作者分享了常见问题解决方案,如端口冲突和网络配置问题,为 StarRocks 开发环境搭建提供了实用指南。
by @技术头条 2024-11-02 16:42 查看详情
基于 Docker 搭建开发环境(三):链路追踪 (www.diguage.com)
本文介绍了通过 Docker 配置 OpenTelemetry 和 Jaeger,实现分布式链路追踪。详细讲解了如何使用 OpenTelemetry Agent 和 Collector 配置尾部采样策略,识别慢请求和错误。结合 Prometheus 和 Grafana,构建全面的监控和追踪系统。提供了具体的 `docker-compose.yml` 配置文件示例,适合需要全链路可观测性的分布式应用开发环境。
by @技术头条 2024-11-02 16:34 查看详情
基于 Docker 搭建开发环境(二):EFK 日志套件 (www.diguage.com)
本文介绍了如何使用 Docker 和 EFK(Elasticsearch、Fluentd、Kibana)套件构建日志管理系统,通过 Fluentd 将 NACOS 和业务日志集中发送至 Elasticsearch,方便数据分析和故障排查。文章提供了 `docker-compose.yml` 配置文件示例,解决了插件安装、权限设置和健康检查等常见问题,为构建灵活高效的日志管理系统提供了实用方法。
by @技术头条 2024-11-02 16:33 查看详情
基于 Docker 搭建开发环境(一):数据库+监控 (www.diguage.com)
本文介绍了使用 Docker 构建开发环境的步骤,涵盖 MySQL 数据库配置、Nacos 服务发现与配置管理、Prometheus 监控及 Grafana 可视化。通过 Docker Compose 结构化配置,实现了多组件集成。文章提供了详细的 `docker-compose.yml` 文件示例,并探讨了自动接入监控、应用打包等优化方向,适用于需要集中管理多项开发工具的场景。
by @技术头条 2024-11-02 16:33 查看详情
一种在 Electron 和 Web 环境下显示原生及自定义菜单的通用方法 (innei.in)
在 Electron 和 Web 环境下如何统一展示原生和自定义菜单?本文提供了通用的解决方案,通过封装组件和调用方法,解决了两种环境下菜单交互不一致的问题。如果你正在开发跨平台应用,这篇文章能为你提供实用的开发技巧!
by @技术头条 2024-09-09 23:44 查看详情
Spark向量化计算在美团生产环境的实践 (tech.meituan.com)
美团在 Spark 生产环境中引入了向量化计算,使用 Gluten 和 Velox 框架,实现了大数据任务的加速和资源优化。本文详细讲解了 Spark 向量化的原理、性能提升以及美团的实施过程和遇到的挑战,适合关注大数据优化的技术人员。
by @技术头条 2024-09-09 23:41 查看详情
在 kubernetes 环境下如何优雅扩缩容 Pulsar (crossoverjie.top)
在整个大环境的降本增效的熏陶下,我们也不得不做好应对方案。

根据对线上流量、存储以及系统资源的占用,发现我们的 Pulsar 集群有许多的冗余,所以考虑进行缩容从而减少资源浪费,最终也能省一些费用。

不过在缩容之前很有必要先聊聊扩容,Pulsar 一开始就是存算分离的架构(更多关于 Pulsar 架构的内容本文不做过多介绍,感兴趣的可以自行搜索),天然就非常适合 kubernetes 环境,也可以利用 kubernetes 的能力进行快速扩容。
by @技术头条 2024-03-31 21:12 查看详情
异常检测是什么? (ixyzero.com)
简单整理一下在和AI对话时产生的一些对「异常检测」的理解,方便后面有需要的时候参考。

异常检测是识别与预期行为不同的事件或模式的过程(因此想要识别“异常”,就需要先明确“正常”是什么样的。一种逻辑是完全按照规范来,非白即黑,但在实际情况下这种的告警量太多导致基本不可用;另一种逻辑是按照统计指标进行从大到小排序,每次只处理当前的top5,要么正常要么异常,正常的话就去优化统计策略——加白,异常的话就加大统计指标权重,进一步发现更多异常。总之就是需要在准确率和召回率之间找到平衡)。

异常检测的准确性高度依赖于数据的质量,包括数据的完整性、一致性和准确性。

对于某些领域,需要深入了解数据的业务背景和特点,以便更好地识别异常。
by @技术头条 2024-03-31 21:10 查看详情
重复视频检测的价值和常见方法 (ixyzero.com)
全网范围内的主要精品视频主要来自MCN机构,一些公司为了更快更好地去覆盖全网内容,会选择和内容代理合作,而代理手上会有很多重复版权的内容,导致重复内容出现。另外,搬运视频也会导致重复内容出现,这些重复内容会造成极差的用户体验。

再者,大量内容相似的视频对于短视频平台存储、网络带宽等资源也是一个极大的挑战,为了不必要的资源浪费,对视频内容进行去重是非常有必要的。
by @技术头条 2024-03-13 13:24 查看详情