带噪学习研究及其在内容审核业务下的工业级应用 (www.52nlp.cn)

【简介】

从人脸识别,机器翻译到智能推荐,人工智能已经深入到现代社会的方方面面。现在工业上最常见的人工智能系统,往往依赖于大量有标签的数据。通常,优质的有标签数据需要耗费大量的人力、物力。而且人工打的标签的准确度,往往随着标注任务复杂度的提高而降低。

一般的人工智能算法,都是在干净的数据集上做学习和优化。在现实中的工业应用场景中存在大量弱监督的情况,即标签缺失(无监督、半监督)、标签错误(错监督)的情况。我们在第一个章节,简单介绍一下我们vivo ai lab两篇AAAI2021关于弱监督带噪学习的工作;并在第二章介绍一下我们的工作在内容审核业务下的工业级应用。

点击查看全文 >>

@技术头条 2021-06-13 23:04分享 / 原作者微博:@52nlp / 0个评论
赞过的人: IT技术博客大学习
要不要再学学下面的文章?
图技术在美团外卖下的场景化应用及探索 (tech.meituan.com)
在外卖广告CTR预估建模中,我们依托图技术在场景化上进行了一系列探索。本文首先介绍了使用图网络技术的出发点,然后从特征层面的抽象图关系到子图扩展以及场景感知子图,逐步介绍如何使用图技术建模业务问题,并针对联合训练的线上服务细节及效果进行解释和分析,希望能给从事相关工作的同学带来一些帮助或启发。
by @技术头条 2022-09-13 23:34 分享 查看详情
TLS指纹分析研究(上) (blog.nsfocus.net)
TLS协议已经成为互联网上最流行的协议,以确保网络通信免受干扰和窃听。TLS被用于加载Firefox浏览器中超过70%的网页,随着越来越多的网站、服务和应用程序切换到TLS,其应用将继续增长。

由于网络管理人员可以识别和阻止自定义协议,很多恶意工具已经转向使用现有协议,TLS的流行为这些恶意工具提供了一个很好的选择,使用TLS协议的恶意工具可以将其流量隐藏在大量web浏览器和其他TLS的合法覆盖流量中以逃避检测。

本文分享一篇指纹数据分析的论文,通过收集和分析9个月内超过110亿个真实的TLS连接流量,从白流量的角度给出一些结论,希望给研究人员带来一些思考。
by @技术头条 2022-09-13 23:33 分享 查看详情
5 款适用于 Linux 的笔记应用 (linux.cn)
笔记是任何作者生活的一部分。我的大部分文章都是从笔记应用开始的,这对我来说通常是Joplin。有大量适用于 Linux 的笔记应用,你可能使用的不是我最喜欢的应用。最近的一篇博客文章让我想起了其中的六个,所以我整理了一份我最喜欢的列表。
by @技术头条 2022-09-02 23:05 分享 查看详情
端智能在大众点评搜索重排序的应用实践 (tech.meituan.com)
端智能,是指在移动端设备运行人工智能(AI)应用的技术。本文主要讲述大众点评搜索场景下,在端侧部署大规模深度学习模型进行搜索重排序任务的实践方案,包括端上特征工程、模型迭代思路,以及具体部署优化的过程,希望能对从事相关领域开发的同学有所帮助或者启发。
by @技术头条 2022-08-31 23:09 分享 查看详情
外卖广告大规模深度学习模型工程实践 | 美团外卖广告工程实践专题连载 (tech.meituan.com)
在外卖广告CTR场景下,深度学习模型正在从简单DNN小模型过渡到千亿参数复杂模型。基于该背景,本文将重点针对大规模深度模型在全链路带来的挑战,从在线时延、离线效率两个方面展开,阐述外卖广告在大规模深度模型上的工程实践经验,希望能为读者提供思路上的借鉴。
by @技术头条 2022-08-31 23:08 分享 查看详情
商用密码应用安全建设市场研究与思考 (www.sec-un.org)
众所周知,密码作为网络安全的核心技术和基础支撑,是构建网络信任体系的重要基石。文章简要介绍了等保建设发展、商密管理发展,重点阐述了密评工作必要性、密评建设关键点,并从用户需求、政策标准、监督监管、供应供给等四个方面对密评建设市场不同阶段进行了评估预测。
by @技术头条 2022-08-18 23:38 分享 查看详情
在笔记本上搭建高性价比的 Linux 学习环境:基础篇 (soulteary.com)
本篇文章会尽可能详细的介绍如何在相对廉价的笔记本上搭建高性价比的 Linux 学习环境,让学习和工作都轻松和高效一些。尤其是针对国内网络环境下,如何快速的完成系统的安装和基础配置。使用 Linux 的好处和必要性,我想应该不必过多赘述了,希望本文能够帮助你节约大量不必要的折腾的时间,腾出更多时间来思考、休息、以及打游戏。
by @技术头条 2022-08-18 23:21 分享 查看详情
K8S Event事件内容分析和告警 (www.ipcpu.com)
k8s的Event事件是一种资源对象,用于展示集群内发生的情况,k8s系统中的各个组件会将运行时发生的各种事件上报给apiserver 。可以通过kubectl get event 或 kubectl describe pod podName 命令显示事件,查看k8s集群中发生了哪些事件。

apiserver 会将Event事件存在etcd集群中,为避免磁盘空间被填满,故强制执行保留策略:在最后一次的事件发生后,删除1小时之前发生的事件。
by @技术头条 2022-08-18 23:12 分享 查看详情
谁动了我的奶酪,通过 git 找出内容变更历史 (droidyue.com)
在日常的开发过程中,一段代码内容被添加,删除都是稀疏平常的事情。这也就造成了我们日常开发工作中会遇到这样两个问题:
1、这个代码内容是谁添加的,是一直存在还是被修改过多次;
2、有一段代码被删除了,是谁删除的呢。
by @技术头条 2022-08-01 00:03 分享 查看详情
安卓手机APP抓包时有些应用出现了CONNECT,无法解析包内容 (www.ipcpu.com)
我们在Charles启动了一个8888端口,并将该端口配置在手机的WIFI代理服务器上, 这样就可以抓到手机产生的对外数据包。 Charles是可以抓取HTTPS数据包的,但前提是需要打开HTTPS抓包选项,并安装Charlrs的root根证书。

但是,我们全部配置完毕以后,发现手机的浏览器访问百度等网站的数据包是没有问题的,可以正确解析出来,有一部分APP软件也是可以解析的,比如物美多点,但是美团买菜就不行,拼多多也不行。
by @技术头条 2022-08-01 00:01 分享 查看详情