这款功能强大的文本识别系统开源了! (mp.weixin.qq.com)

【简介】

说到文本识别大家已经非常熟悉了,这一技术早就深深融入我们生活的方方面面,今天,猿哥要和大家分享一个可以识别文本背后含义的工具——pyWhat。

当你不知道特定一串文本代表什么时,它能快速判断它是否是 email、油管视频编号、手机号 或者是其他信息格式。你给它一个 .pcap 文件或者一段文本,它能告诉你这个文件或是文本代表了什么。

点击查看原文 >>

@code小生 2022-05-05 23:08 / 0个评论
赞过的人: @code小生
要不要再学学下面的文章?
JA 指纹识别全系讲解 (paper.seebug.org)
近期在学习 Burp Suite 的反制时发现 Wfox 前辈写的反制爬虫之 Burp Suite RCE一文,文末处介绍了使用 JA3 指纹识别 Burp Suite 流量的方法,简单研究后发现实战中易用性较强,故借此机会完整介绍一下 JA 指纹的全系列,并拓展到实践中。
by @技术头条 2024-03-21 22:56 查看详情
前端原生API实现条形码二维码的JS解析识别 (www.zhangxinxu.com)
今天才知道,原来浏览器有原生的API,可以对二维码、条形码进行解析,使用非常简单!
by @技术头条 2023-01-10 00:07 查看详情
论文分享|基于被动DNS流量分析的大规模IoT设备识别系统 (blog.nsfocus.net)
如何通过被动流量识别IoT设备?如何检测分配了IPv6地址、NAT后的IoT设备?本文介绍了IoTFinder系统有效解决上述问题。
by @技术头条 2023-01-04 23:42 查看详情
Linux QtFM 文件管理器的 3 个令人愉快的功能 (linux.cn)
QtFM 是一个简单的文件管理器,旨在通过一个快速直观的界面提供文件管理的基本功能。它适用于 Linux、BSD 和 macOS。

QtFM,顾名思义,使用 Qt(规范发音为 “cute”)编程工具包。我在 C++ 和 Python 中使用过 Qt 工具包,使用它总是一种乐趣。它是跨平台的,具有多个有用的抽象级别,因此开发人员不必直接与特定于供应商的 SDK 交互,而且它具有高度可配置性。从用户的角度来看,无论你使用的是最新的硬件还是旧计算机,这都是一种“自然”且快速的体验。
by @技术头条 2023-01-04 23:39 查看详情
海量文本中挖掘人物关联关系核心技术介绍 (www.52nlp.cn)
在大数据时代,通过对目标人物的轨迹、通信、社交、出行、网络等多模态行为进行挖掘并建立人物画像模型,并依托人物基础特征和高层特征,实例化人物画像,支撑有关部门分析人员全方位了解目标人物的行为、活动、状态、基本属性等信息,同时能够基于人物画像指导人物活动规律分析、人物能力分析、人物动向分析等应用。
by @技术头条 2022-12-24 23:30 查看详情
向量数据库入坑:传统文本检索方式的降维打击,使用 Faiss 实现向量语义检索 (soulteary.com)
在上一篇文章[《聊聊来自元宇宙大厂 Meta 的相似度检索技术 Faiss》]中,我们有聊到如何快速入门向量检索技术,借助 Meta AI(Facebook Research)出品的 faiss 实现“最基础的文本内容相似度检索工具”,初步接触到了“语义检索”这种对于传统文本检索方式具备“降维打击”的新兴技术手段。有朋友在聊天中提到,希望能够聊点更具体的,比如基于向量技术实现的语义检索到底比传统文本检索强多少,以及是否有局限性,能不能和市场上大家熟悉的技术产品进行一个简单对比。那么,本篇文章就试着从这个角度来聊聊。
by @技术头条 2022-09-12 22:39 查看详情
微信这个扰人的功能终于下线了 (mp.weixin.qq.com)
前不久,微信支付运营方财付通支付科技有线公司发出通知,为了保障用户权益,提升用户使用体验,我司将于2021年9月1日起下线支付后推荐关注公众号功能。
by @code小生 2022-08-14 09:25 查看详情
使用容器方式编译无功能限制的 Drone CI (soulteary.com)
因为默认版本的 Drone 包含构建次数限制,如果日常高频使用 Drone,不久之后,便会遇到需要“重新初始化”应用才能继续使用的问题,但其实,作为个人用户,我们其实可以不受此限制影响。所以本篇文章,就来分享下如何使用容器方式构建无使用限制的 Drone CI。
by @技术头条 2022-07-24 20:56 查看详情
洋葱式信息安全观察:浅议虚假信息识别 (www.sec-un.org)
虚假信息对经济、政治等有着重大影响,因此研究威胁信息检测的重要性也凸显出来,尤其是在这个全球“抗疫”的时期。虚假信息的检测方法和技术很多,本文仅进行了部分介绍。需要注意的是,数据集对虚假信息检测的准确性也有很大影响,需要我们重点关注。
互联网时代检测虚假信息虽然很棘手,但事实证明通过大量的知识积累,我们仍然可以在检测虚假信息的工作上取得良好效果。
by @技术头条 2022-06-19 23:19 查看详情
给 ECS 增加分组功能 (blog.codingnow.com)
目前,我们用 ECS 管理游戏引擎中的对象。当游戏场景大到一定程度,就需要有一个机制来快速筛选出需要渲染的对象子集。换句话说,如果你创建了 100K 个 Entity ,但是只有 1K 个 Entity 需要同时渲染,虽然遍历所有可渲染对象的成本最小是 O(n) ,但这个 n 是 100K 这个数量级,还是 1K 这个数量级,区别还是很大的。

我们的 ECS 系统已经支持了 tag 这个特性,可以利用 visible tag 做主 key 快速筛选可见对象。但当镜头移动时,需要重置这些 tag 又可能有性能问题。重置这些 visible tags 怎样才能避免在 100K 这个数量级的 O(n) 复杂度下工作?
by @技术头条 2022-06-19 23:07 查看详情