向量数据库入坑:传统文本检索方式的降维打击,使用 Faiss 实现向量语义检索 (soulteary.com)
在上一篇文章[《聊聊来自元宇宙大厂 Meta 的相似度检索技术 Faiss》]中,我们有聊到如何快速入门向量检索技术,借助 Meta AI(Facebook Research)出品的 faiss 实现“最基础的文本内容相似度检索工具”,初步接触到了“语义检索”这种对于传统文本检索方式具备“降维打击”的新兴技术手段。有朋友在聊天中提到,希望能够聊点更具体的,比如基于向量技术实现的语义检索到底比传统文本检索强多少,以及是否有局限性,能不能和市场上大家熟悉的技术产品进行一个简单对比。那么,本篇文章就试着从这个角度来聊聊。
by @技术头条 2022-09-12 22:39 查看详情
全球IPv4 AS拓扑测绘初探 (blog.nsfocus.net)
网络拓扑测绘是网络空间测绘中的关键一环,主要体现了网络空间中资源之间的物理和逻辑通联关系。根据OSI七层网络体系结构分,有物理层的光纤、电缆拓扑,数据链路层的二层交换机拓扑,网络层的路由器拓扑,应用层的服务拓扑等等。本文主要考虑网络层的AS(Autonomous System,自治域)级拓扑,面向全球IPv4地址空间自治域编号,研究其注册、分配、使用现状,为后续重点关注地区网络拓扑测绘提供数据和技术支撑。
by @技术头条 2022-09-12 22:39 查看详情
与日俱进,在 Go 1.20 中这种高效转换的方式又变了 (colobu.com)
在 Go 1.19 的开发中, string.SliceHeader和string.StringHeader经历了一个生死存亡的争斗,这两个类型一度被标记为弃用(deprecated),但是这两个类型经常用在 slice of byte 和 string 高效互转的场景中,如果被标记为弃用,但是目前还没有可替代的方法,所以这两个类型又把弃用标记去掉了,如无意外,它们也会在 Go 1.20 再次被标记为弃用。
by @技术头条 2022-09-12 22:38 查看详情
10 大可以摧毁你的 Linux 的命令 (linux.cn)
什么是最危险的 Linux 命令?

有人无数次问我这个问题,我一直避免回答,因为没有一个明确的危险的 Linux 命令清单。

你拥有的工具使你能够控制和修改你的操作系统的每一个方面。我不是想吓唬你,但如果你不熟悉这些命令和工具,你可以很容易地把你的系统摧毁。
by @技术头条 2022-09-12 22:37 查看详情
如何在笔记本电脑合盖时不挂起 Ubuntu (linux.cn)
如果你在笔记本电脑上使用 Ubuntu,你可能已经注意到当你合上盖子时系统处于挂起状态。

这是预期的行为。它可以节省电池和你的工作。你掀开盖子,系统唤醒,你可以登录并继续工作。

这一切听起来都不错,除非你使用多显示器设置。像我这样的一些人更喜欢关闭笔记本电脑,只使用外接显示器。

但是,如果关闭笔记本电脑盖会挂起系统,那么会产生问题。

让我告诉你如何改变这种行为。
by @技术头条 2022-09-12 22:36 查看详情
向量数据库入坑指南:聊聊来自元宇宙大厂 Meta 的相似度检索技术 Faiss (soulteary.com)
我们日常使用的各种 APP 中的许多功能,都离不开相似度检索技术。比如一个接一个的新闻和视频推荐、各种常见的对话机器人、保护我们日常账号安全的风控系统、能够用哼唱来找到歌曲的听歌识曲,甚至就连外卖配送的最佳路线选择也都有着它的身影。相信很多同学是第一次听说它,或者只知道它的大名,而不知该如何使用它。本篇文章,我们就来聊聊 faiss,分享这个“黑科技”是如何发挥神奇的“魔法”的。
by @技术头条 2022-09-03 23:31 查看详情
啊哈,一道有趣的Go并发题 (colobu.com)
今天一位同学给我出了一道并发题,作为在极客时间开了《GO并发编程实战课》的作者,居然一时间没有回答上来,惭愧啊,所以晚上专门研究了一下题目,给出几个实现方案供探讨。
by @技术头条 2022-09-03 23:26 查看详情
Replication(下):事务,一致性与共识 (tech.meituan.com)
本文主要介绍事务、一致性以及共识,首先会介绍它们怎么在分布式系统中起作用,然后将尝试描述它们之间的内在联系,让大家了解,在设计分布式系统时也是有一定的“套路”可寻。最后将介绍业界验证分布式算法的一些工具和框架。希望能够对大家有所帮助或者启发。
by @技术头条 2022-09-03 23:25 查看详情
Replication(上):常见复制模型&分布式系统挑战 (tech.meituan.com)
分布式系统设计是一项十分复杂且具有挑战性的事情。其中,数据复制与一致性更是其中十分重要的一环。数据复制领域概念庞杂、理论性强,如果对应的算法没有理论验证大概率会出错。如果在设计过程中,不了解对应理论所解决的问题以及不同理论之间的联系,势必无法设计出一个合理的分布式系统。
by @技术头条 2022-09-03 23:25 查看详情
路网中路径的储存 (blog.codingnow.com)
我们正在制作的游戏中,交通和物流是基于公路网的。公路网其实是以路口为顶点,路为边构成的(无向)图。因为我们有大量的车辆行驶在这个路网中,所以,我需要一个空间高效的方法储存这些车辆的路径。
by @技术头条 2022-09-03 23:25 查看详情
5 款适用于 Linux 的笔记应用 (linux.cn)
笔记是任何作者生活的一部分。我的大部分文章都是从笔记应用开始的,这对我来说通常是Joplin。有大量适用于 Linux 的笔记应用,你可能使用的不是我最喜欢的应用。最近的一篇博客文章让我想起了其中的六个,所以我整理了一份我最喜欢的列表。
by @技术头条 2022-09-02 23:05 查看详情
美团搜索粗排优化的探索与实践 (tech.meituan.com)
粗排是工业界搜广推系统的重要模块。美团搜索排序团队在优化粗排效果的探索和实践中,基于业务实际场景,从精排联动和效果性能联合优化两方面优化粗排,提升了粗排的效果。本文介绍了美团搜索粗排的迭代路线、基于知识蒸馏和自动神经网络选择的粗排优化工作,希望为从事相关工作的同学带来一些启发或者帮助。
by @技术头条 2022-09-02 22:59 查看详情
美团搜索粗排优化的探索与实践 (tech.meituan.com)
粗排是工业界搜广推系统的重要模块。美团搜索排序团队在优化粗排效果的探索和实践中,基于业务实际场景,从精排联动和效果性能联合优化两方面优化粗排,提升了粗排的效果。本文介绍了美团搜索粗排的迭代路线、基于知识蒸馏和自动神经网络选择的粗排优化工作,希望为从事相关工作的同学带来一些启发或者帮助。
by @技术头条 2022-09-02 22:59 查看详情
Flutter动态化实践 (tech.meituan.com)
本文从 Flutter 的特点讲起, 阐述了美团外卖团队在整个 Flutter 动态化上探索的心路历程,还有设计理念、核心原理以及业务应用的经验。本文的视角也不局限于框架本身,更多思考了在解决问题的过程中技术团队需要做的事情,希望能对大家有所启发和帮助。
by @技术头条 2022-08-31 23:30 查看详情
Linux提权手法实战 (blog.nsfocus.net)
Linux对不同角色的用户进行了权限管控,提权意味着用户获得不允许他使用的权限。 比如可以通过提权将用户的角色由普通用户变为管理员,从而获得更高的访问权限,执行相应的高危操作。提权是渗透流程中非常重要的一环,很大程度上决定本次渗透的最终成果。Linux提权的常见手法有以下几种:内核漏洞提权、定时任务提权、SUID提权、SUDO滥用提权、NFS提权、Docker组提权,下面逐一介绍。
by @技术头条 2022-08-31 23:28 查看详情
DevOps风险测绘之代码篇 (blog.nsfocus.net)
代码安全一直是网络信息安全中至关重要的一环;对于一个网络系统来说,代码就是其生命的化身,无论是前期的研发还是后期的运营,代码安全对于任何一个组织机构而言都有着举足轻重的意义。基于网络空间测绘技术,我们对自建代码仓库GitLab、Gogs、Gitea、Gitblit、Gitbucket等进行了研究。
by @技术头条 2022-08-31 23:27 查看详情
Kafka在美团数据平台的实践 (tech.meituan.com)
Kafka在美团数据平台承担着统一的数据缓存和分发的角色,随着数据量的增长,集群规模的扩大,Kafka面临的挑战也愈发严峻。本文分享了美团Kafka面临的实际挑战,以及美团针对性的一些优化工作,希望能给从事相关开发工作的同学带来帮助或启发。
by @技术头条 2022-08-31 23:25 查看详情
JS replaceAll 和 matchAll 使用指南不指北 (www.zhangxinxu.com)

介绍两个比较新的都带有 all 字样的 JS API,replaceAll 和 matchAll,增强了传统的 replace 和 match 方法的能力,看看自己项目中是不是可以用用。
by @技术头条 2022-08-31 23:25 查看详情
借助 Docker 来搭 Nginx 的积木:快速实现高性能二维码服务 (soulteary.com)
本篇文章,依旧是聊聊如何 “使用 Nginx 和 Docker 来偷懒”。以生成我们常见的二维码为例,聊聊 Nginx 在日常业务中,除了做接入层业务之外的应用。本篇文章中,我们将侧重聊聊更通用的,在容器场景下借助 Docker 的预构建、多阶段构建等能力,来帮助 Nginx 进行“搭积木”的玩法,快速实现某个传统业务。
by @技术头条 2022-08-31 23:21 查看详情
如何在 Linux 上使用 Bash 自动化任务 (linux.cn)
通过 Bash 命令行进行自动化任务是极好的一种方式。不论你使用运行在服务器上的 Linux 进行管理日志文件或其他文件,还是你在个人电脑上整理文件以使桌面保持整洁,使用 Bash 的自动化功能会使你的工作变得更轻松。
by @技术头条 2022-08-31 23:20 查看详情