美团搜索中NER技术的探索与实践 (tech.meituan.com)

【简介】

命名实体识别(Named Entity Recognition,简称NER),又称作“专名识别”,是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。NER是信息提取、问答系统、句法分析、机器翻译、面向Semantic Web的元数据标注等应用领域的重要基础工具,在自然语言处理技术走向实用化的过程中占有重要的地位。在美团搜索场景下,NER是深度查询理解(Deep Query Understanding,简称 DQU)的底层基础信号,主要应用于搜索召回、用户意图识别、实体链接等环节,NER信号的质量,直接影响到用户的搜索体验。

下面将简述一下实体识别在搜索召回中的应用。在O2O搜索中,对商家POI的描述是商家名称、地址、品类等多个互相之间相关性并不高的文本域。如果对O2O搜索引擎也采用全部文本域命中求交的方式,就可能会产生大量的误召回。我们的解决方法如下图1所示,让特定的查询只在特定的文本域做倒排检索,我们称之为“结构化召回”,可保证召回商家的强相关性。举例来说,对于“海底捞”这样的请求,有些商家地址会描述为“海底捞附近几百米”,若采用全文本域检索这些商家就会被召回,显然这并不是用户想要的。而结构化召回基于NER将“海底捞”识别为商家,然后只在商家名相关文本域检索,从而只召回海底捞品牌商家,精准地满足了用户需求。

点击查看原文 >>

@技术头条 2021-05-28 22:52 / 0个评论
赞过的人: @IT技术博客大学习
要不要再学学下面的文章?
Go协程池深度解析:原理、实现与最佳实践 (www.zhengwenfeng.com)
文章系统解析 Go 协程池的实现原理和实践,包括为何需要协程池、基本实现方式、协程数设置依据及性能对比测试。示例代码演示如何手动构建协程池,并推荐三种高性能第三方库(如 ants、tunny)。适合进行高并发控制和资源管理优化的场景。
by @技术头条 2025-11-12 00:32 查看详情
如何选择可以搞钱的技术栈 (crossoverjie.top)
文章探讨了如何选择有助于提升收入的技术栈。作者建议关注数据库、云原生技术(如 Kubernetes)、消息队列(如 Pulsar)等在企业中需求广泛且付费意愿强的领域。深入掌握这些技术有助于在求职和职业发展中获得更高回报。适合后端开发者、架构师以及希望提升自身市场价值的技术从业者阅读。
by @技术头条 2025-01-12 12:04 查看详情
突破内存限制:Mac Mini M2 服务器化实践指南 (soulteary.com)
文章介绍了如何将 Mac Mini M2 转变为高性价比的服务器,突破内存限制。作者通过安装 Ubuntu 系统,利用持久化 KV 系统替代传统 Redis,优化内存与硬盘的数据交换,提升性能。适合对家庭服务器搭建、Mac Mini 改造、Linux 系统部署感兴趣的技术爱好者和开发者。
by @技术头条 2025-01-12 12:02 查看详情
CSPJ 教学思考:宽度优先搜索 (blog.devtang.com)
这篇文章通过详细的案例和代码解析,系统讲解了广度优先搜索(BFS)的原理、实现及其在实际问题中的应用场景。文章不仅介绍了 BFS 的基础知识,还延伸到复杂问题的解决思路,适合算法学习者、准备技术面试的开发者,以及对算法优化感兴趣的技术人员,提供了高效的学习参考。
by @技术头条 2025-01-03 00:10 查看详情
探索 AI 驱动的网络安全框架:深度学习技术、GPU 支持和未来增强 (paper.seebug.org)
这篇文章详细分析了现代网络攻击中的 DGA(域名生成算法)技术,涵盖了其工作原理、分类及在恶意软件中的应用实例。通过技术解析和实际案例,展示了如何检测和防御 DGA 带来的安全威胁。内容适合网络安全研究人员、安全工程师以及对恶意软件分析感兴趣的技术爱好者,提供了系统化的学习参考。
by @技术头条 2025-01-03 00:07 查看详情
Vercel 部署的单页应用(SPA)动态 Meta 标签实践 (innei.in)
在 Vercel 部署的单页应用(SPA)中,配置动态 Meta Tags 可改善 SEO 和分享体验。通过中间层实现 SSR 或利用 Edge Functions 渲染动态标签,可让每个页面呈现独立内容,兼顾性能与优化效果!
by @技术头条 2024-11-23 21:56 查看详情
AWS运维部署实践--快速拉起生产可用的EKS集群 (wiki.eryajf.net)
本文详细介绍了在 AWS 上快速搭建生产级 EKS 集群的步骤,包括子网规划、IAM 配置、必要命令工具的安装以及集群的创建和授权。通过 `eksctl` 工具快速定义和创建 EKS 集群,并提供了集群权限管理与网络配置的建议,确保集群安全和稳定运行。文中还包含完工后的调整建议,如将访问端点调整为私有以提升安全性。
by @技术头条 2024-11-02 17:08 查看详情
AWS运维部署实践--使用sigma自建镜像仓库代替ECR (wiki.eryajf.net)
本文介绍了如何使用 `sigma` 替代 AWS 的 ECR 作为轻量级的镜像仓库解决方案。通过配置 `s3` 存储、端口监听等设置,实现了低资源占用下的高效镜像管理。文章详细提供了 `config.yaml` 文件的配置方案,以及 `sigma` 部署的具体步骤,适合在自建环境中替代 ECR 进行镜像管理。
by @技术头条 2024-11-02 17:03 查看详情
React i18n CSR 最佳实践 (innei.in)
本文探讨 React 应用在客户端渲染中的 i18n 实践,包括懒加载、性能优化和翻译文件管理的最佳方法。
by @技术头条 2024-11-02 16:57 查看详情
AWS运维部署实践--route53私有域跨账号共享 (wiki.eryajf.net)
如果你的业务场景有多个 AWS 账号,那么私有域共享就是一个绕不开的话题。aws 中的 route53 私有域配置跨账号共享有两种方案,一种是直接跨账号关联 VPC,一种是通过配置文件共享的形式实现。本文采用第一种方案,只需要两条命令即可完成此需求。
by @技术头条 2024-11-02 16:52 查看详情