标签：String Matching

共 2 篇相关文章

IT 累计浏览 7,184

字符串匹配那些事（一）

这篇讲的是如何在字符串匹配的算法丛林中，找到属于你的那条高效路径。作者从最基础的暴力匹配算法出发，但它一遇到长模式串或特定文本就可能陷入效率泥潭。为了解决这个问题，文章系统梳理了KMP、BM、Horspool、Sunday、fastsearch、KR等一众经典算法的核心思路。文章并没有罗列枯燥的公式，而是着重对比了不同算法的关键差异。比如KMP是如何通过预处理模式串，利用已匹配的信息来避免回溯的；而BM算法家族的思路又截然不同，它倾向于从文本串的末尾开始比较，从而实现更大的“跳跃”。作者清晰地指出了这些算法的性能特点——从O(mn)到近乎线性的时间复杂度提升，以及它们各自最擅长的应用场景。对于面临具体工程问题的开发者，比如做文本编辑器搜索、敏感词过滤或是生物信息学序列比对，了解这些算法的适用边界就显得尤为重要。这篇文章就像一份算法选型指南，帮你判断在什么情况下，哪种算法的权衡与巧思最能解决问题。

IT 累计浏览 3,221

[一道面试题]含有*的字符串匹配问题

这篇讲的是一道经典的算法面试题：LeetCode第10题“正则表达式匹配”。文章从问题本身出发，核心是拆解通配符 `*`（在题目中实际是点号 `.` 和星号 `*` 组合）匹配任意字符的逻辑。作者清晰地梳理了解题思路，重点对比了动态规划与记忆化搜索两种方法。文章指出，动态规划虽然直观，但其二维状态空间需要 O(mn) 的时间和空间。而记忆化搜索本质上是递归加缓存，思路更贴合问题定义，通过自顶向下思考，可能避开一些不必要的计算。文章的巧妙之处在于，最后引导读者思考：在已知上述方法复杂度后，能否进一步优化空间。这从解决单个问题提升到了对算法设计思维的探讨，展示了如何从正确解法走向更优解。对于准备算法面试或希望巩固动态规划思想的开发者来说，这是一篇逻辑清晰、有深入思考的技术解析。