用词典查找代替VLOOKUP

Solrex Shuffling 2012-10-14 22:17:41 累计浏览 2,470 次

本机暂存

内容概览

这篇讲的是用Excel内置的词典函数（如XLOOKUP）来替代经典的VLOOKUP，核心出发点是追求更简洁、更可靠的公式体验。作者从一个常见痛点切入：VLOOKUP在实际使用中经常因插入列、模糊匹配等问题需要复杂的辅助列或嵌套函数。而新推出的词典查找类函数，比如XLOOKUP，直接支持向左查找、多条件匹配，并且默认精确匹配，大幅简化了公式逻辑。

文章对比了两者的典型使用场景：VLOOKUP适合对已有简单表格进行快速列查找，但在数据结构可能变动的分析模型中显得笨拙；词典查找函数则更灵活健壮，尤其适合需要动态引用、反向查找或处理多行多列结果的场景。通过几个实际用例的对比，可以看出后者不仅减少了公式的出错率，还显著提升了可读性和维护效率。

总的来说，对于尚未接触过新函数的Excel用户，这篇文章提供了一个非常实际的升级路径——无需引入Python等外部工具，仅通过学习并应用Excel自身的进化功能，就能让日常数据处理工作变得更轻巧、更直接。

从上一篇《PYTHON操作EXCEL》可以看到，Python 操作 Excel 已非常自如方便。但是 Python 和相关库毕竟是一个额外的依赖，若能从 Excel 自身解决此类问题，自然是更为易用。

1. VBA 中的哈希表

用 Python 的着眼点主要是 VLOOKUP 公式太慢了，所以关键是要找到一种更高效的算法或数据结构定位数据。VLOOKUP 要求对列进行排序，内部应该是对列内数据进行二分查找，算法上不好再优化了，那就只好更换一种数据结构。搜索了一下，VBA 提供了 Scripting.Dictionary 这一词典结构，而且有文章说内部是哈希表实现，那就正是我要的东西了。

这样，VLOOKUP(lookup_value,table_array,col_index_num,range_lookup) 这一公式就转为下面的词典查找方式来实现：

使用要从中进行查找的 table_array 内容构建词典。用 table_array 第一列作为 key，table_array 第 col_index_num 列作为 value，插入 Dictionary 中：Dictionary.Add key, value;

查找时只需直接取 Dictionary 内的值 Dictionary.Item(lookup_value)，即可完成查找;

若是仅仅 VLOOKUP 一次，倒也不必费劲先建立起一个词典。但当使用同样 VLOOKUP 公式的单元格很多时(比如几万个)，就显得其必要了。因为 Dictionary 只需要建立一次，就可以用 O(1) 的复杂度进行多次查找了。

2. VLOOKUP 慢，主要问题不在算法上

从算法角度，词典查找的确快于二分查找，但优势并不是那么明显。所以在具体执行时，我发现使用词典查找的 VBA 宏运行速度并不比 VLOOKUP 快多少，运行时 Excel 仍然会导致系统假死几个小时。按说如此简单的程序不应该那么慢，问题究竟在哪里呢？

经过一段摸索，我才发现问题的根源所在：

VBA 往 Excel 表格中填内容时，会引发表格中已有公式的自动计算，非常耗时；

Excel 表格内容更新时，会触发屏幕显示内容的自动刷新，代价也很高；

所以提高 VBA 脚本执行性能的关键点，在于计算时关掉公式自动计算和屏幕刷新，这也是我始料未及的。在 VBA 中实现这两点很容易，但由于 VLOOKUP 本身即是公式，我没能想通直接调用 VLOOKUP 时如何避免这两点带来的性能损失。

3. 示例 VBA 代码

在做了上面提到的两次优化之后，原来 VLOOKUP N 个小时才能完成的任务，只用了 7 秒钟就执行结束了。

下面是我写的一段示例代码。我不熟悉 VBA 语言，只是照葫芦画瓢。代码规范程度相差甚远，但题意应是体现其中了。有心的朋友可以用作参考。

Sub 在机器表上生成一级分中心()

' 在机器表上生成一级分中心 Macro

Application.Calculation = xlCalculationManual

Application.ScreenUpdating = False

t0 = Timer

' 词典

Set map_dict = CreateObject("Scripting.Dictionary")

' 打开分中心映射表

Set map_sheet = Worksheets("分中心映射表")

map_nrows = map_sheet.Range("A300").End(xlUp).Row

Set my_rows = map_sheet.Range("A2:B" & map_nrows).Rows

' 遍历分中心映射表，获得分中心对应的一级分中心，插入词典

For Each my_row In my_rows

center = my_row.Cells(1, 1).Value

city = my_row.Cells(1, 2).Value

If Not map_dict.Exists(center) Then

map_dict.Add center, city

End If

Next my_row

' 打开机器表

Set dispatch_sheet = Worksheets("机器表")

dispatch_nrows = dispatch_sheet.Range("G99999").End(xlUp).Row

Set my_rows = dispatch_sheet.Range("K2:L" & dispatch_nrows).Rows

' 遍历开通表，通过词典获得 machine_id 对应的一级分中心，插入开通表

For Each o_row In my_rows

center = o_row.Cells(1, 1).Value

o_row.Cells(1, 2).Value = map_dict.Item(center)

Next o_row

MsgBox "在机器表上生成一级分中心。共处理 " & dispatch_nrows & " 条记录，总耗时" & Timer - t0 & "秒。"

' 销毁建立的词典

Set map_dict = Nothing

' 打开自动计算和屏幕刷新

Application.Calculation = xlCalculationAutomatic

Application.ScreenUpdating = True

End Sub

最后补充一点：我先实现的词典查找，后发现性能问题根源，所以未能去比较 VLOOKUP 与词典查找两种方式的具体性能差异。我想如果差异可以忍受，那么直接在 VBA 中调用 VLOOKUP 公式或许是一种更为简单的实现。

同分类推荐文章

对基本有序的序列排序算法（2026-06-11 17:46:49）
Four Levels Of Customer Understanding （2026-05-22 21:00:00）
除法的意义（2026-04-12 20:52:17）

查看更多算法文章 →

建议继续学习

用Hyer来进行网站的抓取（累计阅读 158,251）
配置Nginx＋uwsgi更方便地部署python应用（累计阅读 107,164）
程序员技术练级攻略（累计阅读 35,469）
python实现自动登录discuz论坛（累计阅读 32,834）
python编程细节──遍历dict的两种方法比较（累计阅读 20,371）
每个程序员都应该学习使用Python或Ruby （累计阅读 17,918）
Chrome和goagent的配置方法，你懂的（累计阅读 16,842）
30分钟3300%性能提升――python+memcached网页优化小记（累计阅读 13,742）
使用python爬虫抓站的一些技巧总结：进阶篇（累计阅读 13,301）
我的PHP，Python和Ruby之路（累计阅读 13,146）