技术头条 - 一个快速在微博传播文章的方式     搜索本站
您现在的位置首页 --> 算法 --> 查找第K小的元素

查找第K小的元素

浏览:4571次  出处信息

感觉这是个经典问题了,但是今天看维基百科的时候还是有了新的发现,话说这个问题,比较挫的解决方案有先排序,然后找到第K小的,复杂度是O(nlogn),还有就是利用选择排序或者是堆排序来搞,选择排序是O(kn),堆排序是O(nlogk),比较好的解决方案是利用类似快速排序的思想来找到第K小,复杂度为O(n),但是最坏情况可能达到O(n^2),不过今天要说的,就是还有种方法可以使得最坏情况也是O(n)。

我们先来看用快速排序的思想来搞的方案。快速排序是找到一个数,然后把所有数分为小于等于那个数的一堆,和大于那个数的一堆,然后两段分别递归来排序,而我们查找算法里,由于知道第K小的元素会在哪一堆,这样只需要递归其中一对即可。

  1. import random
  2. def partition(arr, left, right, pivot):
  3. v = arr[pivot]
  4. arr[pivot], arr[right-1] = arr[right-1], arr[pivot]
  5. index = left
  6. for i in xrange(left, right):
  7. if arr[i] <= v:
  8. arr[i], arr[index] = arr[index], arr[i]
  9. index += 1
  10. return index-1
  11. def select(arr, left, right, k):
  12. while right - left > 1:
  13. index = partition(arr, left, right, random.randint(left, right-1))
  14. dist = index - left + 1
  15. if dist == k:
  16. return arr[index]
  17. if dist < k:
  18. k -= dist
  19. left = index + 1
  20. else:
  21. right = index
  22. return arr[left]

之后arr是要查找的数组,调用select即可找到第K小元素,如果pivot元素选的不好那么这个算法最坏的情况是O(n^2)。

现在讨论最坏情况下也是O(n)的方案,把所有的数分为5个一堆,那么总共会有n/5堆,对于每堆我们可以很快的找到中位数(因为只有5个所以很容易嘛),之后调用当前算法找到这n/5个中位数的中位数,用这个数来做pivot,所以这个算法被叫做Median of Medians algorithm。

把中位数的中位数作为pivot的话,那么原数组中便会有3/5*1/2个也就是3/10个小于等于这个pivot的,同理会有3/10大于这个pivot的,所以最坏情况下,数组被分为30%,70%或者70%,30%的两部分。

T(n)<=T(n/5)+T(7/10*n)+O(n)<=c*n*(1+9/10+(9/10)^2....)
所以T(n)=O(n)

也就是最坏情况下是O(n)。

  1. import heapq
  2. def partition(arr, left, right, pivot):
  3. v = arr[pivot]
  4. arr[pivot], arr[right-1] = arr[right-1], arr[pivot]
  5. index = left
  6. for i in xrange(left, right):
  7. if arr[i] <= v:
  8. arr[i], arr[index] = arr[index], arr[i]
  9. index += 1
  10. return index-1
  11. def select_heap(arr, left, right, k):
  12. tmp = arr[left:right]
  13. heapq.heapify(tmp)
  14. [heapq.heappop(tmp) for i in xrange(k-1)]
  15. return heapq.heappop(tmp)
  16. def median(arr, left, right):
  17. num = (right - left - 1) / 5
  18. for i in xrange(num+1):
  19. sub_left = left + i*5
  20. sub_right = sub_left + 5
  21. if sub_right > right:
  22. sub_right = right
  23. m_index = select_heap(arr, sub_left, sub_right, (sub_right-sub_left)/2)
  24. arr[left+i], arr[m_index] = arr[m_index], arr[left+i]
  25. return select(arr, left, left+num+1, (num+1)/2)
  26. def select(arr, left, right, k):
  27. while right - left > 1:
  28. pivot = median(arr, left, right)
  29. index = partition(arr, left, right, pivot)
  30. dist = index - left + 1
  31. if dist == k:
  32. return arr[index]
  33. if dist < k:
  34. k -= dist
  35. left = index + 1
  36. else:
  37. right = index
  38. return arr[left]

同理,如果快速排序每次选pivot时用Median of Medians algorithm也可以把最坏情况降低为O(nlogn)的。

建议继续学习:

  1. 快速排序(Quicksort)的Javascript实现    (阅读:10117)
QQ技术交流群:445447336,欢迎加入!
扫一扫订阅我的微信号:IT技术博客大学习
© 2009 - 2024 by blogread.cn 微博:@IT技术博客大学习

京ICP备15002552号-1