汇芳书院

专注计算机视觉、机器学习、分布式计算等领域, 兼聊投资、写作、生活

0%

前K个高频单词

给定一个单词列表 words 和一个整数 k ,返回前 k 个出现次数最多的单词。

返回的答案应该按单词出现频率由高到低排序。如果不同的单词有相同出现频率, 按字典顺序 排序。

 

示例 1:

输入: words = [“i”, “love”, “leetcode”, “i”, “love”, “coding”], k = 2
输出: [“i”, “love”]
解析: “i” 和 “love” 为出现次数最多的两个单词,均为2次。
注意,按字母顺序 “i” 在 “love” 之前。
示例 2:

输入: [“the”, “day”, “is”, “sunny”, “the”, “the”, “the”, “sunny”, “is”, “is”], k = 4
输出: [“the”, “is”, “sunny”, “day”]
解析: “the”, “is”, “sunny” 和 “day” 是出现次数最多的四个单词,
出现次数依次为 4, 3, 2 和 1 次。  

注意:

1 <= words.length <= 500
1 <= words[i] <= 10
words[i] 由小写英文字母组成。
k 的取值范围是 [1, 不同 words[i] 的数量]  

进阶:尝试以 O(n log k) 时间复杂度和 O(n) 空间复杂度解决。


哈希表+排序

时间复杂度:O(nlogn)

python元组排序,可以一次排序完成

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
class Solution:
def topKFrequent(self, words: List[str], k: int) -> List[str]:
hash_map = dict()
from heapq import heappush,heappushpop,heapify
for e in words:
if e in hash_map:
hash_map[e] += 1
else:
hash_map[e] = 1

# python的元组排序是按元素的字典序排序,因为数字要求从大到小,所以需要改为负数
ans = [(-v,k) for k,v in hash_map.items()]
ans.sort()
return [e[1] for e in ans][:k]

写法上还可以有点不一样,

1
2
3
4
5
6
7
8
9
10
11
12
class Solution:
def topKFrequent(self, words: List[str], k: int) -> List[str]:
hash_map = dict()
from heapq import heappush,heappushpop,heapify
for e in words:
if e in hash_map:
hash_map[e] += 1
else:
hash_map[e] = 1

ans = sorted(hash_map.items(), key=lambda x: (-x[1],x[0]))[:k]
return [e[0] for e in ans]

哈希表 + 优先队列

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
class Solution:
def topKFrequent(self, words: List[str], k: int) -> List[str]:
hash_map = dict()
from heapq import heappush,heappushpop,heapify
for e in words:
hash_map[e] = hash_map.get(e, 0) + 1

h = []
for e in hash_map.keys():
heappush(h, (-hash_map[e], e))

ans = []
for _ in range(k):
ans.append(heapq.heappop(h))
# print('ans', ans)
return [e[1] for e in ans]
坚持原创分享,您的支持将鼓励我继续创作

欢迎关注我的其它发布渠道

------------- 本文结束,感谢阅读 如有问题可留言交流 -------------