• 数据结构(五):哈希表及面试常考的算法


    一、哈希表介绍

    1、定义

    哈希表,也叫散列表,是根据关键码和值 (key和value) 直接进行访问的数据结构,通过key和value来映射到集合中的一个位置,这样就可以很快找到集合中的对应元素。例如,下列键(key)为人名,value为性别。

    2、常用的哈希结构

    数组

    map(映射)

    映射底层实现是否有序数值是否可以重复能否更改数值查询效率增删效率
    std::map红黑树key有序key不可以重复key不可以修改O(logn)O(logn)
    std::multimap红黑树key有序key可以重复key不可以修改O(logn)O(logn)
    std::unordered_map哈希表key无序key不可以重复key不可以修改O(1)O(1)

    set(集合)

    集合底层实现是否有序数值是否可以重复能否更改数值查询效率增删效率
    std::set红黑树有序O(logn)O(logn)
    std::multiset红黑树有序O(logn)O(logn)
    std::unordered_set哈希表无序O(1)O(1)

    2、优缺点及使用场景

    优点:高效的查找和插入操作、适用于大数据量、灵活性、快速的删除操作

    缺点:空间消耗、不适合有序数据、哈希冲突、依赖好的哈希函数

    使用场景:快速查找需求、缓存实现、消除重复元素、分布式系统

    3、决定哈希表结构的性能的三个因素

    哈希函数、哈希表的大小、碰撞处理方法。

    4、基本操作

    数据存储:假设我们需要存储5个元素,首先使用哈希函数(Hash)计算Joe的键,也就是字符串‘Joe’的哈希值,得到4928,然后将哈希值除以数组长度5(mod运算),求得其余数。因此,我们将Joe的数据存进数组的3号箱子中。

    冲突:如果两个哈希值取余的结果相同,我们称这种情况为‘冲突’。假设Nell键的哈希值为6276,mod 5的结果为1。但此时1号箱已经存储了Sue的数据,可使用链表在已有的数据的后面继续存储新的数据。(本方法为链地址法,还有几种解决冲突的方法。其中,应用较为广泛的是“开放地址法”)。

    查询:假设最终的哈希表为

    如果要查找Ally的性别,首先算出Alley键的哈希值,然后对它进行mod运算。最终结果为3。

    然而3号箱中数据的键是Joe而不是Ally。此时便需要对Joe所在的链表进行线性查找。找到了键为Ally的数据。取出其对应的值,便知道了Ally的性别为女(F)。 

    二、面试常考的算法

    1、在数组中查找对称键值对

    题目:给定一个整数对数组,找到所有对称对,即相互镜像的对。

    示例:

    Input:  {3, 4}, {1, 2}, {5, 2}, {7, 10}, {4, 3}, {2, 5}
    Output:{4, 3} | {3, 4} ,{2, 5} | {5, 2}

    思路:使用一个哈希表map,将数组中第一个元素作为键,第二个元素作为值。遍历数组中的每对元素,对于每对元素,检查反向对是否已经存在于哈希表中。如果存在,说明找到了对称键值对,否则,将当前对插入到哈希表中。

    map.find(2)  //查找key为2的键值对是否存在 ,若没找到则返回map.end()。

    map.end()   //指向哈希表的最后一个容器,实则超出了哈希表的范围,为空。

    1. #include
    2. #include
    3. #include
    4. using namespace std;
    5. // 查找对称键值对
    6. void has_symmetric_pair(pair<int, int> intPairArray[], int length){
    7. unordered_map<int, int> map;
    8. for(int i = 0; i < length; i++){
    9. int key = intPairArray[i].first;
    10. int value = intPairArray[i].second;
    11. // 检查反向对是否存在于哈希表中
    12. if (map.find(value) != map.end() && map[value] == key){
    13. cout << "对称键值对有:(" << key <<", " << value<< ")|" <<"(" << value << ", " <")\n";
    14. }
    15. // 将当前对插入哈希表
    16. map[key] = value;
    17. }
    18. }
    19. int main() {
    20. // 创建一个整数对数组
    21. pair<int, int> intPairArray[6];
    22. int length = 6;
    23. // 分别给数组的元素赋值
    24. intPairArray[0] = make_pair(1, 2);
    25. intPairArray[1] = make_pair(3, 4);
    26. intPairArray[2] = make_pair(5, 6);
    27. intPairArray[3] = make_pair(7, 8);
    28. intPairArray[4] = make_pair(6, 5);
    29. intPairArray[5] = make_pair(4, 3);
    30. // 访问数组的元素
    31. for (int i = 0; i < 6; ++i) {
    32. std::cout << "Element " << i << ": (" << intPairArray[i].first << ", " << intPairArray[i].second << ")\n";
    33. }
    34. has_symmetric_pair(intPairArray, length);
    35. return 0;
    36. }

    2、追踪遍历的完整路径

    题目:使用哈希实现树的遍历路径,输出每个叶子节点的路径。

    示例:input:给定一颗树

               output:Node 4 Path: 1 -> 2 -> 4 ->

                             Node 5 Path: 1 -> 2 -> 5 ->

                             Node 3 Path: 1 -> 3 ->

    思路:在DFS的先序遍历中,逐步构建路径,当遇到叶子节点时,将该节点和对应的路径存储在哈希表中。最后,遍历哈希表输出结果。

    1. #include
    2. #include
    3. #include
    4. using namespace std;
    5. struct TreeNode {
    6. int val;
    7. TreeNode* left;
    8. TreeNode* right;
    9. TreeNode(int x) : val(x), left(NULL), right(NULL) {}
    10. };
    11. unordered_mapint>> pathMap;
    12. void dfs(TreeNode* node, vector<int>& path) {
    13. if (node == nullptr) return;
    14. path.push_back(node->val);
    15. if (node->left == nullptr && node->right == nullptr) {
    16. pathMap[node] = path;
    17. } else {
    18. dfs(node->left, path);
    19. dfs(node->right, path);
    20. }
    21. path.pop_back();
    22. }
    23. int main() {
    24. TreeNode* root = new TreeNode(1);
    25. root->left = new TreeNode(2);
    26. root->right = new TreeNode(3);
    27. root->left->left = new TreeNode(4);
    28. root->left->right = new TreeNode(5);
    29. vector<int> path;
    30. dfs(root, path);
    31. for (auto pair : pathMap) {
    32. cout << "Node " << pair.first->val << " Path: ";
    33. for (int val : pair.second) {
    34. cout << val << " -> ";
    35. }
    36. cout << endl;
    37. }
    38. delete root->left->right;
    39. delete root->left->left;
    40. delete root->left;
    41. delete root->right;
    42. delete root;
    43. return 0;
    44. }

    3、查找数组是否是另一个数组的子集

    题目:输入两个数组,如果数组1是数组2的元素,则返回True,否则返回False。

    示例:input:数组1[3,2,4],数组2[1,2,3,4,5,8]     output:数组1是数组2的子集

    思路:先将两个数组转换为 set,然后通过遍历第一个集合,检查其中的每个元素是否也在第二个集合中。

    if(set2.find(num) != set2.end())   //判断找到了key为2的键值对

    1. #include
    2. #include
    3. using namespace std;
    4. bool isSubSet(int nums1[], int nums2[], int length1, int length2){
    5. set<int> set1, set2;
    6. // int length1 = sizeof(nums1) / sizeof(nums1[0]);
    7. // int length2 = sizeof(nums2) / sizeof(nums2[0]);
    8. for(int i = 0; i < length1; i++){
    9. set1.insert(nums1[i]);
    10. }
    11. for(int j = 0; j < length2; j++){
    12. set2.insert(nums2[j]);
    13. }
    14. for(int num: set1){
    15. if(set2.find(num) == set2.end()){
    16. return false;
    17. }
    18. }
    19. return true;
    20. }
    21. int main(){
    22. int nums1[] = {3, 2, 4};
    23. int nums2[] = {1, 2, 3, 4, 5, 8};
    24. int length1 = sizeof(nums1) / sizeof(nums1[0]);
    25. int length2 = sizeof(nums2) / sizeof(nums2[0]);
    26. bool result = isSubSet(nums1,nums2, length1, length2);
    27. if (result) {
    28. cout << "arr1 is a subset of arr2" << std::endl;
    29. } else {
    30. cout << "arr1 is not a subset of arr2" << std::endl;
    31. }
    32. }

    4、检查给定的数组是否不相交

    题目:输入两个数组,如果数组1与数组2相交,则返回True,否则返回False。

    示例:input:数组1[9],数组2[3,2]     output:数组1与数组2不相交。

    思路:先将两个数组转换为set,然后使用set_intersection 函数找到它们的交集。如果交集为空,则数组不相交。

    std::set_intersection 是 C++ 标准库 头文件中的一个函数,它用于求两个已排序容器(比如集合或数组)的交集。

    函数声明如下:

    template
    OutputIt set_intersection(InputIt1 first1, InputIt1 last1, InputIt2 first2, InputIt2 last2, OutputIt d_first);

    • first1, last1: 第一个容器的起始和结束迭代器。
    • first2, last2: 第二个容器的起始和结束迭代器。
    • d_first: 结果输出的目标容器的起始迭代器。
    1. #include
    2. #include
    3. #include
    4. using namespace std;
    5. bool areDisjoint(int arr1[], int arr2[], int length1, int length2){
    6. set<int> set1, set2;
    7. for(int i = 0; i < length1; i++){
    8. set1.insert(arr1[i]);
    9. }
    10. for(int j = 0; j < length2; j++){
    11. set2.insert(arr2[j]);
    12. }
    13. // 同检查数组是否是另一个数组的子集
    14. // for(auto c: set1){
    15. // if(set2.find(c) != set2.end()){
    16. // return true;
    17. // }
    18. // }
    19. // return false;
    20. // 利用集合的交集来求
    21. set<int> intersection;
    22. set_intersection(set1.begin(), set1.end(), set2.begin(), set2.end(), inserter(intersection, intersection.begin()));
    23. if (intersection.empty()){
    24. return false;
    25. }
    26. return true;
    27. }
    28. int main(){
    29. int arr1[] = {9};
    30. int arr2[] = {3, 2};
    31. int length1 = sizeof(arr1) / sizeof(arr1[0]);
    32. int length2 = sizeof(arr2) / sizeof(arr2[0]);
    33. bool res = areDisjoint(arr1, arr2, length1, length2);
    34. if (res){
    35. cout << "arr1与arr2相交";
    36. }
    37. else{
    38. cout << "arr1与arr2不相交";
    39. }
    40. }

  • 相关阅读:
    为什么说 ICMP 协议是网络最强辅助
    Element & 8080端口被占用
    交易积累-RSI
    分布式搜索引擎01
    游戏类app有哪些变现方式?
    工业交换机在安全方面有哪些注意事项?
    Java 开发常用的 Linux 命令知识积累
    中文编程工具免费版下载,中文开发语言工具免费版下载
    希格斯玻色子——物质质量起源的探索
    JavaScript简称“JS”简单介绍
  • 原文地址:https://blog.csdn.net/bb8886/article/details/134160725