• C++位图简明介绍与实现


    何时使用位图?

    给40亿个不重复的无符号整数,没排过序。给一个无符号整数,如何快速判断一个数是否在这40亿个数中。【腾讯】

    1. 遍历,时间复杂度O(N)
    2. 排序(O(NlogN)),利用二分查找: logN
      上述两种方法都不是很好,因此有了位图的用武之地

    位图(表示一个数在不在)

    数据是否在给定的整形数据中,结果是在或者不在,刚好是两种状态,那么可以使用一个二进制比特位来代表数据是否存在的信息,如果二进制比特位为1,代表存在,为0代表不存在。比如:
    在这里插入图片描述
    用位图解决上述问题需要的空间为:
    在这里插入图片描述
    因此位图需要开42亿9千万个比特即500M的空间:
    在这里插入图片描述

    位图的简单实现(C++库中有:bitset)

    在这里插入图片描述
    在这里插入图片描述

    #include
    #include
    using namespace std;
    
    
    namespace cola
    {
    	template<size_t N>
    	class bitset
    	{
    	public:
    		bitset()
    		{
    			//假设为7:7/8 = 0或10:10/8 = 1,因此最后加一个1防止空间不够用
    			_bits.resize(N / 8 + 1, 0);//初始化为全0
    		}
    
    		//将数据存入位图
    		void set(size_t x)
    		{
    			//计算x会放到第几个字节
    			size_t i = x / 8;
    
    			//计算x会放到第几位
    			size_t j = x % 8;
    
    			//存入位图中(位图置为1)
    			_bits[i] |= (1 << j);
    		}
    
    		//将数据从位图中移除
    		void reset(size_t x)
    		{
    			//计算在第几个字节
    			size_t i = x / 8;
    
    			//计算第几位
    			size_t j = x % 8;
    
    			//将数据移除(位图置为0)
    			_bits[i] &= ~(1 << j);
    		}
    
    		//查看数据是否存在(位图是否为1)
    		bool test(size_t x)
    		{
    			//计算在第几个字节
    			size_t i = x / 8;
    
    			//计算第几位
    			size_t j = x % 8;
    
    			return _bits[i] & (1 << j);
    		}
    	private:
    		vector<char>_bits;
    	};
    
    	void test_bitset()
    	{
    		bitset<100> bs;
    		bs.set(5);
    		bs.set(4);
    		bs.set(10);
    		bs.set(20);
    
    		cout << bs.test(5) << endl;
    		cout << bs.test(4) << endl;
    		cout << bs.test(10) << endl;
    		cout << bs.test(20) << endl;
    		cout << bs.test(21) << endl;
    		cout << bs.test(6) << endl << endl;
    
    		bs.reset(20);
    		bs.reset(10);
    		bs.reset(5);
    
    		cout << bs.test(5) << endl;
    		cout << bs.test(4) << endl;
    		cout << bs.test(10) << endl;
    		cout << bs.test(20) << endl;
    		cout << bs.test(21) << endl;
    		cout << bs.test(6) << endl; 
    	}
    }
    
    int main()
    {
    
    	cola::test_bitset();
    
    	system("pause");
    	return 0;
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47
    • 48
    • 49
    • 50
    • 51
    • 52
    • 53
    • 54
    • 55
    • 56
    • 57
    • 58
    • 59
    • 60
    • 61
    • 62
    • 63
    • 64
    • 65
    • 66
    • 67
    • 68
    • 69
    • 70
    • 71
    • 72
    • 73
    • 74
    • 75
    • 76
    • 77
    • 78
    • 79
    • 80
    • 81
    • 82
    • 83
    • 84
    • 85
    • 86
    • 87
    • 88
    • 89
    • 90
    • 91
    • 92
    • 93
    • 94

    测试结果:
    在这里插入图片描述
    在这里插入图片描述

    位图相关题目

    1. 给定100亿个整数,设计算法找到只出现一次的整数?

    在这里插入图片描述

    代码实现

    //设计两个位图配合的类
    	template<size_t N>
    	class TwoBitSet
    	{
    	public:
    		//插入数据
    		void Set(size_t x)
    		{
    			//查看数据出现了几次
    			//00 没出现过
    			if (!_bit1.test(x) && !_bit2.test(x))// 00 -> 01
    			{
    				//设为 01 表示出现了1次
    				_bit2.set(x);
    			}
    			//01 出现1次
    			else if (!_bit1.test(x) && _bit2.test(x)) // 01 -> 10
    			{
    				//设为 10 表示出现了2次	
    				_bit1.set(x);  //位图1置为1
    				_bit2.reset(x);//位图2置为0
    			}
    			// 10 表示已经出现2次或以上,不用处理
    		}
    
    		//查找出现一次的数
    		void PrintOnceNum()
    		{
    			for (size_t i = 0; i < N; ++i)
    			{
    				// 01 出现1次
    				if (!_bit1.test(i) && _bit2.test(i))
    				{
    					cout << i << endl;
    				}
    			}
    		}
    
    	private:
    		bitset<N> _bit1;
    		bitset<N> _bit2;
    	};
    
    	void TestTwoBitSet()
    	{
    		int a[] = { 99,0,4,50,33,44,2,5,99,0,50,99,50,2 };
    		TwoBitSet<100> bs;
    		for (auto e : a)
    		{
    			bs.Set(e);
    		}
    
    		bs.PrintOnceNum();
    	}
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47
    • 48
    • 49
    • 50
    • 51
    • 52
    • 53
    • 54

    在这里插入图片描述

    2. 给两个文件,分别有100亿个整数,我们只有1G内存,如何找到两个文件交集?

    在这里插入图片描述

    void TestFindIntersection()
    	{
    		int a1[] = { 5, 30, 1, 29, 10};
    		int a2[] = { 8, 10, 11, 9, 30, 10, 30};
    
    		bitset<30>b1;
    		bitset<30>b2;
    
    		for (auto e : a1)
    		{
    			b1.set(e);
    		}
    
    		for (auto e : a2)
    		{
    			b2.set(e);
    		}
    
    		//因为按字节查找,因此要30 / 8 + 1
    		for (int i = 0; i < (30 / 8 + 1); i++)
    		{
    			size_t res = b1._bits[i] & b2._bits[i];
    			cout << res << endl;
    		}
    	}
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25

    在这里插入图片描述
    在这里插入图片描述

    3. 位图应用变形:1个文件有100亿个int,1G内存,设计算法找到出现次数不超过2次的所有整数

    在这里插入图片描述

  • 相关阅读:
    【UE 粒子练习】08——LOD概述
    gtsummary绘制三线表/基线资料表/表格
    mysql数据库
    《C++ primer plus》:第五章 循环和关系表达式
    Python实现BOA蝴蝶优化算法优化支持向量机分类模型(SVC算法)项目实战
    STM32CubeMX教程16 DAC - 输出3.3V内任意电压
    CentOS7 FTP服务创建
    登录中获取验证码的节流
    极速PDF编辑器提示缺少字体如何解决
    SpringBoot+Vue实现前后端分离OA办公管理系统
  • 原文地址:https://blog.csdn.net/jiaao666/article/details/126322948