【C++】string类模拟实现上篇(附完整源码）

前言

在上一篇文章中，我们详细介绍了string类一些常用接口的使用，那这篇文章，我们将对string进行一个模拟实现，帮助大家理解的更加深刻。

1. string的基本结构

在上篇文章中我们了解：

string的底层其实就是一个支持动态增长的字符数组。那确定它的结构，接下来我们就开始模拟实现它。

首先新建一个头文件string.h，定义一个string类：

class string
{
    public :
    //成员函数
    private :
        char*  _str;
        size_t _size;
        size_t _capacity;
};
1
2
3
4
5
6
7
8
9

这里string类的三个成员变量，一个字符指针_str指向开辟的动态数组，_size标识有效数据个数，_capacity记录容量的大小（不包含’\0’）。

但是因为标准库里已经有string类，为了避免冲突，我们需要定义一个命名空间，把我们自己实现的string类放到自己的命名空间里面。

namespace w
{
    class string
{
    public :
    //成员函数
    private :
        char*  _str;
        size_t _size;
        size_t _capacity;

};
    
} 
1
2
3
4
5
6
7
8
9
10
11
12
13
14

2. 构造函数、析构函数

2.1 构造函数的实现

2.1.1带参构造函数

首先我们来模拟实现一个带参构造函数：

我们知道标准库里string类的构造函数有很多，这里我们只模拟实现最常用的：

在之前的文章中我们提到尽量使用初始化列表进行初始化，我们可以这样写：

但是这里你会发现程序报错了，因为如果像上图一样初始化，首先涉及到权限放大的问题（之前文章有讲过）char* str被const修饰，不能被修改，但是赋给_str，_str是char* 类型的，可以修改。其次用常量字符串去初始化也不能被修改。

那怎么办呢？我们这里不直接传参而是开空间，用strcpy去进行拷贝：

      string(const char* str)
	        :_str(new char[strlen(str)+1])
		    ,_size(strlen(str))
		    ,_capacity(strlen(str))
	    {
            strcpy(_str, str);
        }
1
2
3
4
5
6
7

顺便这里我们提供一个接口用来返回字符串：

 const char* c_str()
        {
            return _str;
        }
1
2
3
4

我们在创建一个test.cpp文件用来测试我们写的接口：

2.2析构函数

这里我们直接顺便给出析构函数：

~string()
        {
            delete[] _str;
            _str = nullptr;
            _size = _capacity = 0;
        }
1
2
3
4
5
6

2.3无参构造函数

我们有的时候还会遇到这样的场景：

所以这里需要我们去实现一个无参的构造函数。

假设这里的无参构造函数我们这样实现：

那这样真的可行吗？
如果这里_str传空指针那么在刚刚实现的c_str函数就会返回空程序，程序会崩溃。并且在标准库里的c_str接口即使传空也是会有返回值的。

那这里应该怎么办呢？我们可以这样写：

  string()
	        :_str(new char[1])
		    ,_size(0)
		    ,_capacity(0)
	    {
            _str[0] = '\0';
        }

1
2
3
4
5
6
7
8

这里我们给_str开辟一个空间，然后给这块空间给上'\0'。这样就不会出现上面的问题了。

2.4无参和带参构造函数合并

我们之前讲过无参和带参的可以用全缺省。

我们来看几种写法：

能这样写吗？答案是肯定不能这样写类型就不匹配，一个是字符一个是字符串。

能这样写吗？答案是肯定不能。这样写strlen里的str就是空串了。

其实应该这样写：

这里我们直接给一个空串，常量字符串末尾是默认有"\0"的

3. string的遍历

3.1 operator[ ]

我们知道在标准库中可以通过下标去访问字符串中的某一个字符，下面我们来实现对[]的重载。

首先我们需要实现size()接口：

接下来我们来实现一下[]的重载：

这里我们实现了两个版本普通版本对应普通对象，const版本对应const对象，且这两个函数构成函数重载。

下面我们来验证一下：

3.2迭代器模拟实现 (简单实现）

除了[]可以遍历访问string对象，我们还可以用迭代器进行访问。

那迭代器我们说了大家可以理解成一个像指针一样的东西，但是不一定是指针。
我们最开始介绍了STL有好几个版本，不同的版本实现可能是不一样的。
那其实vs下string的迭代器呢就不是使用指针实现的，而G++下使用的SGI版本是指针实现的。
那这里我们模拟实现就使用指针来实现:

下面我们来验证一下：

同样的我们还可以使用范围for进行遍历：

范围for的底层就是用的迭代器。
大家可以理解成范围for的语法其实就跟我们之前学过的宏有点类似，它会被替换成迭代器，相当于把*it赋值给ch。范围for的底层就是无脑替换。

3.3 const迭代器模拟实现

这里我们再实现const版本给const对象使用：

4. 数据的增删查改

首先我们来实现一下push_back()和append().这两个都是插入数据，既然插入数据那我们就必须考虑扩容的问题。

那这里如果扩容的话，我们一次扩多少呢？
对于push_back来说一次扩二倍没问题，但是append一次扩二倍有可能是不行的。
为什么？
如果当前的容量是10，现在追加一个长度为25的字符串，扩容到原来的两倍才
20，也是不够用的。

那这里我们通过string的另一个接口reserve，它可以改变容量为我们指定的大小，帮助我们扩容。
下面我们就先来实现一下reserve。

4.1 reserve

我们先来看一下reserve怎么实现：

这里当参数n的值小于_capacity，如果不加这个if判断这里就会缩容。但是我们知道，库里的接口是不会缩容的。所以需要加上这个条件判断。

4.2 push_back和append

那接下来有了reserve我们继续来实现push_back和append。

push_back这里我们直接选择两倍扩。

这里append最少扩容到_size + len.

下面我们来实现一下：

4.3 +=

我们虽然有push_back和append但是我们更喜欢用重载的+=。当然+=的底层也是可以用push_back和append实现的。

下面我们来实现一下：

4.4 insert

对于insert我们主要实现库里的这两个版本：

首先我们来实现一下在pos位置插入n个字符：
逻辑其实是比较简单的。首先判断一下，是否需要扩容，然后就插入数据，如果往中间插就需要挪动数据。

这样写有没有问题呢？我们来测试一下：

好像没什么问题啊。真的没问题吗？

我们来看一种特殊情况：当pos = 0 时插入数据：

程序这里挂了。那为什么呢？
这里当pos = 0时，end等于0时还会进入循环,end再- -会变成多少？是-1吗？

这里end的类型是szie_t，无符号整型，所以end为0后再- -并不是-1，而是整型最大值，发生越界，循环也没正常结束，所以程序崩了。

那怎么解决呢？把end改成int可行吗？

这里也是不可行的。end和pos比较，end变成int，但是pos是size_t类型，这里是会发生整型提升(C语言知识）。那我们应该如何解决呢？

这里解决方法有很多，我们采用其中一种利用我们之前文章中提到的npos解决：

我们再来测试一下：

刚才是插入一个字符，现在我们再来实现插入字符串的。那么逻辑和上面其实是一样的。只不过上面我们只需要挪出n个空间就可以了，那这里我们需要挪动数据腾出strlen(str)个空间。

下面我们来测试一下：

4.5 erase

那么接下来我们来实现一下erase，从pos位置删除len个字符：

对于erase首先第一种情况就是pos+len小于字符串的长度，那我们需要把pos位置开始的后len个字符删掉，但是仍然保留后续字符。那这里就是挪动后面的数据，把需要删除的覆盖掉就行。
那其它情况就是len比较大，pos+len直接大于等于字符串的长度，那就把pos后面的全部删掉。或者没有传pos这个参数，缺省值npos，那也要把后面的全删，所以这两种情况可以统一处理。这里只需要把pos位置给成“\0”就行了。

我们来测试一下：

当然为了和标准库里的一致我们这里也使用引用返回：

4.6 find

下面我们来实现一下find。find的实现其实很简单，遍历去找，找到了就返回下标，找不到就返回npos。

当然find还支持从pos位置开始查找一个字符串：在这里我们复用C语言中的strstr去查找。

下面我们来测试一下：

4.7 substr

下面我们再来实现一下substr。它的逻辑也是很简单的。

这里稍微需要注意的是我们需要条件判断当截取的字串足够长，我们截取的长度就是pos位置一直到字符串的末尾。

5. 拷贝构造

我们现在先来写一段这样的代码：

这里有一个拷贝构造，s2是s1拷贝构造而来的。

5.1 浅拷贝默认拷贝构造

在之前类和对象的文章中，我们知道，拷贝构造函数我们自己不写编译器是会默认生成的，这里我们直接运行上面的代码：

这里程序出错发生了一个经典的浅拷贝的问题。在之前的文章中我们也有讲过若未显式定义，编译器会生成默认的拷贝构造函数。默认的拷贝构造函数拷贝对象按内存存储字节序完成拷贝，这种拷贝叫做浅拷贝，或者值拷贝。一旦涉及到资源申请时，则拷贝构造函数是一定要写的，否则就是浅拷贝，就会出现问题。

5.2 深拷贝拷贝构造函数

这里就需要我们自己去实现拷贝构造函数，完成深拷贝：

下面我们来测试一下：

6. 源码(上部分)

6.1 string.h

#include 
using namespace std;
namespace w
{
    class string
{
    public :
        typedef char* iterator;
        typedef const char* const_iterator;
       iterator begin()
		{
			return _str;
		}

		iterator end()
		{
			return _str + _size;
		}

        const_iterator begin() const
		{
			return _str;
		}

		const_iterator end() const
		{
			return _str + _size;
		}

        string(const char* str = "")
	        :_str(new char[strlen(str)+1])
		    ,_size(strlen(str))
		    ,_capacity(strlen(str))
	    {
            strcpy(_str, str);
        }

        
		string(const string& s)
		{
			_str = new char[s._capacity + 1];
			strcpy(_str, s._str);
			_size = s._size;
			_capacity = s._capacity;
		}


        ~string()
        {
            delete[] _str;
            _str = nullptr;
            _size = _capacity = 0;
        }

        const char* c_str() const
        {
            return _str;
        }

        size_t size() const
        {
            return _size;
        }

        char& operator[](size_t pos)
       {
	        assert(pos < _size);
	        return _str[pos];
       }

         const char& operator[](size_t pos) const
       {
	        assert(pos < _size);
	        return _str[pos];
       }

          void reserve(size_t n)
		{
			if (n > _capacity)
			{
				char* tmp = new char[n + 1];
				strcpy(tmp, _str);
				delete[] _str;
				_str = tmp;
				_capacity = n;
			}
		}
		void push_back(char ch)
		{
			if (_size == _capacity)
			{
				// 2倍扩容
				reserve(_capacity == 0 ? 4 : _capacity * 2);
			}

			_str[_size] = ch;

			++_size;
			_str[_size] = '\0';
		}

		void append(const char* str)
		{
			size_t len = strlen(str);
			if (_size + len > _capacity)
			{
				// 至少扩容到_size + len
				reserve(_size+len);
			}

			strcpy(_str + _size, str);
			_size += len;
		}

        string& operator+=(char ch)
		{
			push_back(ch);
			return *this;
		}

		string& operator+=(const char* str)
		{
			append(str);
			return *this;
		}

        	void insert(size_t pos, size_t n, char ch)
		{
			assert(pos <= _size);

			if (_size +n > _capacity)
			{
				// 至少扩容到_size + len
				reserve(_size + n);
			}

			// 添加注释最好
			size_t end = _size;
			while (end >= pos && end != npos)
			{
				_str[end + n] = _str[end];
				--end;
			}

			for (size_t i = 0; i < n; i++)
			{
				_str[pos + i] = ch;
			}

			_size += n;
		}

        	void insert(size_t pos, const char* str)
		{
			assert(pos <= _size);

			size_t len = strlen(str);
			if (_size + len > _capacity)
			{
				// 至少扩容到_size + len
				reserve(_size + len);
			}

			// 添加注释最好
			size_t end = _size;
			while (end >= pos && end != npos)
			{
				_str[end + len] = _str[end];
				--end;
			}

			for (size_t i = 0; i < len; i++)
			{
				_str[pos + i] = str[i];
			}

			_size += len;
		}

        string& erase(size_t pos, size_t len = npos)
		{
			assert(pos <= _size);

			if (len == npos || pos + len >= _size)
			{
				_str[pos] = '\0';
				_size = pos;

				_str[_size] = '\0';
			}
			else
			{
				size_t end = pos + len;
				while (end <= _size)
				{
					_str[pos++] = _str[end++];
				}
				_size -= len;
			}

            return *this;
		}

        size_t find(char ch, size_t pos = 0)
		{
			assert(pos < _size);

			for (size_t i = pos; i < _size; i++)
			{
				if (_str[i] == ch)
				{
					return i;
				}
			}

			return npos;
		}

		size_t find(const char* str , size_t pos = 0)
		{
			assert(pos < _size);

			const char* ptr = strstr(_str + pos, str);
			if (ptr)
			{
				return ptr - _str;
			}
			else
			{
				return npos;
			}
		}

        string substr(size_t pos = 0, size_t len = npos)
		{
			assert(pos < _size);

			size_t n = len;
			if (len == npos || pos + len > _size)
			{
				n = _size - pos;
			}

			string tmp;
			tmp.reserve(n);
			for (size_t i = pos; i < pos + n; i++)
			{
				tmp += _str[i];
			}

			return tmp;
		}

    private :
        char*  _str;
        size_t _size;
        size_t _capacity;

    public:
		const static size_t npos;

};
    
	const size_t string::npos = -1;
} 


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267

6.2 test.cpp

#include "Mystring.h"

void test_string1()
{
    w ::string s1("hello world");
    cout << s1.c_str() << endl;

    for (size_t i = 0; i < s1.size(); i++)
    {
        cout << s1[i] << " ";
    }
    cout << endl;

    w ::string::iterator it = s1.begin();
    while (it != s1.end())
    {
        cout << *it << " ";
        ++it;
    }
    cout <<endl;
    
    for (auto ch : s1)
    {
        cout << ch <<" ";
    }
    cout <<endl;
}

void test_string2()
{

	w::string s1("hello world");
	cout << s1.c_str() << endl;

	s1.push_back(' ');
	s1.push_back('#');
	s1.append("hello");
	cout << s1.c_str() << endl;

    w::string s2("hello world");
	cout << s2.c_str() << endl;

	s2 += ' ';
	s2 += '#';
	s2 += "hello code";
	cout << s2.c_str() << endl;

}

void test_string3()
{
	w::string s1("helloworld");
	cout << s1.c_str() << endl;

	s1.insert(5, 3, '#');
	cout << s1.c_str() << endl;

	s1.insert(0, 3, '#');
	cout << s1.c_str() << endl;

    w::string s2("helloworld");
	s2.insert(5, "%%%%%");
	cout << s2.c_str() << endl;
	
}

void test_string4()
{
	w::string s1("helloworld");
	cout << s1.c_str() << endl;

	s1.erase(5, 3);
	cout << s1.c_str() << endl;

	s1.erase(5, 30);
	cout << s1.c_str() << endl;

	s1.erase(2);
	cout << s1.c_str() << endl;
}

void test_string5()
{
	w::string s1("helloworld");
	cout << s1.find('w',2) << endl;

	
}

void test_string6()
{
	w::string s1("hello world");
	w::string s2(s1);

	cout << s1.c_str() << endl;
	cout << s2.c_str() << endl;

}




int main()
{
    test_string6();
    return 0;
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107

7. 总结

文章篇幅有限，剩余内容将在下篇进行讲解。

相关阅读:
CCF刷题计划——训练计划（反向拓扑排序）
PyQt5学习一（环境搭建）
PAT 1026 Table Tennis
java计算机毕业设计Web企业差旅在线管理系统源码+mysql数据库+系统+lw文档+部署
 Go语言的100个错误使用场景（一）｜代码和项目组织
 FairLearn 中的 API （一）
Docker 笔记
 【计算机系统结构】指令级高度并行的超级计算机
 IOC操作Bean管理（基于注解方式）
【.Net实用方法总结】整理并总结System.IO中DirectoryInfo类及其方法介绍
原文地址：https://blog.csdn.net/weixin_69423932/article/details/132773877

【C++】string类模拟实现上篇(附完整源码）

目录

前言

1. string的基本结构

2. 构造函数、析构函数

2.1 构造函数的实现

2.1.1带参构造函数

2.2析构函数

2.3无参构造函数

2.4无参和带参构造函数合并

3. string的遍历

3.1 operator[ ]

3.2迭代器模拟实现 (简单实现）

3.3 const迭代器模拟实现

4. 数据的增删查改

4.1 reserve

4.2 push_back和append

4.3 +=

4.4 insert

4.5 erase

4.6 find

4.7 substr

5. 拷贝构造

5.1 浅拷贝默认拷贝构造

5.2 深拷贝拷贝构造函数

6. 源码(上部分)

6.1 string.h

6.2 test.cpp

7. 总结