• [ C++ ] string类常见接口及其模拟实现


    上一篇博文内容:string类的构造,拷贝,赋值拷贝,及其模拟实现[ C++ ] string类之构造,拷贝,赋值 及其模拟实现

    本篇内容:string类的常见接口及其模拟实现,我将会从遍历5个方面对常见,常用的接口进行模拟实现string类。

    思维导图是本篇博文主要内容

    目录

    1、遍历

    1.1 下标+operator [ ]

    1.2 c_str

    1.3 迭代器

    1.4 范围for

    2、增

    2.1.push_back

    2.2. 重载 += (char ch)

     2.3. append

    2.4.重载 += (char*  str)

    2.5. insert (任意位置插入)

    2.5.1 任意位置插入一个字符

    2.5.2 任意位置插入一个字符串

    3.删

    3.1 earse

    4.查

    4.1 查找一个字符

    4.2 查找一个字符串

    4.3 字符串比较

    5.改

    5.1 reserve

    5.2 resize 


    1、遍历

    1.1 下标+operator [ ]

    这种方法是最好理解的,我们使用下标将字符串的内容逐字符输出。

    1. char& operator[](size_t pos)
    2. {
    3. assert(pos < strlen(_str));
    4. return _str[pos];
    5. }
    6. const char& operator[](size_t pos) const
    7. {
    8. assert(pos < strlen(_str));
    9. return _str[pos];
    10. }
    11. int main()
    12. {
    13. string s1("hello world");
    14. for (int i = 0; i < s1.size(); ++i)
    15. {
    16. cout << s1[i];
    17. }
    18. return 0;
    19. }

     

    1.2 c_str

    我们发现c_str返回的就是该字符串以及末尾的'\0',我们可以使用c_str()来进行字符串的打印,遇到'\0'就停止。

    实现代码:

    1. const char* c_str() const
    2. {
    3. return _str;
    4. }

     

    1.3 迭代器

    迭代器:字符串的迭代器底层是一个char* 的原生指针,因此我们使用string的迭代器时就像指针一样使用即可,但是其他的容器底层实现并不一定都是原生指针。

    1. typedef char* iterator;
    2. typedef const char* const_iterator;
    3. iterator begin()
    4. {
    5. return _str;
    6. }
    7. iterator begin() const
    8. {
    9. return _str;
    10. }
    11. iterator end()
    12. {
    13. return _str + _size;
    14. }
    15. iterator end() const
    16. {
    17. return _str + _size;
    18. }

    我们使用迭代器来遍历一下字符串:

    1. int main()
    2. {
    3. string s1("hello world");
    4. string::iterator it = s1.begin();
    5. while (it != s1.end())
    6. {
    7. cout << *it << " ";
    8. it++;
    9. }
    10. return 0;
    11. }

     

    1.4 范围for

    范围for的使用

    1. for (auto e : s1)
    2. {
    3. cout << e << " ";
    4. }

     

    范围for的底层原理:范围for的底层原理其实就是迭代器。我们如何来验证呢,我们可以将自己实现的迭代器屏蔽起来,再使用范围for进行遍历发现就会出现报错。  

    2、增

    2.1.push_back

    通过查询文档,我们知道了push_back的作用是将一个字符添加到目标字符串后。

    方法:

    1、首先我们肯定要判断是否需要扩容。如果_size == _capacity ,说明满了,需要扩容。

    扩容的方法:开辟一个2倍的新空间,将字符串拷贝到新空间,现有的空间释放掉即可。

    2、扩容完毕后我们在下标为_size的位置加入新增字符。

    3、最后我们将_size++,并处理'\0'即可。

    实现代码:

    1. void push_back(char ch)
    2. {
    3. if (_size == _capacity)
    4. {
    5. char* tmp = new char[_capacity * 2 + 1];
    6. strcpy(tmp, _str);
    7. delete[] _str;
    8. _str = tmp;
    9. _capacity *= 2;
    10. //reserve(_capacity == 0?4:_capacity*2);
    11. }
    12. _str[_size] = ch;
    13. ++_size;
    14. _str[_size] = '\0';
    15. //insert(_size, ch);
    16. }

    2.2. 重载 += (char ch)

    我们在日常写代码时很少会使用push_back,我们经常会使用 += ,因此我们也有必要实现一下 +=,+= 的实现可以复用 push_back。

    代码实现:

    1. string& operator+=( char ch)
    2. {
    3. push_back(ch);
    4. return *this;
    5. }

     2.3. append

    前两个接口针对新增一个字符,append接口是将一个字符串新增到源字符串后。

    方法:

    1、首先,我们依然要考虑源字符串是否需要扩容,这次的扩容和push_back的扩容仍有区别,push_back由于只新增一个字符,因此在源字符串大小的基础上扩容2倍是足够的;append如果也是在源字符串的大小上扩容2倍的话并不能保证空间足够,因为并不知道新字符串的大小。那么确保新空间的大小一定足够呢?因此我们只需要计算源字符串的_size + 新字符串的_size的和,这个和就是新空间的大小。这也一定能确保新空间足够。因此我们可以使用reserve接口(该接口实现在 5.1)

    2、只需要修改_size.

    代码实现:

    1. void append(const char* str)
    2. {
    3. size_t len = _size + strlen(str);
    4. if (len > _capacity)
    5. {
    6. reserve(len);
    7. }
    8. strcpy(_str + _size, str);
    9. _size = len;
    10. //insert(_size, str);
    11. }

    2.4.重载 += (char*  str)

    +=字符串实现原理也是直接复用append

    代码实现:

    1. string& operator+=(const char* str)
    2. {
    3. append(str);
    4. return *this;
    5. }

    2.5. insert (任意位置插入)

    2.5.1 任意位置插入一个字符

    方法:

    1、首先:判断pos位置的合法性。

    2、其次:判断是否需要扩容,如果满了则需要扩容(2倍扩即可)

    3、再者:从_size+1位置开始从后往前分别将每个字符向后移动一位,当end等于pos位置时,移动结束

    4、最后:在pos位置插入新字符,修改_size

    代码实现如下:

    1. string& insert(size_t pos, char ch)
    2. {
    3. assert(pos <= _size);
    4. //判断size
    5. if (_size == _capacity)
    6. {
    7. reserve(_capacity == 0 ? 4 : _capacity * 2);
    8. }
    9. size_t end = _size+1;
    10. while (end > pos)
    11. {
    12. _str[end] = _str[end-1];
    13. --end;
    14. }
    15. _str[pos] = ch;
    16. ++_size;
    17. return *this;
    18. }

    注:当pos == size时,相当于push_back,因此push_back可以复用insert。 

    2.5.2 任意位置插入一个字符串

    任意位置插入一个字符串时原理基本和插入一个字符相同,需要注意临界条件即可。

    方法:

    1、首先:判断pos位置的合法性。

    2、其次:判断是否需要扩容,如果满了则需要扩容,这里的扩容和append的扩容原理相同,使用reserve扩。

    3、再者:挪动数据。 依然是从后往前挪。此时end = size + len(len = strlen(str)),依次将end - len位置的字符挪动到end位置,每挪一个字符,end--,当 end == pos+len - 1时候说明挪动结束。

    4、最后,插入字符串,修改_size即可。

    1. string& insert(size_t pos, const char* str)
    2. {
    3. assert(pos <= _size);
    4. size_t len = strlen(str);
    5. if (len == 0)
    6. {
    7. return *this;
    8. }
    9. if (_size + len > _capacity)
    10. {
    11. reserve(_size + len);
    12. }
    13. //挪动数据
    14. size_t end = _size + len;
    15. //while(end >= end+len)
    16. while (end > pos+len-1)
    17. {
    18. _str[end] = _str[end-len];
    19. --end;
    20. }
    21. //插入数据
    22. size_t i = 0;
    23. while (i < len)
    24. {
    25. _str[pos+i] = str[i];
    26. ++i;
    27. }
    28. _size += len;
    29. return *this;
    30. }

    3.删

    3.1 earse

    库中提到了一个npos,我们可以看一下npos到底是什么?

    npos的大小肯定是大于给定len的大小,因此就是有多少删多少。

    通过库里面的定义,erase的作用是在pos位置往后删除len个字符

    其中erase删除可分为这几种情况:

    情况1:如果len == npos,或者pos + len >= _size,说明要删完,后面删完的话只需要在pos位置赋成 '\0' 即可。

    情况2:没有删完,删除一部分,我们可以定义一个begin = pos + len,让begin 位置的字符赋值给begin - len 位置的字符,当begin == _size时,就自动将 ' \0 ' 赋值过去了,因此结束的条件是begin > _size。 最后再处理一下 _size -= len 

    代码实现:

    1. string& earse(size_t pos, size_t len = npos)
    2. {
    3. assert(pos < _size);
    4. if (len == npos || pos + len >= _size)
    5. {
    6. _str[pos] = '\0';
    7. _size = pos;
    8. }
    9. else
    10. {
    11. size_t begin = pos + len;
    12. while (begin <= _size)
    13. {
    14. _str[begin-len] = _str[begin];
    15. ++begin;
    16. }
    17. _size -= len;
    18. }
    19. return *this;
    20. }

    4.查

    4.1 查找一个字符

    find查字符串返回第一次出现该字符的下标,这个实现也比较简单。 

    1. size_t find(char ch,size_t pos = 0)
    2. {
    3. for (; pos < _size; ++pos)
    4. {
    5. if (_str[pos] == ch)
    6. {
    7. return pos;
    8. }
    9. }
    10. return npos;
    11. }

    4.2 查找一个字符串

    查找子串可以使用C语言中的strstr

    1. size_t find(const char* str, size_t pos = 0)
    2. {
    3. const char* p = strstr(_str + pos, str);
    4. //kmp算法 -- 效率不好 不实用
    5. //bm算法
    6. if (p == nullptr)
    7. {
    8. return npos;
    9. }
    10. else
    11. {
    12. return p - _str;
    13. }
    14. }

    4.3 字符串比较

    这里我们比较的是字符的ASCII码值的大小,可以使用strcmp

    1. bool operator<(const string& s1, const string& s2)
    2. {
    3. return strcmp(s1.c_str(), s2.c_str()) < 0;
    4. }
    5. bool operator==(const string& s1, const string& s2)
    6. {
    7. return strcmp(s1.c_str(), s2.c_str()) == 0;
    8. }
    9. bool operator<=(const string& s1, const string& s2)
    10. {
    11. return s1 < s2 || s1 == s2;
    12. }
    13. bool operator>(const string& s1, const string& s2)
    14. {
    15. return !(s1 <= s2);
    16. }
    17. bool operator>=(const string& s1, const string& s2)
    18. {
    19. return !(s1 < s2);
    20. }
    21. bool operator!=(const string& s1, const string& s2)
    22. {
    23. return !(s1 == s2);
    24. }

    5.改

    5.1 reserve

     reserve作用就是将string的容量扩充到n个。

    方法:首先需要判断n是否大于_capacity,如果n小于等于_capacity则不进行容量修改,如果n大于_capacity,则需要进行扩充到n。

    代码实现:

    1. void reserve(size_t n)
    2. {
    3. if (n > _capacity)
    4. {
    5. char* tmp = new char[n + 1];
    6. strcpy(tmp, _str);
    7. delete[] _str;
    8. _str = tmp;
    9. _capacity = n;
    10. }
    11. }

    5.2 resize 

    resize的作用是将字符串的大小调整为n个字符。resize修改的是size。

    resize和reserve的区别:reserve只对空间进行处理,不影响值;resize不仅会改变空间,还会改变size,会改变字符的值。

    情况1: resize的n大于当前字符串的长度。

    用如图举例,s1中存放 hello world,大小只有15个空间,现在要resize(20,'x'),此时空间不够,需要扩容,开辟新空间后将源字符串内容拷贝下来并在后面加满 'x'

     

    情况2: resize的n小于当前字符串_capacity的长度。但是大于字符串_size的长度

    如下图所示,在这种情况下,s1的_capacity不会变,而是将_size增加到n,并在字符串后弥补目标字符。

    情况3: resize的n小于当前字符串_resize

    如下图所示,在这种情况下,s1的_size修改为目标大小n,并改变值,只会保留前n个字符的内容

    在了解resize的作用后,我们也进行了不同情况的分类,模拟实现代码如下:

    1. //扩空间+初始化
    2. //删除部分数据,保留前n个
    3. void resize(size_t n,char ch = '\0')
    4. {
    5. if (n < _size)
    6. {
    7. _size = n;
    8. _str[_size] = '\0';
    9. }
    10. else
    11. {
    12. if (n > _capacity)
    13. {
    14. reserve(n);
    15. }
    16. for (size_t i = _size; i < n; ++i)
    17. {
    18. _str[i] = ch;
    19. }
    20. _size = n;
    21. _str[_size] = '\0';
    22. }
    23. }

     (本篇完)

  • 相关阅读:
    C#重启 --- 类和对象
    “Redis与Spring整合及缓存优化“
    零基础自学javase黑马课程第十天
    二叉(搜索)树的最近公共祖先 ●●
    SpringBoot项目启动之后莫名跳转Please sign in界面
    Java JUC并发容器之BlockingQueue的多种实现详解
    24/8/6算法笔记 支持向量机
    黑马学Docker(一)
    【正点原子STM32连载】第十四章 蜂鸣器实验 摘自【正点原子】MiniPro STM32H750 开发指南_V1.1
    第十三届蓝桥杯大赛软件赛决赛(C/C++ 大学C组)
  • 原文地址:https://blog.csdn.net/qq_58325487/article/details/126521082