首页 > 基础资料 博客日记
C++ --> string类模拟实现(附源码)
2024-08-16 17:00:06基础资料围观291次
前言:
C++中
STL
扮演着极其重要的角色,学习C++重中之重的就是学习STL
,虽然string不作为containers的其中一员,但是也是值得学习的le类。下面就进行string
的模拟实现
string的模拟实现和顺序表是差不多,就是增加了C++的特性。
string 模拟实现
存储结构
结构上使用命名空间mystr
进行封装,防止与库冲突,使用class封装成为对象string:
- 定义
_size
方便记录string
的大小。 - 定义
_capacity
方便记录string
的容量大小 - 定义
char* _str
是存储数据,进行动态new出空间 nops
:npos
用于表示在字符串中未找到所查找的子串,或者表示一个超出字符串长度的有效索引位置。npos
的值通常被定义为std::size_t
类型的最大值,这是一个无符号整数类型,因此npos
实际上是一个非常大的正整数,用于表示没有找到匹配项或字符串的结束位置.
namespace mystr
{
class string
{
public:
static const size_t npos = -1;
private:
size_t _size;
size_t _capacity;
char* _str;
};
}
默认构造函数
构造函数
- 全缺省的构造函数也是默认构造函数,结尾给
""
常量字符串末尾存在\0
;
- 默认构造函数:全缺省、无参、编译器默认生成的构造函数称之为
默认构造函数
- 采取初始化列表,对于常量引用可以进行初始化。
strlen
计算出大小,初始化_size
2. 注意:初始化顺序就是声明的顺序,这个也是为什么将char* _str
放在最后; _capacoty
初始化容量+1的目的是给\0
开辟空间;- 最后将
str
进行拷贝,这里采用memcpy
不采用strcpy
3.memcpy
可以将全部内容拷贝,strcpy
会识别\0
停止,假使字符串hello\0 world
构造就不会得到我们想要的结果
string(const char* str = "")
:_size(strlen(str))
, _capacity(_size)
, _str(new char[_capacity + 1])
{
memcpy(_str, str, _capacity + 1);
}
拷贝构造函数
- 众所周知的是当不存在拷贝构造函数,编译器会自动生成拷贝构造函数;
- 编译器生成的仅仅会实现数值上的拷贝(浅拷贝)
_str
new出空间,要实现内容上的拷贝(深拷贝)
_capacoty
初始化容量+1的目的是给\0
开辟空间;
string(const string& s)
{
_capacity = s._capacity;
_size = s._size;
_str = new char[s._capacity+1];
memcpy(_str, s._str, _capacity+1);
}
赋值运算符重载
赋值预算符重载的底层逻辑是和拷贝构造函数是一样的,在这里就不过多介绍了
string& operator=(const string& s)
{
_capacity = s._capacity;
_size = s._size;
_str = new char[_capacity + 1];
memcpy(_str, s._str, _capacity + 1);
}
析构函数
程序的整个历程开辟空间,不进行空间的释放不是一个好的习惯,这里析构函数就要上场了
~string()
{
_size = 0;
_capacity = 0;
delete[] _str;
_str = nullptr;
}
迭代器(iterator)
-
string
的迭代器的本质就是指针,根据C语言的指针很容易就可以理解,就是将 char * 进行typefed char* iterator
-
迭代器实现两个版本
const
和非const
, 只读和可读可写
begin()
iterator begin()
{
return _str;
}
iterator begin()const
{
return _str;
}
end()
iterator end()
{
return _str + _size;
}
iterator end()const
{
return _str + _size;
}
容量(capacity)
size
mstr::string
类定义了_size
直接将其返回
size_t size()const
{
return _size;
}
capacity
mstr::string
类定义了_capacity
直接将其返回
size_t capacity() const
{
return _capacity;
}
resize
resize
是将后面指定大小初始化指定的字符(缺省:\0
)- 进行容量的检查,不够扩容
- 一层循环初始化为
ch
- 修改
_size
长度为n
void resize(size_t n,char ch = '\0')
{
if (n < _size)
{
_str[n ] = '\0';
_size = n;
}
else
{
reverse(n);
for (size_t i = _size; i < n; i++)
{
_str[i] = ch;
}
_str[_size] = '\0';
_size = n;
}
}
reverse
- 由于很多地方进行复用,需要在函数内部进行判断提高效率
- 开辟一个大于原始空间的新的空间,将
_str
拷贝过去,改变_str
的指向,将新开辟的空间释放谨防内存泄漏
void reverse(size_t n)
{
if (n > _capacity)
{
char* tmp = new char[n + 1];
memcpy(tmp, _str, _capacity + 1);
delete[] _str;
_capacity = n;
_str = tmp;
}
}
empty
直接判断_size
是否为0即可
bool empty()const
{
return _size == 0 ? true : false;
}
clear
- 直接将首位置赋值为
\0
,修改_size
大小即可
void clear()
{
_str[0] = '\0';
_size = 0;
}
修改(modify)
push_back
C++string
中 push_back 函数声明:void push_back (char c);
在字符串后追加一个字符;
- 开始要检查容量 进行扩容这里用
reverse
实现 - 由于一个字符,仅仅需要在
_size
位置上直接赋值,在_size+1
的位置上赋值\0
void push_back(char ch)
{
if (_size == _capacity)
{
reverse(_capacity == 0 ? 4 : _capacity * 2);
}
_str[_size] = ch;
_str[_size + 1] = '\0';
_size++;
}
append
append
后面追加一个字符可以进行复用push_back
append
后面追加一个字符串和添加一个string
类是一样的思路是一样;
//追加一个字符
void append(const char ch)
{
push_back(ch);
}
//追加一个字符串
void append(const char* str)
{
size_t len = strlen(str);
if (_size + len > _capacity)
{
reverse(_capacity + len);
}
memcpy(_str + _size, str, len + 1);
}
//追加一个string类
void append(const string& str)
{
if (_size + str._size == _capacity)
{
reverse(_size + str._size);
}
memcpy(_str + _size, str._str, str._size+1);
}
operator+=
由于是实现了append
实现运算符重载就方便跟多,功能一样,结果一样直接进行复用
//追加一个字符
string& operator+= (const char* str)
{
append(str);
return *this;
}
//追加一个字符串
string& operator+= (const string& str)
{
append(str._str);
return *this;
}
//追加一个string类
string& operator+= (char ch)
{
push_back(ch);
return *this;
}
inset
-
实现两个版本,插入字符和插入字符串
-
string
类是没有实现push_front
头插入,insert
就有很大的作用了在pos
位置进行插入 -
首先进行
pos
位置的断言,保证pos
在字符串的有效位置 -
进行容量检查,进行扩容.
-
将
pos
位置后面的字符(以及pos
位置)依次向后面移len
个长度,在pos
位置插入字符(字符串) -
i!= npos
在for
循环中如果i
变成了0,之后再去减1 ,size_t
下的-1
会变为无线大,会陷入死循环。 -
最后不要忘记将
_size
进行修改
//插入字符
string& insert(size_t pos, char c)
{
assert(pos < _size);
if (_capacity == _size)
{
reverse(_size+1);
}
for (size_t i = _size; i >= pos&& i!= npos; i--)
{
_str[i + 1] = _str[i];
}
_str[pos] = c;
_size++;
return *this;
}
//插入字符串
string& insert(size_t pos, const char* str)
{
assert(pos < _size);
size_t len = strlen(str);
if (_capacity == _size)
{
reverse(_size + len);
}
for (size_t i = _size; i >= pos&& i!= npos; i--)
{
_str[i + len] = _str[i];
}
memcpy(_str + pos, str, len);
_size+=len;
return *this;
}
erase
-
首先进行
pos
位置的断言,保证pos
在字符串的有效位置 -
erase
是在pos
位置删除len
个字符(缺省值:npos
) -
函数主体进入进
len
的判断,如果len == npos
或pos + len >= _size
超出字符串的长度,就是从pos
后全部删除 -
否则没有超过将
pos + len
位置后面的数据将pos
位置移动直至移动到\0
string& erase(size_t pos, size_t len = npos)
{
assert(pos < _size);
if (len == npos || pos + len >= _size)
{
_str[pos] = '\0';
_size = pos;
}
else
{
size_t end = pos + len;
while (end <= _size)
{
_str[pos++] = _str[end++];
}
_size -= len;
}
}
swap
- 利用C++库中的swap进行
string
类的交换
void swap(string& s)
{
string tmp(s);
std::swap(_str, tmp._str);
std::swap(_size, tmp._size);
std::swap(_capacity, tmp._capacity);
}
元素访问(Element access)
operator [ ]
- 实现
const
和非const
两种,只读和可读可改 - 充分利用字符串特性可以进行下标的访问
//const
char& operator[](size_t index)
{
assert(index < _size);
return _str[index];
}
//nonconst
const char& operator[](size_t index)const
{
assert(index < _size);
return _str[index];
}
字符串操作(String operations)
c_str
- 直接返回
_str
const char* c_str()
{
return _str;
}
find
- 首先进行
pos
位置的断言,保证pos
在字符串的有效位置 - 字符串查找利用C语言中的
strstr
函数进行查找 - 返回下面的下标,利用指针减指针的方法,没有找到返回
npos
size_t find(const char* s, size_t pos = 0) const
{
assert(pos < _size);
char* p = strstr(_str, s);
if (p)
{
return p - _str;
}
else
{
return npos;
}
}
关系运算符(relational operators)
进行比较的重载
- 实现
<
==
其他的进行复用即可 - 使用
memcpy
进行比较,比较字符串较小的那个_size < s._size ?_size : s._size
- 返回 为 0 返回比较长(
_size < s._size
)的那个否则返回假(ret < 0
)
//重载<
bool operator<(const string& s)
{
int ret = memcmp(_str, s._str, (_size < s._size ?_size : s._size));
return ret == 0 ? _size < s._size : ret < 0;
}
//重载==
bool operator==(const string& s)
{
return _size == s._size && memcmp(_str, s._str, _size);
}
//重载<=
bool operator<=(const string& s)
{
return !(*this > s);
}
//重载>
bool operator>(const string& s)
{
return !(*this <= s);
}
//重载>=
bool operator>=(const string& s)
{
return !(*this < s);
}
//重载!=
bool operator!=(const string& s)
{
return !(*this == s);
}
流提取和插
operator<<
- 这个函数是写在类外面的一个友元函数
- 使用范围
for
进行实现
ostream& operator<<(ostream& out, const mystr::string& s)
{
for (auto ch : s)
{
out << ch;
}
return out;
}
operator>>
s.clear();
这句话是清理缓冲区上次cin
的残留- 第一个
while
循环是处理缓冲区的空格 - 创建一个数组,避免多次开辟空间,直至大小到128拷贝会加到
string
s 中 - 最后的
if
语句是字符遇见空格或者换行结束,末尾添加\0
istream& operator>>(istream& in, string& s)
{
s.clear();
char ch = in.get();
// 处理前缓冲区前面的空格或者换行
while (ch == ' ' || ch == '\n')
{
ch = in.get();
}
char buff[128];
int i = 0;
while (ch != ' ' && ch != '\n')
{
buff[i++] = ch;
if (i == 127)
{
buff[i] = '\0';
s += buff;
i = 0;
}
ch = in.get();
}
if (i != 0)
{
buff[i] = '\0';
s += buff;
}
return in;
}
mystr:: string
源码
#pragma once
#include<iostream>
#include<string.h>
#include <assert.h>
#include <stdlib.h>
using namespace std;
namespace mystr
{
class string
{
friend ostream& operator<<(ostream& _cout, const mystr::string& s);
friend istream& operator>>(istream& _cin,mystr::string& s);
public:
typedef char* iterator;
typedef const char* const_iterator;
string(const char* str = "")
:_size(strlen(str))
, _capacity(_size)
, _str(new char[_capacity + 1])
{
memcpy(_str, str, _capacity + 1);
}
//析构函数
~string()
{
_size = 0;
_capacity = 0;
delete[] _str;
_str = nullptr;
}
// 拷贝构造函数
string(const string& s)
{
_capacity = s._capacity;
_size = s._size;
_str = new char[s._capacity+1];
memcpy(_str, s._str, _capacity+1);
}
//赋值预算符重载
string& operator=(const string& s)
{
_capacity = s._capacity;
_size = s._size;
_str = new char[_capacity + 1];
memcpy(_str, s._str, _capacity + 1);
}
const char* c_str()
{
return _str;
}
//迭代器
iterator begin()
{
return _str;
}
iterator end()
{
return _str + _size;
}
iterator begin()const
{
return _str;
}
iterator end()const
{
return _str + _size;
}
//capacity
size_t size()const
{
return _size;
}
size_t capacity() const
{
return _capacity;
}
void reverse(size_t n)
{
if (n > _capacity)
{
char* tmp = new char[n + 1];
memcpy(tmp, _str, _capacity + 1);
delete[] _str;
_capacity = n;
_str = tmp;
}
}
void resize(size_t n,char ch = '\0')
{
if (n < _size)
{
_str[n ] = '\0';
_size = n;
}
else
{
reverse(n);
for (size_t i = _size; i < n; i++)
{
_str[i] = ch;
}
_str[_size] = '\0';
_size = n;
}
}
bool empty()const
{
return _size == 0 ? true : false;
}
//access
//modify
void push_back(char ch)
{
if (_size == _capacity)
{
reverse(_capacity == 0 ? 4 : _capacity * 2);
}
_str[_size] = ch;
_str[_size + 1] = '\0';
_size++;
}
void append(const char ch)
{
push_back(ch);
}
void append(const char* str)
{
size_t len = strlen(str);
if (_size + len > _capacity)
{
reverse(_capacity + len);
}
memcpy(_str + _size, str, len + 1);
}
void append(const string& str)
{
if (_size + str._size == _capacity)
{
reverse(_size + str._size);
}
memcpy(_str + _size, str._str, str._size+1);
}
string& operator+= (const char* str)
{
append(str);
return *this;
}
string& operator+= (const string& str)
{
append(str._str);
return *this;
}
string& operator+= (char ch)
{
push_back(ch);
return *this;
}
void clear()
{
_str[0] = '\0';
_size = 0;
}
void swap(string& s)
{
string tmp(s);
std::swap(_str, tmp._str);
std::swap(_size, tmp._size);
std::swap(_capacity, tmp._capacity);
}
//relational operators
bool operator<(const string& s)
{
int ret = memcmp(_str, s._str, (_size < s._size ?_size : s._size));
return ret == 0 ? _size < s._size : ret < 0;
}
bool operator==(const string& s)
{
return _size == s._size && memcmp(_str, s._str, _size);
}
bool operator<=(const string& s)
{
return !(*this > s);
}
bool operator>(const string& s)
{
return !(*this <= s);
}
bool operator>=(const string& s)
{
return !(*this < s);
}
bool operator!=(const string& s)
{
return !(*this == s);
}
// 返回c在string中第一次出现的位置
size_t find(char c, size_t pos = 0) const
{
assert(pos < _size);
for (size_t i = pos; i < _size; i++)
{
if (_str[i] == c)
{
return i;
}
}
return npos;
}
// 返回子串s在string中第一次出现的位置
size_t find(const char* s, size_t pos = 0) const
{
assert(pos < _size);
char* p = strstr(_str, s);
if (p)
{
return p - _str;
}
else
{
return npos;
}
}
// 在pos位置上插入字符c/字符串str,并返回该字符的位置
string& insert(size_t pos, char c)
{
assert(pos < _size);
if (_capacity == _size)
{
reverse(_size+1);
}
for (size_t i = _size; i >= pos; i--)
{
_str[i + 1] = _str[i];
}
_str[pos] = c;
_size++;
return *this;
}
string& insert(size_t pos, const char* str)
{
assert(pos < _size);
size_t len = strlen(str);
if (_capacity == _size)
{
reverse(_size + len);
}
for (size_t i = _size; i >= pos; i--)
{
_str[i + len] = _str[i];
}
memcpy(_str + pos, str, len);
_size+=len;
return *this;
}
string& erase(size_t pos, size_t len = npos)
{
assert(pos < _size);
if (_capacity == _size)
{
reverse(_size + len);
}
if (len == npos || pos + len >= _size)
{
_str[pos] = '\0';
_size = pos;
}
else
{
size_t end = pos + len;
while (end <= _size)
{
_str[pos++] = _str[end++];
}
_size -= len;
}
}
private:
size_t _size;
size_t _capacity;
char* _str;
public:
const static size_t npos;
};
const size_t string::npos = -1;
ostream& operator<<(ostream& out, const mystr::string& s)
{
for (auto ch : s)
{
out << ch;
}
return out;
}
istream& operator>>(istream& in, string& s)
{
//清除缓冲区
s.clear();
char ch = in.get();
while (ch == ' ' || ch == '\n')
{
ch = in.get();
}
char buff[128];
int i = 0;
while (ch != ' ' && ch != '\n')
{
buff[i++] = ch;
if (i == 127)
{
buff[i] = '\0';
s += buff;
i = 0;
}
ch = in.get();
}
if (i!= 0)
{
buff[i] = '\0';
s += buff;
}
return in;
}
}
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:jacktools123@163.com进行投诉反馈,一经查实,立即删除!
标签: