首页 > 基础资料 博客日记
【C++】标准库:介绍string类
2024-07-27 18:00:06基础资料围观425次
string
一.string类介绍
  C语言中,字符串是以’\0’结尾的一些字符的集合,为了操作方便,C标准库中提供了一些str系列的库函数,但是这些库函数与字符串是分离开的,不太符合OOP的思想,而且底层空间需要用户自己管理,稍不留神可能还会越界访问。
   C++中将string封装为单独的类,string 类是 C++ 标准库中的一个非常重要的类,用于表示和操作字符串。string类位于命名空间std(标准库)下,使用string类记得加上头文件#include,并且使用命名空间using namespace std或者using std::string。
//使用时记得加上
#include<string>
using std::string;//或者using namespace std;
//源代码大致框架
namespace std
{
	class string
	{
	private:
		char* _str;
		size_t _size;
		size_t _capacity;
	};
}
二.string类的静态成员变量
静态成员变量:static const size_t npos = -1;
int main()
{
	//static const size_t npos = -1;
	//typedef unsigned long long size_t
	//-1的原码:10000000 00000000 00000000 00000001
	//-1的反码:11111111 11111111 11111111 11111110
	//-1的补码:11111111 11111111 11111111 11111111
	//npos:-1的补码按照无符号整形打印出的值,由于静态成员变量,类外使用时加上类域
	cout << string::npos << endl;//32位环境:4294967295
	return 0;
}
三.string类的常用接口
1.构造函数(constructor)
- 无参构造:- string(); 构造空的string类对象,即空字符串。常用。
- 有参构造:- string (const char* s); 用常量字符串来构造string类对象常用。
- 拷贝构造:- string (const string& str); 用str拷贝构造string类对象常用。
- string (const string& str, size_t pos, size_t len = npos); 构造从下标pos开始,长度为len的子串,含缺省参数npos。
- string (const char* s, size_t n); 构造前n个字符组成的子串。
- string (size_t n, char c); 构造n个字符c组成的字符串。
int main()
{
	string s1;
	string s2("hello xzy");
	string s3(s2);
	string s4(s2, 6, 8);
	string s5("hello xzy", 5);
	string s6(10, 'x');
	cout << s1 << endl;//输出:
	cout << s2 << endl;//输出:hello xzy
	cout << s3 << endl;//输出:hello xzy
	cout << s4 << endl;//输出:xzy
	cout << s5 << endl;//输出:hello
	cout << s6 << endl;//输出:xxxxxxxxxx
	return 0;
}
2.析构函数(destructor)
~string(); 程序结束前自动调用,释放堆区动态开辟的资源
3.运算符重载(operator)
1.operator=
-  string& operator= (const string& str); 常用。
-  string& operator= (const char* s); 
-  string& operator= (char c); 
int main()
{
	string s1;
	string s2;
	string s3;
	//赋值重载
	s1 = "hello xzy";
	s2 = s1;
	s3 = 'v';
	//拷贝构造
	string s4 = s1;
	cout << s1 << endl;//输出:hello xzy
	cout << s2 << endl;//输出:hello xzy
	cout << s3 << endl;//输出:v
	cout << s4 << endl;//输出:hello xzy
	return 0;
}
2.operator[]
- char& operator[] (size_t pos); 返回字符引用,用于下标访问,且可以修改。常用。
int main()
{
	string s1("hello xzy");
	s1[6] = 'w';
	s1[7] = 'j';
	s1[8] = '\0';
	cout << s1 << endl;//输出:hello wj
	s1[10] = 'A';//下标越界,内部断言assert报错
	return 0;
}
3.operator+=
- string& operator+= (const string& str); 常用。
- string& operator+= (const char* s);
- string& operator+= (char c);
int main()
{
	string s1("hello xzy");
	string s2(" how are you");
	s1 += s2;
	cout << s1 << endl;
	s1 += "???";
	cout << s1 << endl;
	s1 += '!';
	cout << s1 << endl;
	return 0;
}

4.operator+
- string operator+ (const string& lhs, const string& rhs);
- string operator+ (const string& lhs, const char* rhs);
- string operator+ (const char* lhs, const string& rhs);
int main()
{
	string s1("hello");
	string s2 = s1 + " world";
	string s3 = "xzy " + s1;
	string s4 = s2 + s3;
	cout << s2 << endl; //hello world
	cout << s3 << endl; //xzy hello
	cout << s4 << endl; //hello worldxzy hello
	return 0;
}
4.string的四种迭代器(iterator)
迭代器是一种用于遍历容器元素的对象(并非类,而是设计模式中的一种行为模式),它提供了一种通用的访问容器元素的方式,无论容器的类型和数据结构如何。迭代器在C++标准库中被广泛使用,特别是在处理如vector、list、map等容器时。
1.正向迭代器 iterator
返回正向迭代器:可以修改字符串。
- iterator begin(); 返回字符串的第一个字符。
- iterator end(); 返回字符串最后一个有效字符(不含\0)的下一个字符。

2.反向迭代器 reverse_iterator
返回反向迭代器:可以修改字符串。
- reverse_iterator rbegin(); 返回字符串最后一个有效字符(不含\0)。
- reverse_iterator rend(); 返回字符串第一个字符的前一个字符。

3.const修饰的正向迭代器 const_iterator
返回const修饰的正向迭代器:不可以修改字符串。
- const_iterator begin() const;
- const_iterator end() const;
4.const修饰的反向迭代器 const_reverse_iterator
返回const修饰的反向迭代器:不可以修改字符串。
- const_reverse_iterator rbegin() const;
- const_reverse_iterator rend() const;

5.四种迭代器源代码
int main()
{
	string s1("hello xzy");
	string::iterator it = s1.begin();
	while (it != s1.end())
	{
		cout << *it << " ";
		++it;
	}
	cout << endl;
	string s2("hello xzy");
	string::reverse_iterator rit = s2.rbegin();
	while (rit != s2.rend())
	{
		cout << *rit << " ";
		++rit;
	}
	cout << endl;
	const string s3("hello xzy");
	string::const_iterator cit = s3.begin();
	while (cit != s3.end())
	{
		//*cit += 2; s3不能修改
		cout << *cit << " ";
		++cit;
	}
	cout << endl;
	const string s4("hello xzy");
	string::const_reverse_iterator crit = s4.rbegin();
	while (crit != s4.rend())
	{
		//*crit += 2; s4不能修改
		cout << *crit << " ";
		++crit;
	}
	cout << endl;
	return 0;
}

5.string类对象的容量操作
- size_t size() const; 返回字符串有效字符长度(不包括\0)。常用。
- size_t length() const; 返回字符串有效字符长度(不包括\0)。
- size_t capacity() const; 返回空间总大小(不包括\0)。常用。
- void resize (size_t n); 为字符串预留大于等于n的空间(不包括\0),避免扩容,提高效率。常用。
- void clear(); 清空数据,但是一般不清容量。常用。
- bool empty() const; 判断是否为空。常用。
- void resize (size_t n); 只保留前n个数据。
- void resize (size_t n, char c); 保留前n个数据,若n大于容量,后面用字符c补上。
注意:
-  size()与length()方法底层实现原理完全相同,引入size()的原因是为了与其他容器的接口保持一致,一般情况下基本都是用size()。 
-  clear()只是将string中有效字符清空,不改变底层空间大小。 
-  resize(size_t n) 与 resize(size_t n, char c)都是将字符串中有效字符个数改变到n个,不同的是当字符个数增多时:resize(n)用 ‘\0’ 来填充多出的元素空间,resize(size_t n, char c)用字符c来填充多出的元素空间。注意:resize在改变元素个数时,如果是将元素个数增多,可能会改变底层容量的大小,如果是将元素个数减少,底层空间总大小不变。 
-  reserve(size_t res_arg=0):为string预留空间,不改变有效元素个数,当reserve的参数小于string的底层空间总大小时,reserver不会改变容量大小。 
-  在VS2022中的容量变化:有效数据小于16时,数据存放在_buff中,无需扩容;当有效数据大于等于16时,数据存放在_str中,先2倍扩容一次,之后1.5倍扩容。 
-  再linux中的g++编译器中的容量变化:数据只存放在_str中,容量不足就2倍扩容,感觉相当完美! 
//在VS2022下的string类
class string
{
private:
	char* _buff[16]; //有效数据小于16,存放在这里
	char* _str;      //有效数据大于等于16,存放在这里
	size_t _size;
	size_t capacity;
};
int main()
{
	string s;
	size_t sz = s.capacity();
	cout << "capacity changed: " << sz << '\n';
	cout << "making s grow:\n";
	for (int i = 0; i < 100; ++i)
	{
		s.push_back('c');
		if (sz != s.capacity())
		{
			sz = s.capacity();
			cout << "capacity changed: " << sz << '\n';
		}
	}
	cout << "VS2022下的string类的大小:" << sizeof(s) << endl;
	return 0;
}

int main()
{
	string s1("hello xzy how are you");
	cout << s1.length() << endl;   //21
	cout << s1.size() << endl;     //21
	cout << s1.max_size() << endl; //2147483647
	cout << s1.capacity() << endl; //31
	string s2("hello xzy how are you");
	s2.reserve(100);//扩容:不一定扩100,但一定大于等于n,取决于编译器,Linux中的g++编译器扩的是100
	cout << s2.empty() << endl;    //0
	cout << s2.capacity() << endl; //111
	s2.shrink_to_fit();            //缩容
	cout << s2.capacity() << endl; //31
	string s3("hello xzy how are you");
	s3.resize(9);
	cout << s3 << endl; //hello xzy
	s3.resize(15, 'w');
	cout << s3 << endl; //hello xzywwwwww
	return 0;
}
6.string类对象的修改操作
- void push_back (char c); 在字符串后尾插字符c。
- void pop_back(); 在字符串尾删一个字符。
- string& append (const string& str); 在字符串后追加一个字符串。
- string& assign (const string& str, size_t subpos, size_t sublen); 拷贝字符串:从下标为subpos开始,拷贝长度为sublen的字符串到string类对象里面。
- string& insert (size_t pos, const string& str); 在pos位置处插入字符串到string类对象里面。(由于效率问题(移动数据),谨慎使用)。
- string& erase (size_t pos = 0, size_t len = npos); 从pos位置开始删除长度为npos个字符。(由于效率问题(移动数据),谨慎使用)。
- string& replace (size_t pos, size_t len, const string& str); 从pos位置开始的长度为len的子串,替换为str。(伴随着插入与删除,效率低,谨慎使用)。
- void swap (string& str); 交换字符串。
int main()
{
	string s1("hello xzy");
	s1.push_back('!');
	cout << s1 << endl; //hello xzy!
	s1.pop_back();
	cout << s1 << endl; //hello xzy
	s1.append(" how are you");
	cout << s1 << endl; //hello xzy! how are you
	//可以用+=取代尾插
	s1 += "???";
	cout << s1 << endl; //hello xzy! how are you???
	string s2("hello xzy!!!");
	string s3;
	s3.assign(s2, 6, 3);
	cout << s3 << endl; //xzy
	string s4("hello xzy");
	s4.insert(0, "hello wj ");
	cout << s4 << endl; //hello wj hello xzy
	string s5("hello xzy!!!");
	s5.erase(9, 2);
	cout << s5 << endl; //hello xzy!
	string s6("hello xzy!!!");
	s6.replace(6, 5, "wj");
	cout << s6 << endl; //hello wj!
	string s7("hello x hello x");
	string tmp;
	tmp.reserve(s7.size());
	for (auto ch : s7)
	{
		if (ch == 'x')
			tmp += "wj";
		else
			tmp += ch;
	}
	cout << tmp << endl; //hello wj hello wj
	s7.swap(tmp);
	cout << s7 << endl;  //hello wj hello wj
	return 0;
}
- const char* c_str() const; 返回C格式字符串。- 方便调用C中的接口。
int main()
{
	string file;
	cin >> file;
	//c_str()函数用于调用C语言的函数,若直接传string,类型不符合(类和指针)
	FILE* fout = fopen(file.c_str(), "r");
	if (fout == NULL)
	{
		perror("open file fail!");
		exit(1);
	}
	char ch = fgetc(fout);
	while (ch != EOF)
	{
		cout << ch;
		ch = fgetc(fout);
	}
	fclose(fout);
	fout = NULL;
	return 0;
}
7.string类对象的查找操作
- string substr (size_t pos = 0, size_t len = npos) const; 找子串:返回从pos位置开始,长度为npos的string类。
- size_t find (char c, size_t pos = 0) const; 从字符串pos位置开始往后找字符c,返回该字符在字符串中的位置。
- size_t rfind (char c, size_t pos = npos) const; 从字符串pos位置开始往前找字符c,返回该字符在字符串中的位置。
- size_t find_first_of (const char* s, size_t pos = 0) const; 从字符串pos位置开始从前往后找字符串s中出现的字符,返回该字符在字符串中的位置。
- size_t find_last_of (const char* s, size_t pos = npos) const; 从字符串pos位置开始从后往前找字符串s中出现的字符,返回该字符在字符串中的位置。
- size_t find_first_not_of (const char* s, size_t pos = 0) const; 从字符串pos位置开始从前往后找字符串s中没有出现的字符,返回该字符在字符串中的位置。
- size_t find_last_not_of (const char* s, size_t pos = npos) const; 从字符串pos位置开始从后往前找字符串s中没有出现的字符,返回该字符在字符串中的位置。
int main()
{
	//suffix:后缀
	string s1("test.cpp");
	size_t pos1 = s1.find(".");
	string suffix1 = s1.substr(pos1);
	cout << suffix1 << endl; //.cpp
	string s2("test.cpp.zip");
	size_t pos2 = s2.rfind(".");
	string suffix2 = s2.substr(pos2);
	cout << suffix2 << endl; //.zip
	string s3("hello xzy");
	size_t found = s3.find_first_of("xzy");
	while (found != string::npos)
	{
		s3[found] = '*';
		found = s3.find_first_of("xzy", found + 1);
	}
	cout << s3 << endl; //hello ***
	string str1("/user/bin/man");
	cout << endl << str1 << "的路径名与文件名如下:" << endl;
	size_t found1 = str1.find_last_of("/\\");
	cout << "path:" << str1.substr(0, found1) << endl;
	cout << "file:" << str1.substr(found1 + 1) << endl;
	string str2("c:\\windows\\winhelp.exe");
	cout << endl << str2 << "的路径名与文件名如下:" << endl;
	size_t found2 = str2.find_last_of("/\\");
	cout << "path:" << str2.substr(0, found2) << endl;
	cout << "file:" << str2.substr(found2 + 1) << endl;
	return 0;
}
8.string类对象的遍历操作
1.下标 + []
int main()
{
	string s1("hello xzy");
	//1.下标+[]
	for (int i = 0; i < s1.size(); i++)
	{
		s1[i] += 2;//可以修改
		cout << s1[i] << " ";
	}
	cout << endl << s1 << endl;
	return 0;
}

2.迭代器
int main()
{
	string s1("hello xzy");
	//2.迭代器
	string::iterator it = s1.begin();
	while (it != s1.end())
	{
		*it += 2;//可以修改
		cout << *it << " ";
		++it;
	}
	cout << endl << s1 << endl;
	return 0;
}

3.auto和范围for
int main()
{
	string s1("hello xzy");
	//3.范围for:字符赋值,自动迭代,自动判断结束
	//  底层就是迭代器
	for (auto ch : s1)
	{
		ch += 2;//修改ch对于s1无影响,ch是它的拷贝
		cout << ch << ' ';
	}
	cout << endl << s1 << endl;
	return 0;
}

int main()
{
	string s1("hello xzy");
	for (auto& ch : s1)//引用:取别名,就可以修改s1
	{
		ch += 2;
		cout << ch << ' ';
	}
	cout << endl << s1 << endl;
	return 0;
}

1.auto关键字
-  在早期C/C++中auto的含义是:使用auto修饰的变量,是具有自动存储器的局部变量,后来这个不重要了。C++11中,标准委员会变废为宝赋予了auto全新的含义即:auto不再是一个存储类型指示符,而是作为一个 新的类型指示符来指示编译器,auto声明的变量必须由编译器在编译时期 推导而得。
-  用auto声明指针类型时,用auto和auto*没有任何区别,但用auto声明引用类型时则必须加&。 
-  当在同一行声明多个变量时,这些变量必须是相同的类型,否则编译器将会报错,因为编译器实际只对第一个类型进行推导,然后用推导出来的类型定义其他变量。 
-  auto不能作为函数的参数,可以做返回值,但是建议谨慎使用。 
-  auto不能直接用来声明数组。 
#include<map>
//auto不能做参数
//void func1(auto a) error
//{}
//auto可以做返回值,但是建议谨慎使用
auto func2()
{
	return 2;
}
int main()
{
	int a = 10;
	auto b = a;//编译期间自动推导类型
	auto c = 'a';
	auto d = func2();
	//auto e; auto必须初始化,否则不知道开多少空间
	int x = 10;
	auto y = &x;
	auto* z = &x;//可以不写*
	auto& m = x;//必须加上&
	auto aa = 1, bb = 2;//right
	//auto cc = 3, dd = 4.0; error必须始终推导为同一类型
	//auto array[] = { 4, 5, 6 }; error数组不能具有其中包含“auto”的元素类型
	// auto 的价值
	map<string, string> dict; //初始化二叉树
	//map<string, string>::iterator mit = dict.begin();
	auto mit = dict.begin();
	cout << typeid(mit).name() << endl;
	return 0;
}

2.范围for
-  对于一个有范围的集合而言,由程序员来说明循环的范围是多余的,有时候还会容易犯错误。因此C++11中引入了基于范围的for循环。for循环后的括号由冒号“ :”分为两部分:第一部分是范围内用于迭代的变量,第二部分则表示被迭代的范围,自动迭代,自动取数据,自动判断结束。 
-  范围for可以作用到数组和容器对象上进行遍历。 
-  范围for的底层很简单,容器遍历实际就是替换为迭代器,这个从汇编层也可以看到。 
int main()
{
	int array[] = { 1, 2, 3, 4, 5 };
	//范围for适用于《容器》和《数组》
	// C++98的遍历
	for (int i = 0; i < sizeof(array) / sizeof(array[0]); i++)
	{
		cout << array[i] << ' ';
	}
	cout << endl;
	// C++11的遍历
	for (auto& i : array)
	{
		cout << i << ' ';
	}
	cout << endl;
	return 0;
}
四.非成员函数:getline()
- istream& getline (istream& is, string& str, char delim); delim:分隔符
- istream& getline (istream& is, string& str);
类似C语言中的scanf(“%s”, str),但是其遇到空格会停止;
 C++中引入了getline优化了scanf遇到的问题,默认遇到\n才停止,也可以自定义停止字符delim。
例题:字符串最后一个单词的长度

#include <iostream>
#include<string>
using namespace std;
int main() 
{
    string str;
    getline(cin, str);
    size_t pos = str.rfind(' ');
    string sub = str.substr(pos + 1);
    cout << sub.size() << endl;
}
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:jacktools123@163.com进行投诉反馈,一经查实,立即删除!
标签:

