用C++定义一个字符串string类?

C++提供了一种新的数据类型——字符串类型(string类型),在使用上和char、int类型一样,可以用来定义变量,这就是字符串变量

实际上,string并不是C++本身具有的基本类型,它是C++标准库中声明的一共字符串类,用这种类可以定义对象。每一个字符串变量都是string类的一个对象。

1.字符串变量的定义和引用

和其他类型变量一样,字符串变量必须先定义后使用,定义字符串变量要用类名string,如:

注意:要使用string类的功能时,必须在本文件的开头将C++标准库中的string头文件包含进来,即应加上

(2)对字符串变量的赋值

在定义了字符串变量后,可以用赋值语句对它赋予一个字符串常量,如:

既可以用字符串常量给字符串变量赋值,也可以用一个字符串变量给另一个字符串变量赋值。

不要求string2和string1长度相同。在定义字符串变量时不需要指定长度,它的长度随其中的字符串长度而改变。

字符串常量以‘\0‘作为结束符,但将字符串常量存放到字符串变量中时,只存放字符串本身而不包括‘\0‘

因此字符串变量word 中的字符为“Than”共四个字符,而不是“Than”再加‘\0‘。

(3)字符串变量的输入输出

在输入输出语句中用字符串变量名,输入输出字符串,如:

在以字符数组存放字符串时,要用strcat(连接)、strcmp(比较)、strcpy(复制),而对string类对象,可以不用这些函数,而直接用简单的运算符。

(1)字符串复制用赋值号

(2)字符串比较直接用关系运算符

可以用==(等于)、>(大于)、<(小于)、!=(不等于)、>=(大于或等于)、<=(小于或等于)等关系运算符来进行字符串的比较。

不仅可以用string定义字符串变量,也可以用string定义字符串数组。

此时name数组的状况是:

在一个字符串数组中包含若干个元素,每一个元素相当于一个字符串变量;

在字符串数组的每一个元素存放一个字符串,而不是一个字符,这是与字符数组的区别。

在每一个字符串元素中只包含字符串本身的字符而不包括‘\0’

}
  • 为什么选择使用 string 来表示字符串?char 不足够吗?

    在 C++ 中,字符的数据类型是 char,但是使用 char 只能表示单个字符

    若要表示一个字符串,就需要使用字符数组 char[]

    可是,在使用 char[] 时有一个弊端:

    如果需要输出字符串时,需要循环遍历字符数组中的每一个元素。

    这种时候,使用 string 类会更方便处理字符串。

    1. 没有固定的长度,不需要提前确认存储的字符串长度

    2. 直接将字符串存为一个变量,而不是多个字符

1. 头文件 + 命名空间

由于 string 属于命名空间 std 的范畴,因此,也需要声明使用的命名空间。

// 方法1:直接声明使用整个命名空间 // 方法2:不直接声明整个命名空间,在使用 string 时需要用:

// (A) 定义一个默认的空字符串
// (C) 用已有的字符串构造新的字符串
// (D) 用单个字符进行构造

// 方法1:读取字符串,遇到空格时停止 // 方法2:读取完整的一行 // 方法3:读取,直到指定的分隔符才停止 使用以上三种方法,得到的 name 为:

// 比较字符串大小(字典序考前的较小) // 转换为 C 风格字符串

// 拼接不同的字符或字符串

6. 数值 → 字符串

太短会自动补零,太长也会造成精度损失 */

7. 字符串 → 数值

// 将 string 中的整数转换成 int,同时返回转换的长度 // 自动检查进制,转换成10进制的 int

// 在指定下标的位置插入字符串
// 删除指定下标位置开始的所有字符
// 从指定下标位置开始,删除指定数量的元素

// 从指定下标位置开始提取指定数量的元素

// 查找并返回子字符串第一次出现的下标位置

内容来源于网络如有侵权请私信删除

}

  本人c++新手,最近用C++,发现c++里面需要处理的字符串类型让我头疼,通过查阅资料,总结在此,供日后查阅,也请前辈不吝赐教,指出不足。  

   一个 BSTR 由头部和字符串组成,头部包含了字符串的长度信息,字符串中可以包含嵌入的 null 值。
   BSTR 是以指针的形式进行传递的。(指针是一个变量,包含另外一个变量的内存地址,而不是数据。) BSTR 是 Unicode 的,即每个字符需要两个字节。 BSTR 通常以两字节的 null 字符结束。 wstr是宽字符,以双字节表示一个字符 bstr是为了与原先的basic字符兼容,它的最前面的4个字节为其长度,以'\0'结束.

4.4.更进一步的字符串以及其指针的类型定义 

由于Win32 API文档的函数列表使用函数的常用名字(例如, "SetWindowText"),所有的字符串都是用TCHAR来定义的。(除了XP中引入的只适用于Unicode的API)。下面列出一些常用的typedefs,你可以在msdn中看到他们。

  UNICODE:它是用两个字节表示一个字符的方法。比如字符'A'在ASCII下面是一个字符,可'A'在UNICODE下面是两个字符,高字符用0填充,而且汉字'程'在ASCII下面是两个字节,而在UNICODE下仍旧是两个字节。UNICODE的用处就是定长表示世界文字,据统计,用两个字节可以编码现存的所有文字而没有二义。MBCS,它是多字节字符集,它是不定长表示世界文字的编码。

  MBCS表示英文字母时就和ASCII一样(这也是我们容易把MBCS和ASCII搞混的原因),但表示其他文字时就需要用多字节。WINDOWS

LPSTR:32bit指针 指向一个字符串,每个字符占1字节

LPCSTR:32-bit指针 指向一个常字符串,每个字符占1字节
LPCTSTR:32-bit指针 指向一个常字符串,每字符可能占1字节或2字节,取决于Unicode是否定义

Windows使用两种字符集ANSI和UNICODE,前者就是通常使用的单字节方式,但这种方式处理象中文这样的双字节字符不方便,容易出现半个汉字的情况。而后者是双字节方式,方便处理双字节字符。

WindowsNT 的所有与字符有关的函数都提供两种方式的版本,而Windows9x只支持ANSI方式。_T一般同字常数相关,如_T("Hello"。如果你编译一个程序为ANSI方式,_T实际不起任何作用。而如果编译一个程序为UNICODE方式,则编译器会把"Hello"字符串以UNICODE方式保存。_T 和_L的区别在于,_L不管你是以什么方式编译,一律UNICODE方式保存.

而且MS推荐你使用相匹配的字符串函数。

T是非常有意思的一个符号(TCHAR、LPCTSTR、LPTSTR、_T()、_TEXT()...),它表示使用一种中间类型,既不明确表示使用 MBCS,也不明确表示使用 UNICODE。那到底使用哪种字符集?编译的时候才决定 

首先char*   是指向ANSI字符数组的指针,其中每个字符占据8位(有效数据是除掉最高位的其他7位),这里保持了与传统的C,C++的兼容。      

LPSTR是一个指向以‘/0’结尾的ANSI字符数组的指针,与char*可以互换使用,在win32中较多地使用 LPSTR。而LPCSTR中增加的‘C’的含义是“CONSTANT”(常量),表明这种数据类型的实例不能被使用它的API函数改变,除此之外,它与 LPSTR是等同的。    

    为了满足程序代码国际化的需要,业界推出了Unicode标准,它提供了一种简单和一致的表达字符串的方法,所有字符中的字节都是16位的值,其数量也可以满足差不多世界上所有书面语言字符的编码需求,开发程序时使用Unicode(类型为wchar_t)是一种被鼓励的做法。    

CString类中的字符就是被声明为TCHAR类型的,它提供了一个封装好的类供用户方便地使用。

L表示long指针,这是为了兼容Windows 3.1等16位操作系统遗留下来的,在win32中以及其他的32为操作系统中, long指针和near指针及far修饰符都是为了兼容的作用。没有实际意义。P表示这是一个指针,C表示是一个常量,T表示在Win32环境中, 有一个_T宏,这个宏用来表示你的字符是否使用UNICODE, 如果你的程序定义了UNICODE或者其他相关的宏,那么这个字符或者字符串将被作为UNICODE字符串,否则就是标准的ANSI字符串,STR表示这个变量是一个字符串,所以LPCTSTR就表示一个指向常固定地址的可以根据一些宏定义改变语义的字符串。
同样, LPCSTR就只能是一个ANSI字符串,在程序中我们大部分时间要使用带T的类型定义。

CString 和 LPCTSTR 可以说通用。 原因在于CString定义的自动类型转换,没什么奇特的,最简单的C++操作符重载而已。

常量字符串ansi和unicode的区分是由宏_T来决定的。但是用_T("abcd")时,字符串"abcd"就会根据编译时的是否定一_UNICODE来决定是char* 还是 w_char*。 同样,TCHAR 也是相同目的字符宏。看看定义就明白了。简单起见,下面只介绍 ansi 的情况,unicode 可以类推。

但是 LPTSTR又不同了,他是 char*, 意味着你随时可能修改里面的数据,这就需要内存管理了(如字符串变长,原来的存贮空间就不够了,则需要重新调整分配内存)。
就是这种不安全的使用方法。
这个地方使用的是强制类型转换,你都强制转换了,C++编译器当然不会拒绝你,但同时他也认为你确实知道自己要做的是什么。因此是不会给出警告的。
强制的任意类型转换是C(++)的一项强大之处,但也是一大弊端。这一问题在 vc6 以后的版本(仅针对vc而言)中得到逐步的改进(你需要更明确的类型转换声明)。

其实在很多地方都可以看到类似
地用法,这种情况一般是函数的约束定义不够完善的原因,比如一个函数接受一个字符串参数的输入,里面对该字符串又没有任何的修改,那么该参数就应该定义成 const char*,但是很多初学者弄不清const地用法,或者是懒, 总之就是随意写成了 char* 。 这样子传入CString时就需要强制的转换一下。

这种做法是不安全的,也是不被建议的用法,你必须完全明白、确认该字符串没有被修改。

CString 转换到 LPTSTR (char*), 预定的做法是调用CString的GetBuffer函数,使用完毕之后一般都要再调用ReleaseBuffer函数来确认修改 (某些情况下也有不调用ReleaseBuffer的,同样你需要非常明确为什么这么做时才能这样子处理,一般应用环境可以不考虑这种情况)。

 6.字符串与其他类型那个转换

1) 在C标准库里面,使用atoi:

}

我要回帖

更多关于 string定义字符串 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信