python中的字符串易混知识点

转义字符
Hex值
意义
     \'
27
单引号
    \"
22
双引号
    \\
5C
反斜杠
    \n
0A
换行
    \t
09
Tab键
   \o

八进制
   \x

十六进制







1.转义字符的使用:

在字符串使用中,一些特殊字符前要加上“/”(反斜杠)才可以正常使用,这种还有“/”的字符称为转义字符,如上表所示
其中,在字符串前加r可以防止转义字符被转义,如str=r"hello\n"

2.字符串是可迭代对象,对于字符串str=" abckd" 可以通过for a in str:语句来遍历字符串中的字符。

3.注意ASCII码,Unicode码,utf-8编码,bytes数据之间的区别和转换方式。
首先ASCII码是美国信息交换标准程序代码,用8位定义一个字符,所以使用了0~127定义了128个字符。而因为ASCII容纳的字符有限,所以为了把所有的语系都包括,
就产生了Unicode码,它定义了超过11万的文字,定义方式是以"\u"开头后面有4个十六进制的数字,其中,前128个码值留给ASCII码。unicode常使用的函数是ord()函数,
ord(x): 可以返回函数字符参数x的unicode码值,包括中文字
而utf-8是针对unicode字符集的可变长度编码方式,是internet目前所遵循的编码方式,在这种编码方式下,utf-8使用1~4个byte存储ASCII字符,
而有时从网络上接收的数据时bytes数据,这时需要进行unicode字符串和bytes数据之间的转换,bytes数据格式是在字符串前加上b,将unicode字符串转成bytes数据称为编码,所使用的是encode()函数,如:
string="abc"
stringbytes=string.encode('utf-8')。 #以utf-8的编码方式进行两者之间的转换
>>>stringbytess
b'abc'
而从bytes数据转成unicode数据用的是decode()函数,用法同上。

4.列表和字符串间的转化
可以直接使用list()函数将字符串变为列表
而从列表变为字符串需要使用“ 连接字符串.join(列表)",在这里的连接字符串我们一般使用“”
举例如下:
path=["a","b","c"]
connect="*"
print(connect.join(path))
a*b*c

全部评论

相关推荐

点赞 收藏 评论
分享
牛客网
牛客企业服务