Python 字符串切片是一种从给定字符串创建子字符串的方法。在此过程中,我们提取字符串的一部分或片段。通常,我们使用切片运算符“[ : ]”对 Python 字符串执行切片。
字符串索引
在 Python 中,字符串是 Unicode 字符的有序序列。字符串中的每个字符在序列中都有一个唯一索引。索引从 0 开始。字符串中第一个字符的位置索引为 0。索引向字符串末尾不断递增。
如果字符串变量声明为 var="HELLO PYTHON"
,则字符串中每个字符的索引如下:
字符串索引表示
字符 |
H |
E |
L |
L |
O |
|
P |
Y |
T |
H |
O |
N |
索引 |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
Python 允许您通过索引访问字符串中的任何单个字符。在本例中,0 是字符串的下限,11 是字符串的上限。因此,var[0]
返回 H
,var[6]
返回 P
。如果方括号中的索引超出上限,Python 会引发 IndexError
。
例子
在下面的例子中,我们通过索引访问字符串的字符。
var = "HELLO PYTHON"
print(var[0])
print(var[7])
print(var[11])
print(var[12])
运行代码时,它将产生以下输出:
H
Y
N
ERROR!
Traceback (most recent call last):
File "<main.py>", line 5, in <module>
IndexError: string index out of range
Python 字符串负数和正数索引
Python 序列类型(因此也是字符串对象)的独特功能之一是它也具有负索引方案。在上面的示例中,使用正索引方案,其中索引从左到右递增。在负索引的情况下,末尾的字符具有 -1
索引,索引从右到左递减,因此第一个字符 H
具有 -12
索引。
正负索引
例子
让我们使用负索引来获取 N
、Y
和 H
字符。
var = "HELLO PYTHON"
print(var[-1])
print(var[-5])
print(var[-12])
执行上述代码后,将产生以下结果:
N
Y
H
因此,我们可以使用正或负索引从字符串中检索字符。
字符串的不可变性
在 Python 中,字符串是不可变对象。如果对象一旦存储在某个内存位置就无法就地修改,则该对象是不可变的。您可以借助其索引从字符串中检索任何字符,但不能将其替换为另一个字符。
例子
在以下示例中,字符 Y
在 HELLO PYTHON
中的索引为 7
。尝试将 Y
替换为 y
,看看会发生什么。
var="HELLO PYTHON"
var[7]="y"
print (var)
它将产生以下输出:
Traceback (most recent call last):
File "C:\Users\users\example.py", line 2, in <module>
var[7]="y"
~~~^^^
TypeError: 'str' object does not support item assignment
TypeError
是因为字符串是不可变的。
Python 字符串切片
Python 将“:”定义为字符串切片运算符。它从原始字符串返回一个子字符串。其一般用法如下:
substr=var[x:y]
“:”运算符需要两个整数操作数(这两个操作数都可以省略,我们将在后面的示例中看到)。第一个操作数 x
是所需切片的第一个字符的索引。第二个操作数 y
是所需字符串中倒数第二个字符的索引。因此 var(x:y]
将字符从原始字符串的第 x
个位置分隔到第 (y-1)
个位置。
例子
var="HELLO PYTHON"
print ("var:",var)
print ("var[3:8]:", var[3:8])
它将产生以下输出:
var: HELLO PYTHON
var[3:8]: LO PY
使用负索引对 Python 字符串进行切片
与正索引一样,负索引也可以用于切片。
例子
下面的示例显示如何使用负索引对字符串进行切分。
var="HELLO PYTHON"
print ("var:",var)
print ("var[3:8]:", var[3:8])
print ("var[-9:-4]:", var[-9:-4])
它将产生以下输出:
var: HELLO PYTHON
var[3:8]: LO PY
var[-9:-4]: LO PY
字符串切片索引的默认值
Python 切片运算符的两个操作数都是可选的。第一个操作数默认为零,这意味着如果我们不给出第一个操作数,切片将从第 0
个索引处的字符开始,即第一个字符。它将最左边的子字符串切片到“y-1”个字符。
例子
在这个例子中,我们使用默认值执行切片操作。
var="HELLO PYTHON"
print ("var:",var)
print ("var[0:5]:", var[0:5])
print ("var[:5]:", var[:5])
它将产生以下输出:
var: HELLO PYTHON
var[0:5]: HELLO
var[:5]: HELLO
例子
类似地,y
操作数也是可选的。默认情况下,它是“-1”,这意味着字符串将从第 x
个位置开始切片,直到字符串末尾。
var="HELLO PYTHON"
print ("var:",var)
print ("var[6:12]:", var[6:12])
print ("var[6:]:", var[6:])
它将产生以下输出:
var: HELLO PYTHON
var[6:12]: PYTHON
var[6:]: PYTHON
例子
当然,如果两个操作数都没有使用,切片将等于原始字符串。这是因为“x”为 0
,而“y”默认为最后一个索引 + 1(或 -1
)。
var="HELLO PYTHON"
print ("var:",var)
print ("var[0:12]:", var[0:12])
print ("var[:]:", var[:])
它将产生以下输出:
var: HELLO PYTHON
var[0:12]: HELLO PYTHON
var[:]: HELLO PYTHON
例子
为了得到原始字符串的子字符串,左操作数必须小于右操作数。如果左操作数大于右操作数,则 Python 不会引发任何错误,但会返回空字符串。
var="HELLO PYTHON"
print ("var:",var)
print ("var[-1:7]:", var[-1:7])
print ("var[7:0]:", var[7:0])
它将产生以下输出:
var: HELLO PYTHON
var[-1:7]:
var[7:0]:
字符串切片的返回类型
切片返回一个新字符串。您可以很好地执行字符串操作,例如连接,或对切片字符串进行切片。
例子
var="HELLO PYTHON"
print ("var:",var)
print ("var[:6][:2]:", var[:6][:2])
var1=var[:6]
print ("slice:", var1)
print ("var1[:2]:", var1[:2])
它将产生以下输出:
var: HELLO PYTHON
var[:6][:2]: HE
slice: HELLO
var1[:2]: HE