Python字串


字串是Python中最受歡迎、最常使用的資料型別。可以通過用引號括起字元來建立它們。 Python將單引號與雙引號相同。建立字串和向一個變數賦值一樣簡單。 例如 -

var1 = 'Hello World!'
var2 = "Python Programming"

1.存取字串中的值

Python不支援字元型別; 字元會被視為長度為1的字串,因此也被認為是一個子字串。要存取子串,請使用方括號的切片加上索引或直接使用索引來獲取子字串。 例如 -

#!/usr/bin/python3

var1 = 'Hello World!'
var2 = "Python Programming"

print ("var1[0]: ", var1[0])
print ("var2[1:5]: ", var2[1:5]) # 切片加索引

當執行上述程式碼時,會產生以下結果 -

var1[0]:  H
var2[1:5]:  ytho

2.更新字串

可以通過將變數分配給另一個字串來「更新」現有的字串。 新值可以與其原值相關或完全不同的字串。 例如 -

#!/usr/bin/python3

var1 = 'Hello World!'

print ("Updated String :- ", var1[:6] + 'Python')

當執行上述程式碼時,會產生以下結果 -

Updated String :-  Hello Python

3.跳脫字元

下表是可以用反斜槓表示法表示跳脫或不可列印字元的列表。單引號以及雙引號字串的跳脫字元被解析。

反斜線符號 十六進位制字元 描述/說明
\a 0x07 鈴聲或警報
\b 0x08 退格
\cx Control-x
\C-x Control-x
\e 0x1b Escape
\f 0x0c 換頁
\M-\C-x Meta-Control-x
\n 0x0a 新一行
\nnn 八進位制符號,其中n在0.7範圍內
\r 0x0d 回車返回
\s 0x20 空格
\t 0x09 製表符
\v 0x0b 垂直製表符
\x 字元x
\xnn 十六進位制符號,其中n0~9a~fA~F範圍內

4.字串特殊運算子

假設字串變數a儲存字串值’Hello‘,變數b儲存字串值’Python‘,那麼 -

運算子 說明 範例
+ 連線 - 將運算子的兩邊的值新增 a + b 結果為 HelloPython
* 重複 - 建立新字串,連線相同字串的多個副本 a*2 結果為 HelloHello
[] 切片 - 給出指定索引中的字串值,它是原字串的子串。 a[1] 結果為 e
[:] 範圍切片 - 給出給定範圍內的子字串 a[1:4] 結果為 ell
in 成員關係 - 如果給定字串中存在指定的字元,則返回true 'H' in a 結果為 1
not in 成員關係 - 如果給定字串中不存在指定的字元,則返回true 'Y' not in a 結果為 1
r/R 原始字串 - 抑制跳脫字元的實際含義。原始字串的語法與正常字串的格式完全相同,除了原始字串運算子在引號之前加上字母「r」。 「r」可以是小寫(r)或大寫(R),並且必須緊靠在第一個引號之前。 print(r'\n') 將列印 \n ,或者 print(R'\n') 將列印 \n,要注意的是如果不加rR作為字首,列印的結果就是一個換行。
% 格式 - 執行字串格式化 請參見本文第5節

5.字串格式化運算子

Python最酷的功能之一是字串格式運算子。 這個操作符對於字串是獨一無二的,彌補了C語言中 printf()系列函式。 以下是一個簡單的例子 -

#!/usr/bin/python3

print ("My name is %s and weight is %d kg!" % ('Maxsu', 71))

當執行上述程式碼時,會產生以下結果 -

My name is Maxsu and weight is 71 kg!

以下是可以與%符號一起使用的完整符號集列表 -

編號 格式化符號 轉換
1 %c 字元
2 %s 在格式化之前通過str()函式轉換字串
3 %i 帶符號的十進位制整數
4 %d 帶符號的十進位制整數
5 %u 無符號十進位制整數
6 %o 八進位制整數
7 %x 十六進位制整數(小寫字母)
8 %X 十六進位制整數(大寫字母)
9 %e 指數符號(小寫字母’e‘)
10 %E 指數符號(大寫字母’E
11 %f 浮點實數
12 %g %f%e
13 %G %f%E

其他支援的符號和功能如下表所列 -

編號 符號 功能
1 * 引數指定寬度或精度
2 - 左對齊
3 + 顯示標誌或符號
4 <sp> 在正數之前留空格
5 # 根據是否使用「x」或「X」,新增八進位制前導零(‘0‘)或十六進位制前導’0x‘或’0X‘。
6 0 使用零作為左邊墊符(而不是空格)
7 % %%‘留下一個文字「%
8 (var) 對映變數(字典引數)
9 m.n. m是最小總寬度,n是小數點後顯示的位數(如果應用)

6.三重引號

Python中的三重引號允許字串跨越多行,包括逐字記錄的新一行,TAB和任何其他特殊字元。

三重引號的語法由三個連續的單引號或雙引號組成。

#!/usr/bin/python3

para_str = """this is a long string that is made up of
several lines and non-printable characters such as
TAB ( \t ) and they will show up that way when displayed.
NEWLINEs within the string, whether explicitly given like
this within the brackets [ \n ], or just a NEWLINE within
the variable assignment will also show up.
"""
print (para_str)

當執行上述程式碼時,會產生以下結果。注意每個單獨的特殊字元如何被轉換成其列印形式,它是直到最後一個NEWLINEs在「up」之間的字串的末尾,並關閉三重引號。 另請注意,NEWLINEs可能會在一行或其跳脫碼(\n)的末尾顯式顯示回車符 -

this is a long string that is made up of
several lines and non-printable characters such as
TAB (    ) and they will show up that way when displayed.
NEWLINEs within the string, whether explicitly given like
this within the brackets [
 ], or just a NEWLINE within
the variable assignment will also show up.

原始字串根本不將反斜槓視為特殊字元。放入原始字串的每個字元都保持所寫的方式 -

#!/usr/bin/python3

print ('C:\\nowhere')

當執行上述程式碼時,會產生以下結果 -

C:\nowhere

現在演示如何使用原始的字串。將表示式修改為如下 -

#!/usr/bin/python3

print (r'C:\\nowhere')

當執行上述程式碼時,會產生以下結果 -

C:\\nowhere

7.Unicode字串

Python 3中,所有的字串都用Unicode表示。在Python 2內部儲存為8位ASCII,因此需要附加’u‘使其成為Unicode,而現在不再需要了。

內建字串方法

Python包括以下內建方法來操作字串 -

編號 方法 說明
1 capitalize() 把字串的第一個字母轉為大寫
2 center(width, fillchar) 返回使用fillchar填充的字串,原始字串以總共width列為中心。
3 count(str, beg = 0,end = len(string)) 計算字串中出現有多少次str或字串的子字串(如果開始索引beg和結束索引end,則在beg~end範圍匹配)。
4 decode(encoding = ‘UTF-8’,errors = ‘strict’) 使用編碼encoding解碼該字串。 編碼預設為預設字串encoding
5 encode(encoding = ‘UTF-8’,errors = ‘strict’) 返回字串的編碼字串版本; 在錯誤的情況下,預設是丟擲ValueError,除非使用’ignore‘或’replace‘給出錯誤。
6 endswith(suffix, beg = 0, end = len(string)) 確定字串或字串的子字串(如果啟動索引結束和結束索引結束)都以字尾結尾; 如果是則返回true,否則返回false
7 expandtabs(tabsize = 8) 將字串中的製表符擴充套件到多個空格; 如果沒有提供tabize,則預設為每個製表符為8個空格。
8 find(str, beg = 0 end = len(string)) 如果索引beg和結束索引end給定,則確定str是否在字串或字串的子字串中,如果找到則返回索引,否則為-1
9 index(str, beg = 0, end = len(string)) find()相同,但如果沒有找到str,則引發異常。
10 isalnum() 如果字串至少包含1個字元,並且所有字元均為數位,則返回true,否則返回false
11 isalpha() 如果字串至少包含1個字元,並且所有字元均為字母,則返回true,否則返回false
12 isdigit() 如果字串只包含數位則返回true,否則返回false
13 islower() 如果字串至少包含1個字母,並且所有字元均為小寫,則返回true,否則返回false
14 isnumeric() 如果unicode字串只包含數位字元,則返回true,否則返回false
15 isspace() 如果字串只包含空格字元,則返回true,否則返回false
16 istitle() 如果字串正確「標題大小寫」,則返回true,否則返回false
17 isupper() 如果字串至少包含一個可變大小寫字元,並且所有可變大小寫字元均為大寫,則返回true,否則返回false
18 join(seq) 將序列seq中的元素以字串表示合併(併入)到具有分隔符字串的字串中。
19 len(string) 返回字串的長度
20 ljust(width[, fillchar]) 返回一個空格填充的字串,原始字串左對齊到總共width列。
21 lower() 將字串中的所有大寫字母轉換為小寫。
22 lstrip() 刪除字串中的所有前導空格
23 maketrans() 返回在translate函式中使用的轉換表。
24 max(str) 從字串str返回最大字母字元。
27 replace(old, new [, max]) 如果給定max值,則用new或最多最大出現替換字串中所有出現的舊字元(old)。
28 rindex( str, beg = 0, end = len(string)) index()相同,但在字串中向後搜尋。
29 rjust(width,[, fillchar]) 返回一個空格填充字串,原始字串右對齊到總共寬度(width)列。
30 rstrip() 刪除字串的所有尾隨空格。
31 split(str= 根據分隔符str(空格,如果沒有提供)拆分字串並返回子字串列表; 如果給定,最多分割為num子串。
32 splitlines( num=string.count(‘\n’)))」) 全部拆分字串(或num)新行符,並返回每行的列表,並刪除新行符。
33 startswith(str, beg=0,end=len(string)) 確定字串或字串的子字串(如果給定起始索引beg和結束索引end)以str開頭; 如果是則返回true,否則返回false
34 strip([chars]) 對字串執行lstrip()rstrip()
35 swapcase() 反轉在字串中的所有字母大小寫,即小寫轉大寫,大寫轉小寫。
36 title() 返回字串的標題版本,即所有單詞第一個字母都以大寫開頭,其餘的都是小寫的。
37 translate(table, deletechars= 根據轉換表STR(256個字元),除去那些在del字串轉換字串。
38 upper() 將字串中的小寫字母轉換為大寫。
39 zfill(width) 返回原始字串,左邊填充為零,總共有寬度(width)字元; 對於數位zfill()保留給定的任何符號(少於一個零)。
40 isdecimal() 如果unicode字串只包含十進位制字元,則返回true,否則返回false