好程序員Python培訓分享Python系列之字符串的使用,在講解今天的內容之前,先來(lái)回答一個(gè)可能會(huì )讓大家感到費解的問(wèn)題:為什么字符串類(lèi)型(str)可以通過(guò)調用方法的方式進(jìn)行操作,而之前我們用到的數值類(lèi)型(如int、float)卻沒(méi)有可以調用的方法。在Python中,數值類(lèi)型是標量類(lèi)型,也就是說(shuō)這種類(lèi)型的變量沒(méi)有可以訪(fǎng)問(wèn)的內部結構;而字符串類(lèi)型是一種結構化的、非標量類(lèi)型,所以才會(huì )有一系列的方法可供調用。如果對這一點(diǎn)感到困惑,那就繼續學(xué)習吧,等學(xué)習完面向對象編程的知識后,你就能找到這些問(wèn)題的答案了。
接下來(lái)我們通過(guò)一些案例來(lái)為大家講解函數和字符串的應用。
說(shuō)明:驗證碼由數字和英文大小寫(xiě)字母構成。
import random
ALL_CHARS = '0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ'
def generate_code(code_len=4):
"""生成指定長(cháng)度的驗證碼
:param code_len: 驗證碼的長(cháng)度(默認4個(gè)字符)
:return: 由大小寫(xiě)英文字母和數字構成的隨機驗證碼字符串
"""
code = ''
for _ in range(code_len):
# 產(chǎn)生0到字符串長(cháng)度減1范圍的隨機數作為索引
index = random.randrange(0, len(ALL_CHARS))
# 利用索引運算從字符串中取出字符并進(jìn)行拼接
code += ALL_CHARS[index]
return code
我們用下面的代碼生成10組隨機驗證碼來(lái)測試上面的函數。
for _ in range(10):
print(generate_code())
上面的函數其實(shí)還有一種更為簡(jiǎn)單的寫(xiě)法,直接利用random模塊的隨機抽樣函數從字符串中取出指定數量的字符,然后利用字符串的join方法將選中的那些字符拼接起來(lái)。此外,可以利用Python標準庫中的string 模塊來(lái)獲得數字和英文字母的字面常量。
import random
import string
ALL_CHARS = string.digits + string.ascii_letters
def generate_code(code_len=4):
"""生成指定長(cháng)度的驗證碼
:param code_len: 驗證碼的長(cháng)度(默認4個(gè)字符)
:return: 由大小寫(xiě)英文字母和數字構成的隨機驗證碼字符串
"""
return ''.join(random.choices(ALL_CHARS, k=code_len))
說(shuō)明:random模塊的sample和choices函數都可以實(shí)現隨機抽樣,sample實(shí)現無(wú)放回抽樣,這意味著(zhù)抽樣取出的字符是不重復的;choices實(shí)現有放回抽樣,這意味著(zhù)可能會(huì )重復選中某些字符。這兩個(gè)函數的第一個(gè)參數代表抽樣的總體,而參數k代表抽樣的數量。
說(shuō)明:文件名通常是一個(gè)字符串,而文件的后綴名指的是文件名中最后一個(gè).后面的部分,也稱(chēng)為文件的擴展名,它是某些操作系統用來(lái)標記文件類(lèi)型的一種機制,例如在Windows系統上,后綴名exe表示這是一個(gè)可執行程序,而后綴名txt表示這是一個(gè)純文本文件。需要注意的是,在Linux和macOS系統上,文件名可以以.開(kāi)頭,表示這是一個(gè)隱藏文件,像.gitignore這樣的文件名,.后面并不是后綴名,這個(gè)文件沒(méi)有后綴名或者說(shuō)后綴名為''。
def get_suffix(filename):
"""獲取文件名的后綴名
:param filename: 文件名
:return: 文件的后綴名
"""
# 從字符串中逆向查找.出現的位置
pos = filename.rfind('.')
# 通過(guò)切片操作從文件名中取出后綴名
return filename[pos + 1:] if pos > 0 else ''
可以用下面的代碼對上面的函數做一個(gè)簡(jiǎn)單的測驗。
print(get_suffix('readme.txt')) # txt
print(get_suffix('readme.txt.md')) # md
print(get_suffix('.readme')) #
print(get_suffix('readme.')) #
print(get_suffix('readme')) #
上面的get_suffix函數還有一個(gè)更為便捷的實(shí)現方式,就是直接使用os.path模塊的splitext函數,這個(gè)函數會(huì )將文件名拆分成帶路徑的文件名和擴展名兩個(gè)部分,然后返回一個(gè)二元組(下節課會(huì )講到元組),二元組中的第二個(gè)元素就是文件的后綴名(包含.),如果要去掉后綴名中的.,可以做一個(gè)字符串的切片操作,代碼如下所示。
from os.path import splitext
def get_suffix(filename):
return splitext(filename)[1][1:]
說(shuō)明:實(shí)現跑馬燈文字的原理非常簡(jiǎn)單,把當前字符串的第一個(gè)字符放到要輸出的內容的最后面,把從第二個(gè)字符開(kāi)始后面的內容放到要輸出的內容的最前面,通過(guò)循環(huán)重復這個(gè)操作,就可以看到滾動(dòng)起來(lái)的文字。兩次循環(huán)之間的間隔可以通過(guò)time模塊的sleep函數來(lái)實(shí)現,而清除屏幕上之前的輸出可以使用os模塊的system函數調用系統清屏命令來(lái)實(shí)現。
import os
import time
content = '北 京 歡 迎 你 為 你 開(kāi) 天 辟 地 '
while True:
# Windows清除屏幕上的輸出
# os.system('cls')
# macOS清除屏幕上的輸出
os.system('clear')
print(content)
# 休眠0.2秒(200毫秒)
time.sleep(0.2)
content = content[1:] + content[0]
提示:我們之前建議大家暫時(shí)用VS Code來(lái)編寫(xiě)Python代碼,在“命令行提示符”或“終端”中來(lái)運行Python程序。如果你已經(jīng)提前開(kāi)始使用PyCharm了,需要提醒一句:PyCharm的運行窗口無(wú)用上面的方式做清屏處理。想看到上面代碼的運行效果,建議在“命令行提示符”或“終端”中運行程序。
在寫(xiě)代碼尤其是開(kāi)發(fā)商業(yè)項目的時(shí)候,一定要有意識的將相對獨立且重復出現的功能封裝成函數,這樣不管是自己還是團隊的其他成員都可以通過(guò)調用函數的方式來(lái)使用這些功能。字符串是非常重要的數據類(lèi)型,字符串的常用運算和方法需要掌握,因為一般的商業(yè)項目中,處理字符串比處理數值的操作要更多。
聯(lián)系客服