欧美性猛交XXXX免费看蜜桃,成人网18免费韩国,亚洲国产成人精品区综合,欧美日韩一区二区三区高清不卡,亚洲综合一区二区精品久久

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費電子書(shū)等14項超值服

開(kāi)通VIP
真正解決Windows下UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0xff in position 0錯誤的方法

問(wèn)題現象:

在Windows下使用Python讀文件時(shí),經(jīng)常遇到UnicodeDecodeError: 'gbk' codec can't decode byte 0xff in position 0: illegal multibyte sequence錯誤。

在open函數參數中設置encoding='utf-8'也不能解決問(wèn)題,會(huì )出現UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte類(lèi)似錯誤。

問(wèn)題原因:

該問(wèn)題的根源在于Windows中與Unicode的編碼方法。

以系統自帶的記事本為例:
記事本“另存為”中有4種編碼方式,含義為:

  • ANSI: 對英文系統即ASCII 對中文系統即gbk/big5
  • Unicode: UTF-16(LE)
  • Unicode big endian: UTF-16(BE)
  • UTF-8:UTF-8-SIG

其中Unicode相關(guān)編碼方式有3種,這3種編碼方式的區別不再贅述,我們可以從文件的頭部(即Windows中的特色!BOM:byte order mark)來(lái)區分一個(gè)文件是屬于哪種編碼。當頭部開(kāi)始的兩個(gè)字節為 FF FE時(shí),是UTF-16(LE)編碼;當頭部的兩個(gè)字節為FEFF時(shí),是UTF-16(BE)編碼;當頭部?jì)蓚€(gè)字節為EF BB時(shí),是UTF-8-sig編碼。

因此,錯誤信息中0xff說(shuō)明文件的編碼為UTF-16!因此,設置UTF-8編碼根本不解決問(wèn)題。

解決方法:

在open函數encoding參數中設置正確的文件編碼。

推薦使用chardet模塊,檢測文件編碼方式。chardet非標準庫模塊,需要安裝:pip install chardet

示例代碼:

  1. # coding=utf-8
  2. def check_charset(file_path):
  3. import chardet
  4. with open(file_path, "rb") as f:
  5. data = f.read(4)
  6. charset = chardet.detect(data)['encoding']
  7. return charset

  8. your_path = 你的文件路徑
  9. with open(your_path, encoding=check_charset(your_path)) as f:
  10. data = f.read()
  11. print(data)

 

本站僅提供存儲服務(wù),所有內容均由用戶(hù)發(fā)布,如發(fā)現有害或侵權內容,請點(diǎn)擊舉報。
打開(kāi)APP,閱讀全文并永久保存 查看更多類(lèi)似文章
猜你喜歡
類(lèi)似文章
Python 編碼為什么那么蛋疼?
GBK與UTF-8互轉亂碼詳解
dannyrao: 字符編碼
字符編碼問(wèn)題摘要
字符編碼(理論篇)【轉】
編碼歪傳在Windows上做開(kāi)發(fā)的同學(xué),一定要選擇“使用UTF-8無(wú)BOM格式”保存
更多類(lèi)似文章 >>
生活服務(wù)
分享 收藏 導長(cháng)圖 關(guān)注 下載文章
綁定賬號成功
后續可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服

欧美性猛交XXXX免费看蜜桃,成人网18免费韩国,亚洲国产成人精品区综合,欧美日韩一区二区三区高清不卡,亚洲综合一区二区精品久久