不能在Linux或者類(lèi)UNIX系統的硬盤(pán)上寫(xiě)入數據?想解決服務(wù)器上磁盤(pán)損壞的問(wèn)題嗎?想知道你為什么總是在屏幕上看到“磁盤(pán)已滿(mǎn)”的字眼嗎?想學(xué)習處理這些問(wèn)題的辦法嗎?試試一下這8個(gè)解決Linux及UNIX服務(wù)器硬盤(pán)問(wèn)題的小貼士吧。
#1 - 錯誤: 設備上無(wú)剩余空間
當你的類(lèi)UNIX系統磁盤(pán)寫(xiě)滿(mǎn)了時(shí)你會(huì )在屏幕上看到這樣的信息。本例中,我運行fallocate命令然后我的系統就會(huì )提示磁盤(pán)空間已經(jīng)耗盡:
$ fallocate -l 1G test4.imgfallocate: test4.img: fallocate failed: No space left on device第一步是運行df命令來(lái)查看一個(gè)有分區的文件系統的總磁盤(pán)空間和可用空間的信息:
$ df或者試試可讀性比較強的輸出格式:
$ df -h部分輸出內容:
Filesystem Size Used Avail Use% Mounted on/dev/sda6 117G 54G 57G 49% /udev 993M 4.0K 993M 1% /devtmpfs 201M 264K 200M 1% /runnone 5.0M 0 5.0M 0% /run/locknone 1002M 0 1002M 0% /run/shm/dev/sda1 1.8G 115M 1.6G 7% /boot/dev/sda7 4.7G 145M 4.4G 4% /tmp/dev/sda9 9.4G 628M 8.3G 7% /var/dev/sda8 94G 579M 89G 1% /ftpusers/dev/sda10 4.0G 4.0G 0 100% /ftpusers/tmp使用df命令輸出可以清楚地發(fā)現,在 /dev/sda10 分區下總共4.0Gb的空間被全部寫(xiě)滿(mǎn)了。
修復磁盤(pán)寫(xiě)滿(mǎn)的問(wèn)題
1.用gzip,bzip2或tar命令壓縮未壓縮的日志和其它文件:
gzip /ftpusers/tmp/*.logbzip2 /ftpusers/tmp/large.file.name2.在類(lèi)UNIX系統中用rm命令刪除不想要的文件:
rm -rf /ftpusers/tmp/*.bmp3.用rsync命令移動(dòng)文件至其它系統或外置硬盤(pán):
rsync --remove-source-files -azv /ftpusers/tmp/*.mov /mnt/usbdisk/rsync --remove-source-files -azv /ftpusers/tmp/*.mov server2:/path/to/dest/dir/4.在類(lèi)UNIX系統中找出最占磁盤(pán)空間的目錄或文件:
du -a /ftpusers/tmp | sort -n -r | head -n 10du -cks * | sort -rn | head5.清空指定文件。這招對日志文件很有效:
truncate -s 0 /ftpusers/ftp.upload.log### bash/sh等 ##>/ftpusers/ftp.upload.log## perl ##perl -e'truncate "filename", LENGTH'6.在Linux和UNIX中找出并刪除顯示著(zhù)但已經(jīng)被刪除的大文件:
## 基于Linux/Unix/OSX/BSD等系統 ##lsof -nP | grep '(deleted)'## 只基于Linux ##find /proc/*/fd -ls | grep '(deleted)'清空它:
## 基于Linux/Unix/OSX/BSD等所有系統 ##> "/path/to/the/deleted/file.name"## 只基于Linux ##> "/proc/PID-HERE/fd/FD-HERE"#2 - 文件系統是只讀模式嗎?
當你嘗試新建或保存一個(gè)文件時(shí),你可能最終得到諸如以下的錯誤:
$ cat > file-bash: file: Read-only file system運行mount命令來(lái)查看被掛載的文件系統是否處于只讀狀態(tài):
$ mount$ mount | grep '/ftpusers'在基于Linux的系統中要修復這個(gè)問(wèn)題,只需將這個(gè)處于只讀狀態(tài)的文件系統重新掛載即可:
# mount -o remount,rw /ftpusers/tmp(LCTT 譯注:如果硬盤(pán)由于硬件故障而 fallback 到只讀模式,建議不要強制變回讀寫(xiě)模式,而是趕快替換硬盤(pán))
另外,我是這樣用rw模式重新掛載FreeBSD 9.x服務(wù)器的根目錄的:
# mount -o rw /dev/ad0s1a /#3 - Am I running out of inodes?
有時(shí)候,df命令能顯示出磁盤(pán)有空余的空間但是系統卻聲稱(chēng)文件系統已經(jīng)寫(xiě)滿(mǎn)了。此時(shí)你需要用以下命令來(lái)檢查能在文件系統中識別文件及其屬性的索引節點(diǎn):
$ df -i$ df -i /ftpusers/部分輸出內容:
Filesystem Inodes IUsed IFree IUse% Mounted on/dev/sda8 6250496 11568 6238928 1% /ftpusers如上 /ftpusers 下有總計62,50,496KB大小的索引節點(diǎn)但是只有11,568KB被使用。你可以在 /ftpusers 位置下另外創(chuàng )建62,38,928KB大小的文件。如果你的索引節點(diǎn)100%被使用了,試試看以下的選項:
找出不想要的文件并刪除它,或者把它移動(dòng)到其它服務(wù)器上。找出不想要的大文件并刪除它,或者把它移動(dòng)到其它服務(wù)器上。(LCTT 譯注:如果一個(gè)分區存儲了太多的小文件,會(huì )出現 inode 用完而存儲扇區還有空閑的情況,這種情況下要么清除小文件或在不需要獨立訪(fǎng)問(wèn)的情況下將它們打包成一個(gè)大文件;要么將數據保存好之后重新分區,并設置分區的 -t news 屬性,增加 inode 分配)
#4 - 我的硬盤(pán)驅動(dòng)器宕了嗎?
日志文件中的輸入/輸出錯誤(例如 /var/log/messages)說(shuō)明硬盤(pán)出了一些問(wèn)題并且可能已經(jīng)失效,你可以用smartctl命令來(lái)查看硬盤(pán)的錯誤,這是一個(gè)在類(lèi)UNIX系統下控制和監控硬盤(pán)狀態(tài)的一個(gè)命令。語(yǔ)法如下:
smartctl -a /dev/DEVICE# 在Linux服務(wù)器下檢查 /dev/sda smartctl -a /dev/sda你也可以用"Disk Utility"這個(gè)軟件來(lái)獲得同樣的信息。

圖 01: Gnome磁盤(pán)工具(Applications > System Tools > Disk Utility)
注意: 不要對S.M.A.R.T.工具期望太高,它在某些狀況下無(wú)法工作,我們要定期做備份。
#5 - 我的硬盤(pán)驅動(dòng)器和服務(wù)器是不是太熱了?
高溫會(huì )引起服務(wù)器低效,所以你需要把服務(wù)器和磁盤(pán)維持在一個(gè)平穩適當的溫度,高溫甚至能導致服務(wù)器宕機或損壞文件系統和磁盤(pán)。用hddtemp或smartctl功能,通過(guò)從支持S.M.A.R.T.功能的硬盤(pán)上讀取數據的方式,從而查出你的Linux或基于UNIX系統上的硬盤(pán)溫度。只有現代硬驅動(dòng)器有溫度傳感器。hddtemp功能也支持從SCSI驅動(dòng)器讀取S.M.A.R.T.信息。hddtemp能作為一個(gè)簡(jiǎn)單的命令行工具或守護程序來(lái)從所有服務(wù)器中獲取信息:
hddtemp /dev/DISKhddtemp /dev/sg0部分輸出內容如下:

圖 02: hddtemp正在運行
你也可以像下面顯示的那樣使用smartctl命令:
smartctl -d ata -A /dev/sda | grep -i temperature我怎么獲取CPU的溫度
你可以使用Linux硬件監控工具,例如像用基于Linux系統的lm_sensor功能來(lái)獲取CPU溫度:
sensorsDebian服務(wù)器的部分輸出內容:
圖 03: sensors命令提供了一臺Linux計算機的CPU核心溫度和其它信息
#6 - 處理?yè)p壞的文件系統
服務(wù)器上的文件系統可能會(huì )因為硬件重啟或一些其它的錯誤比如壞的扇區而損壞。你可以用fsck命令來(lái)修復損壞的文件系統:
umount /ftpusersfsck -y /dev/sda8來(lái)看看怎么應對Linux文件系統故障的更多信息。
#7 - 處理Linux中的軟陣列
輸入以下命令來(lái)查看Linux軟陣列的最近狀態(tài):
## 獲得 /dev/md0 上磁盤(pán)陣列的具體內容 ##mdadm --detail /dev/md0## 查看狀態(tài) ##cat /proc/mdstatwatch cat /proc/mdstat部分輸出內容:
圖 04: 查看Linux軟陣列狀態(tài)命令
你需要把有故障的硬件驅動(dòng)器更換掉,別刪錯了。本例中,我更換了 /dev/sdb (RAID 6中的第二個(gè)硬件驅動(dòng)器)。沒(méi)必要依靠離線(xiàn)存儲文件來(lái)修復Linux上的磁盤(pán)陣列,因為這只在你的服務(wù)器支持熱插拔硬盤(pán)的情況下才能工作:
## 從一個(gè)md0陣列中刪除磁盤(pán) ##mdadm --manage /dev/md0 --fail /dev/sdb1mdadm --manage /dev/md0 --remove /dev/sdb1# 對 /dev/sdbX 的剩余部分做相同操作 ### 如果不是熱插拔硬盤(pán)就執行關(guān)機操作 ##shutdown -h now## 從 /dev/sda 復制分區表至新的 /dev/sdb 下 ##sfdisk -d /dev/sda | sfdisk /dev/sdbfdisk -l## 添加 ##mdadm --manage /dev/md0 --add /dev/sdb1# 對 /dev/sdbX 的剩余部分做相同操作 ### 現在md0會(huì )再次同步,通過(guò)顯示屏查看 ## watch cat /proc/mdstat來(lái)看看加快Linux磁盤(pán)陣列同步速度的小貼士來(lái)獲取更多信息。
#8 - 處理硬陣列
你可以用samrtctl命令或者供應商特定的命令來(lái)查看磁盤(pán)陣列和你所管理的磁盤(pán)的狀態(tài):
## SCSI磁盤(pán) smartctl -d scsi --all /dev/sgX## Adaptec磁盤(pán)陣列/usr/StorMan/arcconf getconfig 1## 3ware磁盤(pán)陣列tw_cli /c0 show對照供應商特定文檔來(lái)更換你的故障磁盤(pán)。
聯(lián)系客服