經(jīng)常你寫(xiě)了一個(gè)程序,一測試,功能沒(méi)問(wèn)題,一看內存占用也不多,就不去考慮其它的東西了。但可能程序使用了一個(gè)什么數據結構,會(huì )當數據規模變大時(shí),內存占用激增。
基本&&關(guān)鍵的問(wèn)題是,Java里各種東東占多少內存?????????
對于primitive類(lèi)型,有8個(gè)
byte short int long float double char boolean 它們的長(cháng)度分別是
1 2 4 8 4 8 2 1
這個(gè)不羅嗦了,舉例來(lái)說(shuō)
long[] data=new long[1000];
占用內存 8*1000 bytes
此外,data本身是一個(gè)Object,也占用內存若干,后敘,當然它針對 8*1000來(lái)說(shuō),忽略不計
再說(shuō)Object的占用,在說(shuō)這個(gè)之前,先說(shuō)說(shuō)引用,一慣的說(shuō)法是
Java里沒(méi)有指針了,只有引用,引用是安全的
這個(gè)說(shuō)法沒(méi)錯,但是從機理上來(lái)說(shuō),引用就是指針,只是jvm對指針的使用檢查和限制很多,這個(gè)引用/指針變得很安全
直接來(lái)結論:一個(gè)引用占4byte ,在32位系統上
Object obj=null; //4byte
Object[] objs=new Object[1000]; //至少4*1000byte
你看我定義了一個(gè) obj,還是null,就占4byte
定義了一個(gè) objs,1000個(gè)元素,但都是null啊,就都每個(gè)占4byte
是的?。。。?!
雖然obj==null,但它已經(jīng)是 一個(gè)引用,或者說(shuō)一個(gè)指針了
指針也要占地方?。。。?!?。。。?!?。。。?!
接下來(lái),直接給另一個(gè)結論: Object占8byte,注意,純Object
Object obj=new Object(); //多少????
8byte?? 錯??! 12byte,忘了還有一個(gè)引用,8byte是Object的內容
記住 Object obj=new Object(); 占12byte
Object[] objs=new Object[1000];
for(int i=0;i<1000;i++) {
objs[i]=new Object();
}
至少占用 12*1000 bytes
推論: Object占12bytes,似乎和上面的結論矛盾????!
沒(méi)有??! 不管Object,沒(méi)有被垃圾回收之前,總得被別人引用吧?
總的有指針指它吧? 既然指,那個(gè)引用or指針就要占地方啊 4byte
加起來(lái)是12byte,反正一個(gè)Object至少 12bytes
還是直接給結論,推導的過(guò)程我就都包辦了,咱不是臟活累活搶著(zhù)干么??!
一個(gè)Integer占 16 bytes
這時(shí)您可能會(huì )有疑問(wèn),Integer=Object+int,就是:
public class Integer {
public int value;
}
Integer應該占 8+4=12 bytes啊
你說(shuō)的有道理,但是jvm對所有的Object有限制??!
這個(gè)限制被我發(fā)現了,就是不管什么Object占的空間,要是8的倍數
12不是8的倍數,只能是16了?。?!
推論:Byte也占16bytes!!!!!!!!!!!
問(wèn):
Byte[] bytes=new Byte[1000];
占用空間多少?
答: 約為(至少為) (16+4)*1000 bytes
好家伙?。。。。。。?!
論題:數組空間占用怎么算?
我這里直接給結論了,推導這個(gè)花了更長(cháng)的時(shí)間:
對于數組來(lái)說(shuō),數組這個(gè)Object有一個(gè)length屬性,數組的元素相當于其成員
public class Array {
public int length;
//... 其它成員
}
對于數組,我們不是直接可以取length屬性么,源于此
public byte[] bytes=new byte[1000];
System.out.println(bytes.length); // 看,有length屬性
上面的bytes換算過(guò)來(lái)是:
public class Array {
public int length;
public byte byte0;
public byte byte1;
...
public byte byte999;
}
上面的bytes占用的內存是:
4+[8+4 + 1*1000] = 4+ [1012]=4+1016=1020
4是 bytes這個(gè)引用,8是Object基占的,4是length屬性占的
1000是1000個(gè)成員占的,本來(lái)是 1012,但要求是8的倍數,變成 1016了
總共是 1020
再如:
byte[] bytes=new byte[4];
的內存占用是:
4+[8+4+4*1]=4+[16]=20;
byte[] bytes=new byte[3]; 也是 20
對于元素是Object的數組,Object也是當作其成員,(注意只有引用這個(gè)數組的空間,這個(gè)可以推到普通Class上)
Byte[] bytes=new Byte[1000];
這個(gè) bytes的定義相當于:
public class Array {
public int length;
public Byte byte0;
.....
public Byte byte999;
}
占用空間是:
4+[8+4+4*1000]+16*1000= 4+ 4016 + 16000 = 你自己算吧
推論:千萬(wàn)不要用 Byte[] 有20倍的差距?。。。。。?!
你可能一下子沒(méi)明白過(guò)來(lái),沒(méi)關(guān)系多琢磨一下,對于普通的class來(lái)說(shuō)
,內容占用就是基加成員的占用,Object成員只記引用
public class Abc {
public int n;
public byte b;
public Object obj;
}
它的內容占用是: [8+4+1+4]=24
所以 Abc one=new Abc()的占用是 4+24=28
提醒:對于 Abc的成員 obj沒(méi)有計,如果要計入的話(huà),循環(huán)這個(gè)過(guò)程就可以了。(琢磨一下)
舉例:
public class Abc {
public byte b;
public Object obj=null;
}
public class Def {
public int n;
public byte b;
public Abc obj=new Abc();
}
問(wèn):
Def one=new Def(); //占多少?
答:
4+[8+4+1+4]+[8+1+4]=4+24+16=44
public class Abc {
public byte b;
public Object obj=null;
}
public class Def {
public int n;
public byte b;
public Abc[] objs=new Abc[100];
{
for(int i=0;i<10;i++) {
objs[i]=new Abc();
}
}
}
問(wèn):
Def one=new Def(); //占多少?
答:
kao,一下我也算不出來(lái),不過(guò)我寫(xiě)了程序,可以算出來(lái),你給它一個(gè)Object,它就能遞歸的算出總共占了多少內存,這個(gè)程序不復雜,你也可以寫(xiě)出來(lái)。我等機會(huì )合適了再放出。
單獨說(shuō)一下String,String的結構是:
public class String {
private final char value[];
private final int offset;
private final int count;
private int hash; // Default to 0
}
所以,不考慮那個(gè)char[]的占用,一個(gè)String最少占用 [8+4+4+4+4]=24bytes
加上引用,共28bytes
所以
String s="";
占用28bytes?。。。?! 盡管它的長(cháng)度為0
如果精確的算,加上引用一個(gè)String的占用是
4+24+[8+4+2*length]
String s=""; 的占用是 28+16= 44
String s="ab" 的占用是 28+16= 44
String s="abc" 的占用是 28+24 = 52
要說(shuō)的是,String是常用的類(lèi),這么看,String耗內存很多,所以jvm有優(yōu)化,同樣的內容盡量重用,所以除了28是必須的外,那個(gè)char[] 很可能一樣
比方說(shuō)
String[] s=new String[1000];
for(int i=0;i<1000;i++) {
s[i]=new String("abcdefasdjflksadjflkasdfj");
}
的占用的數量級是 28*1000,那 1000個(gè)字符串本身基本上不占內存,只有一份?。。。。?!
反正String 至少是 28,最多也可能是28?。。。。。。?!
比較占內存的數據結構,這個(gè)很重要:基本上就是 primitive的包裝
實(shí)例:
Hashtable的結構,有100萬(wàn)個(gè)元素
改為String[]+int[]后,內存占用改觀(guān)不少,速度也很快
100萬(wàn)的String[] 快排一下,也就2秒多,查找用2分,和hash也差不多少