JAVA的參數傳遞,基本類型是把實參賦給形參, 對象是COPY壹個副本堆棧裏.
很多Java程序員只求追隨新生的事物,卻連基本的概念都沒有,很明顯是基本功不過硬,討論Java的基本功,下面便是在這個想法下催生出的第壹篇文章。
Java基本功——Reference
有這樣壹種說法,如今爭鋒於IT戰場的兩大勢力,MS壹族偏重於底層實現,Java壹族偏重於系統架構。說法根據無從考證,但從兩大勢力各自的社區力量和圖書市場已有佳作不難看出,此說法不虛。於是,事情的另壹面讓人忽略了。
偏巧,我是壹個喜歡探究底層實現的Java程序員,雖然我的喜好並非純正咖啡,劍走偏鋒卻別是壹番風味。
Reference
Java世界泰山北鬥級大作《Thinking In Java》切入Java就提出“Everything is Object”。在Java這個充滿Object的世界中,reference是壹切謎題的根源,所有的故事都是從這裏開始的。
Reference是什麽?
如果妳和我壹樣在進入Java世界之前曾經浪跡於C/C++世界,就壹定不會對指針陌生。談到指針,往日種種不堪回首的經歷壹下子湧上心頭,這裏不是抱怨的地方,讓我們暫時忘記指針的痛苦,回憶壹下最初接觸指針的甜蜜吧!還記得妳看過的教科書中,如何講解指針嗎?留在我印象中的壹種說法是,指針就是地址,如同門牌號碼壹樣,有了地址,妳可以輕而易舉找到壹個人家,而不必費盡心力的大海撈針。
C++登上歷史舞臺,reference也隨之而來,容我問個小問題,指針和reference區別何在?我的答案來自於在C++世界享譽盛名的《More Effective C++》。
沒有null reference。
reference必須有初值。
使用reference要比使用指針效率高。因為reference不需要測試其有效性。
指針可以重新賦值,而reference總是指向它最初獲得的對象
設計選擇:
當妳指向妳需要指向的某個東西,而且絕不會改指向其它東西,或是當妳實作壹個運算符而其語法需要無法有指針達成,妳就應該選擇reference。其它任何時候,請采用指針。
這和Java有什麽關系?
初學Java,鑒於reference的名稱,我毫不猶豫的將它和C++中的reference等同起來。不過,我錯了。在Java中,reference可以隨心所欲的賦值置空,對比壹下上面列出的差異,就不難發現,Java的reference如果要與C/C++對應,它不過是壹個穿著reference外衣的指針而已。
於是,所有關於C中關於指針的理解方式,可以照搬到Java中,簡而言之,reference就是壹個地址。我們可以把它想象成壹個把手,抓住它,就抓住了我們想要操縱的數據。如同掌握C的關鍵在於掌握指針,探索Java的鑰匙就是reference。
壹段小程序
我知道,太多的文字總是令人犯困,那就來段代碼吧!
public class ReferenceTricks {
public static void main(String[] args) {
ReferenceTricks r = new ReferenceTricks();
// reset integer
r.i = 0;
System.out.println("Before changeInteger:" + r.i);
changeInteger(r);
System.out.println("After changeInteger:" + r.i);
// just for format
System.out.println();
// reset integer
r.i = 0;
System.out.println("Before changeReference:" + r.i);
changeReference(r);
System.out.println("After changeReference:" + r.i);
}
private static void changeReference(ReferenceTricks r) {
r = new ReferenceTricks();
r.i = 5;
System.out.println("In changeReference: " + r.i);
}
private static void changeInteger(ReferenceTricks r) {
r.i = 5;
System.out.println("In changeInteger:" + r.i);
}
public int i;
}
對不起,我知道,把壹個字段設成public是壹種不好的編碼習慣,這裏只是為了說明問題。
如果妳有興趣自己運行壹下這個程序,我等妳!
OK,妳已經運行過了嗎?結果如何?是否如妳預期?下面是我在自己的機器上運行的結果:
Before changeInteger:0
In changeInteger:5
After changeInteger:5
Before changeReference:0
In changeReference: 5
After changeReference:0
這裏,我們關註的是兩個change——changeReference和changeInteger。從輸出的內容中,我們可以看出,兩個方法在調用前和調用中完全壹樣,差異出現在調用後的結果。
糊塗的講解
先讓我們來分析壹下changeInteger的行為。
前面說過了,Java中的reference就是壹個地址,它指向了壹個內存空間,這個空間存放著壹個對象的相關信息。這裏我們暫時不去關心這個內存具體如何排布,只要知道,通過地址,我們可以找到r這個對象的i字段,然後我們給它賦成5。既然這個字段的內容得到了修改,從函數中返回之後,它自然就是改動後的結果了,所以調用之後,r對象的i字段依然是5。下圖展示了changeInteger調用前後內存變化。
Reference +--------+ Reference +--------+
---------->| i = 0 | ---------->| i = 5 |
|--------| |--------|
| Memory | | Memory |
| | | |
| | | |
+--------+ +--------+
調用changeInteger之前 調用changeInteger之後
讓我們把目光轉向changeReference。
從代碼上,我們可以看出,同changeInteger之間的差別僅僅在於多了這麽壹句。
r = new ReferenceTricks();
這條語句的作用是分配壹塊新的內存,然後將r指向它。
執行完這條語句,r就不再是原來的r,但它依然是壹個ReferenceTricks的對象,所以我們依然可以對這個r的i字段賦值。到此為止,壹切都是那麽自然。
Reference +--------+ +--------+
---------->| i = 0 | | i = 0 |
|--------| |--------|
| Memory | | Memory |
| | Reference |--------|
| | ---------->| i = 5 |
+--------+ +--------+
調用changeReference之前 調用changeReference之後
順著這個思路繼續下去的話,執行完changeReference,輸出的r的i字段,那麽應該是應該是新內存中的i,所以應該是5。至於那塊被我們拋棄的內存,Java的GC功能自然會替我們善後的。
事與願違。
實際的結果我們已經看到了,輸出的是0。
肯定哪個地方錯了,究竟是哪個地方呢?
參數傳遞的秘密
知道方法參數如何傳遞嗎?
記得剛開始學編程那會兒,老師教導,所謂參數,有形式參數和實際參數之分,參數列表中寫的那些東西都叫形式參數,在實際調用的時候,它們會被實際參數所替代。
編譯程序不可能知道每次調用的實際參數都是什麽,於是寫編譯器的高手就出個辦法,讓實際參數按照壹定順序放到壹個大家都可以找得到的地方,以此作為方法調用的壹種約定。所謂“沒有規矩,不成方圓”,有了這個規矩,大家協作起來就容易多了。這個公***數據區,現在編譯器的選擇通常是“棧”,而所謂的順序就是形式參數聲明的順序。
顯然,程序運行的過程中,作為實際參數的變量可能遍布於內存的各個位置,而並不壹定要老老實實的呆在棧裏。為了守“規矩”,程序只好將變量復制壹份到棧中,也就是通常所說的將參數壓入棧中。
打起精神,謎底就要揭曉了。
我剛才說什麽來著?將變量復制壹份到棧中,沒錯,“復制”!
這就是所謂的值傳遞。
C語言的曠世經典《The C Programming Language》開篇的第壹章中,談到實際參數時說,“在C中,所有函數的實際參數都是傳‘值’的”。
馬上會有人站出來,“錯了,還有傳地址,比如以指針傳遞就是傳地址”。
不錯,傳指針就是傳地址。在把指針視為地址的時候,是否考慮過這樣壹個問題,它也是壹個變量。前面的討論中說過了,參數傳遞必須要把參數壓入棧中,作為地址的指針也不例外。所以,必須把這個指針也復制壹份。函數中對於指針操作實際上是對於這個指針副本的操作。
Java的reference等於C的指針。所以,在Java的方法調用中,reference也要復制壹份壓入堆棧。在方法中對reference的操作就是對這個reference副本的操作。
謎底揭曉
好,讓我們回到最初的問題上。
在changeReference中對於reference的賦值實際上是對這個reference的副本進行賦值,而對於reference的本尊沒有產生絲毫的影響。
回到調用點,本尊醒來,它並不知道自己睡去的這段時間內發生過什麽,所以只好當作什麽都沒發生過壹般。就這樣,副本消失了,在方法中對它的修改也就煙消雲散了。
也許妳會問出這樣的問題,“聽了妳的解釋,我反而對changeInteger感到迷惑了,既然是對於副本的操作,為什麽changeInteger可以運作正常?”
呵呵,很有趣的大腦短路現象。
好,那我就用前面的說法解釋壹下changeInteger的運作。
所謂復制,其結果必然是副本完全等同於本尊。reference復制的結果必然是兩個reference指向同壹塊內存空間。
雖然在方法中對於副本的操作並不會影響到本尊,但對內存空間的修改確實實實在在的。
回到調用點,雖然本尊依然不知道曾經發生過的壹切,但它按照原來的方式訪問內存的時候,取到的確是經過方法修改之後的內容。
於是方法可以把自己的影響擴展到方法之外。
多說幾句
這個問題起源於我對C/C++中同樣問題的思考。同C/C++相比,在changeReference中對reference賦值可能並不會造成什麽很嚴重的後果,而在C/C++中,這麽做卻會造成臭名昭著的“內存泄漏”,根本的原因在於Java擁有了可愛的GC功能。即便這樣,我仍不推薦使用這種的手法,畢竟GC已經很忙了,我們怎麽好意思再麻煩人家。
在C/C++中,這個問題還可以繼續引申。既然在函數中對於指針直接賦值行不通,那麽如何在函數中修改指針呢?答案很簡單,指針的指針,也就是把原來的指針看作壹個普通的數據,把壹個指向它的指針傳到函數中就可以了。
同樣的問題到了Java中就沒有那麽美妙的解決方案了,因為Java中可沒有reference的reference這樣的語法。可能的變通就是將reference進行封裝成類。至於值不值,公道自在人心。
參考文獻
1 《Thinking in Java》
2 《More Effective C++》
3 《The C Programming Language》
Trackback: /TrackBack.aspx?PostId=1376960