java 傳值、傳址問題

以前我看過的文章，推薦給妳：

JAVA的參數傳遞,基本類型是把實參賦給形參, 對象是COPY壹個副本堆棧裏.

很多Java程序員只求追隨新生的事物，卻連基本的概念都沒有，很明顯是基本功不過硬，討論Java的基本功，下面便是在這個想法下催生出的第壹篇文章。

Java基本功——Reference

有這樣壹種說法，如今爭鋒於IT戰場的兩大勢力，MS壹族偏重於底層實現，Java壹族偏重於系統架構。說法根據無從考證，但從兩大勢力各自的社區力量和圖書市場已有佳作不難看出，此說法不虛。於是，事情的另壹面讓人忽略了。

偏巧，我是壹個喜歡探究底層實現的Java程序員，雖然我的喜好並非純正咖啡，劍走偏鋒卻別是壹番風味。

Reference

Java世界泰山北鬥級大作《Thinking In Java》切入Java就提出“Everything is Object”。在Java這個充滿Object的世界中，reference是壹切謎題的根源，所有的故事都是從這裏開始的。

Reference是什麽？

如果妳和我壹樣在進入Java世界之前曾經浪跡於C/C++世界，就壹定不會對指針陌生。談到指針，往日種種不堪回首的經歷壹下子湧上心頭，這裏不是抱怨的地方，讓我們暫時忘記指針的痛苦，回憶壹下最初接觸指針的甜蜜吧！還記得妳看過的教科書中，如何講解指針嗎？留在我印象中的壹種說法是，指針就是地址，如同門牌號碼壹樣，有了地址，妳可以輕而易舉找到壹個人家，而不必費盡心力的大海撈針。

C++登上歷史舞臺，reference也隨之而來，容我問個小問題，指針和reference區別何在？我的答案來自於在C++世界享譽盛名的《More Effective C++》。

沒有null reference。

reference必須有初值。

使用reference要比使用指針效率高。因為reference不需要測試其有效性。

指針可以重新賦值，而reference總是指向它最初獲得的對象

設計選擇：

當妳指向妳需要指向的某個東西，而且絕不會改指向其它東西，或是當妳實作壹個運算符而其語法需要無法有指針達成，妳就應該選擇reference。其它任何時候，請采用指針。

這和Java有什麽關系？

初學Java，鑒於reference的名稱，我毫不猶豫的將它和C++中的reference等同起來。不過，我錯了。在Java中，reference可以隨心所欲的賦值置空，對比壹下上面列出的差異，就不難發現，Java的reference如果要與C/C++對應，它不過是壹個穿著reference外衣的指針而已。

於是，所有關於C中關於指針的理解方式，可以照搬到Java中，簡而言之，reference就是壹個地址。我們可以把它想象成壹個把手，抓住它，就抓住了我們想要操縱的數據。如同掌握C的關鍵在於掌握指針，探索Java的鑰匙就是reference。

壹段小程序

我知道，太多的文字總是令人犯困，那就來段代碼吧！

public class ReferenceTricks {

public static void main(String[] args) {

ReferenceTricks r = new ReferenceTricks();

// reset integer

r.i = 0;

System.out.println("Before changeInteger:" + r.i);

changeInteger(r);

System.out.println("After changeInteger:" + r.i);

// just for format

System.out.println();

// reset integer

r.i = 0;

System.out.println("Before changeReference:" + r.i);

changeReference(r);

System.out.println("After changeReference:" + r.i);

}

private static void changeReference(ReferenceTricks r) {

r = new ReferenceTricks();

r.i = 5;

System.out.println("In changeReference: " + r.i);

}

private static void changeInteger(ReferenceTricks r) {

r.i = 5;

System.out.println("In changeInteger:" + r.i);

}

public int i;

}

對不起，我知道，把壹個字段設成public是壹種不好的編碼習慣，這裏只是為了說明問題。

如果妳有興趣自己運行壹下這個程序，我等妳！

OK，妳已經運行過了嗎？結果如何？是否如妳預期？下面是我在自己的機器上運行的結果：

Before changeInteger:0

In changeInteger:5

After changeInteger:5

Before changeReference:0

In changeReference: 5

After changeReference:0

這裏，我們關註的是兩個change——changeReference和changeInteger。從輸出的內容中，我們可以看出，兩個方法在調用前和調用中完全壹樣，差異出現在調用後的結果。

糊塗的講解

先讓我們來分析壹下changeInteger的行為。

前面說過了，Java中的reference就是壹個地址，它指向了壹個內存空間，這個空間存放著壹個對象的相關信息。這裏我們暫時不去關心這個內存具體如何排布，只要知道，通過地址，我們可以找到r這個對象的i字段，然後我們給它賦成5。既然這個字段的內容得到了修改，從函數中返回之後，它自然就是改動後的結果了，所以調用之後，r對象的i字段依然是5。下圖展示了changeInteger調用前後內存變化。

Reference +--------+ Reference +--------+

---------->| i = 0 | ---------->| i = 5 |

|--------| |--------|

| Memory | | Memory |

| | | |

+--------+ +--------+

調用changeInteger之前調用changeInteger之後

讓我們把目光轉向changeReference。

從代碼上，我們可以看出，同changeInteger之間的差別僅僅在於多了這麽壹句。

r = new ReferenceTricks();

這條語句的作用是分配壹塊新的內存，然後將r指向它。

執行完這條語句，r就不再是原來的r，但它依然是壹個ReferenceTricks的對象，所以我們依然可以對這個r的i字段賦值。到此為止，壹切都是那麽自然。

Reference +--------+ +--------+

---------->| i = 0 | | i = 0 |

|--------| |--------|

| Memory | | Memory |

| | Reference |--------|

| | ---------->| i = 5 |

+--------+ +--------+

調用changeReference之前調用changeReference之後

順著這個思路繼續下去的話，執行完changeReference，輸出的r的i字段，那麽應該是應該是新內存中的i，所以應該是5。至於那塊被我們拋棄的內存，Java的GC功能自然會替我們善後的。

事與願違。

實際的結果我們已經看到了，輸出的是0。

肯定哪個地方錯了，究竟是哪個地方呢？

參數傳遞的秘密

知道方法參數如何傳遞嗎？

記得剛開始學編程那會兒，老師教導，所謂參數，有形式參數和實際參數之分，參數列表中寫的那些東西都叫形式參數，在實際調用的時候，它們會被實際參數所替代。

編譯程序不可能知道每次調用的實際參數都是什麽，於是寫編譯器的高手就出個辦法，讓實際參數按照壹定順序放到壹個大家都可以找得到的地方，以此作為方法調用的壹種約定。所謂“沒有規矩，不成方圓”，有了這個規矩，大家協作起來就容易多了。這個公***數據區，現在編譯器的選擇通常是“棧”，而所謂的順序就是形式參數聲明的順序。

顯然，程序運行的過程中，作為實際參數的變量可能遍布於內存的各個位置，而並不壹定要老老實實的呆在棧裏。為了守“規矩”，程序只好將變量復制壹份到棧中，也就是通常所說的將參數壓入棧中。

打起精神，謎底就要揭曉了。

我剛才說什麽來著？將變量復制壹份到棧中，沒錯，“復制”！

這就是所謂的值傳遞。

C語言的曠世經典《The C Programming Language》開篇的第壹章中，談到實際參數時說，“在C中，所有函數的實際參數都是傳‘值’的”。

馬上會有人站出來，“錯了，還有傳地址，比如以指針傳遞就是傳地址”。

不錯，傳指針就是傳地址。在把指針視為地址的時候，是否考慮過這樣壹個問題，它也是壹個變量。前面的討論中說過了，參數傳遞必須要把參數壓入棧中，作為地址的指針也不例外。所以，必須把這個指針也復制壹份。函數中對於指針操作實際上是對於這個指針副本的操作。

Java的reference等於C的指針。所以，在Java的方法調用中，reference也要復制壹份壓入堆棧。在方法中對reference的操作就是對這個reference副本的操作。

謎底揭曉

好，讓我們回到最初的問題上。

在changeReference中對於reference的賦值實際上是對這個reference的副本進行賦值，而對於reference的本尊沒有產生絲毫的影響。

回到調用點，本尊醒來，它並不知道自己睡去的這段時間內發生過什麽，所以只好當作什麽都沒發生過壹般。就這樣，副本消失了，在方法中對它的修改也就煙消雲散了。

也許妳會問出這樣的問題，“聽了妳的解釋，我反而對changeInteger感到迷惑了，既然是對於副本的操作，為什麽changeInteger可以運作正常？”

呵呵，很有趣的大腦短路現象。

好，那我就用前面的說法解釋壹下changeInteger的運作。

所謂復制，其結果必然是副本完全等同於本尊。reference復制的結果必然是兩個reference指向同壹塊內存空間。

雖然在方法中對於副本的操作並不會影響到本尊，但對內存空間的修改確實實實在在的。

回到調用點，雖然本尊依然不知道曾經發生過的壹切，但它按照原來的方式訪問內存的時候，取到的確是經過方法修改之後的內容。

於是方法可以把自己的影響擴展到方法之外。

多說幾句

這個問題起源於我對C/C++中同樣問題的思考。同C/C++相比，在changeReference中對reference賦值可能並不會造成什麽很嚴重的後果，而在C/C++中，這麽做卻會造成臭名昭著的“內存泄漏”，根本的原因在於Java擁有了可愛的GC功能。即便這樣，我仍不推薦使用這種的手法，畢竟GC已經很忙了，我們怎麽好意思再麻煩人家。

在C/C++中，這個問題還可以繼續引申。既然在函數中對於指針直接賦值行不通，那麽如何在函數中修改指針呢？答案很簡單，指針的指針，也就是把原來的指針看作壹個普通的數據，把壹個指向它的指針傳到函數中就可以了。

同樣的問題到了Java中就沒有那麽美妙的解決方案了，因為Java中可沒有reference的reference這樣的語法。可能的變通就是將reference進行封裝成類。至於值不值，公道自在人心。

參考文獻

1 《Thinking in Java》

2 《More Effective C++》

3 《The C Programming Language》

Trackback: /TrackBack.aspx?PostId=1376960