跳到主要內容

Effective Java - Return optionals judiciously


這個item主要告訴你使用Java 8推出的Optional的注意事項。本篇文章我以Java開發人員Stuart Marks演講內容投影片中所提到的Rules去整理Effective Java與網路上的內容。

Rule#1: Never, ever, use null for an Optional variable or return value.

使用Optional的目的,是希望提供一個機制讓method回傳結果能夠表達“no result”,而不是透過null,因為null造成了很多的bug。以下為原文:
Optional is intended to provide a limited mechanism for library method return types where there is a clear need to represent "no result," and where using null for that is overwhelmingly likely to cause errors. 
                                                                       - From Stuart Marks' presentation
除此之外,也可以參考Java Language Architect - Brian Goetz的說法。 因此,當你讓Optional變數塞了null,或者是直接回傳null,就是脫褲子放屁;而在我們的production code中,還真的有這種code。

另外,Effective Java有提到適合使用Optional當method回傳值的使用時機: 是你的client需要針對空值做特別處理的時候。

Rule#2: Never use Optional.get() unless you can prove that the Optional is present.

第二個rule是要告訴你別直接使用Optional.get()去取得值,除非你確定它一定有值,如果使用sonarlint,會提示你至少要寫成這樣:
Optional<User> searchResult = userRepository.findUser("123");
    if( searchResult.isPresent() )
        dump(searchResult.get());
如果沒先判斷就直接取值,你就會收到java.util.NoSuchElementException: No value present。我們最近也因為有人違反這個rule而產生bug。

Rule#3: Prefer alternatives APIs over Optional.isPresent() and Optional.get().

延續Rule#2,Optional提供了不少alternative API讓你可以不需要先透過isPresent()判斷,再做後續動作,目的是要讓code更簡潔。以Rule#2中的例子來說,可以寫成這樣:
Optional<User> searchResult = userRepository.findUser("123");
searchResult.ifPresent(TestOptional::dump);
透過ifPresent再傳入Consumer method,就可以讓code更簡潔;除此之外,orElse、orElseGet、orElseThrow也是蠻常使用的。這個連結敘述了蠻多alternative APIs的使用方法,可以仔細閱讀。

Rule#4: It’s generally a bad idea to create an Optional for the specific purpose of chaining methods from it to get a value.

這個Rule是告訴你,不要為了使用Optional或者是為了fluent interface而使用它,除非你是要回傳Optional:
// BAD	
String process(String s) {	
    return Optional.ofNullable(s).orElseGet(this::getDefault);	
}	
// GOOD	
String process(String s) {	
    return (s != null) ? s : getDefault();	
}
除了考量到效能以外,還要判斷使用Optional以後,code是不是真的比較好閱讀。

Rule#5: If an Optional chain has a nested Optional chain, or has an intermediate result of Optional<Optional<T>>, it’s probably too complex.

這個Rule是說Optional內不要再包Optional,我想這會讓client code變得很複雜。

Rule#6: Avoid using Optional in fields, method parameters, and collections.

再來是我研究最久的Rule,建議Optional避免使用在fields、method parameters與collections。

首先談的是collection,在collection的情況下使用Optional,其實是不必要的。主要原因有以下:

  • 使用Optional後,反而額外增加client要多考慮有值與沒有值的情況。
  • collection本身就可以用來代表有值或沒有值的情況,可以參考Effective Java Item#54。
我目前想的到有可能會把collection用Optional包裝的情況,應該只有用來代表使用者是否有輸入值的情境吧? 當我需要去識別「使用者有否輸入」,就無法使用empty collection去代表這件事情,除非再增加其它的flag變數。

不要將Optional使用於method parameter的原因,主要是會變成強迫client要轉Optional物件,增加API使用的不便性。

最後是最有爭議的,是否要將Optional使用於field。反對者主要有以下論述:

  • Optional不支援序列化,這個是主因。(列為anti-pattern的主因)
  • 多消耗4倍記憶體空間。(演講中有提及)
  • Optional是一個box,包覆另外一個value物件,這會增加額外的GC開銷。(演講中有提及)
針對以上三點,序列化問題可以透過Guava Optional或Vivr Optional去解決,但也要搭配Jackson Module或Gson的TypeAdapter做對應的處理;多消耗4倍記憶體空間在現在時代已經不是嚴重的事情(Stuart Marks的演講有提及);在Java8的情況下,第三點就無法避免了。
目前已知的是,JDK的Valhalla專案希望能夠將Optional變成Value Type去避免這個問題,也因為有這個計畫,導致目前無法讓Optional去實作Serializable(會產生向下相容問題)。JodaTime作者認為如果這天來臨,內建的Optional應可以用於任何地方:

JodaTime作者認為比較好的寫法:
private String mail; // optional
public Optional<String> getMail(){
    return Optional.ofNullable(mail);
} 
public void setMail(String mail){
    this.mail = mail;
}

支持者的論點,主要有兩點:
  • 宣告於欄位代表著非必要欄位,語意表達比使用null加註解清楚,更何況大家都不愛寫註解。此外,這個Optional支持者反對null,不偏好JodaTime作者的方法。link
  • Effective Java Item 55有提及,適用於物件有許多非必要欄位的情況,像是部分更新的UseCaseInput model。如果按照Stuart Marks的建議使用Null Object Pattern,那將會因此建立許多Sub Classes,非常不方便。
  • 在使用Lombok的情況下,有人會想將Optional宣告為field;但被Lombok開發人員打槍,因為他愛null。link
支持者與反對者比較寫法如下,我認為trade-off就在對於效能、語意、序列化與框架的使用上了,單元測試成本幾乎是一樣的:
private String mail; // optional
private Optional<String> address = Optional.empty();
 
public Optional<String> getMail(){
    return Optional.ofNullable(mail);
}
 
public void setMail(String mail){ 
    Objects.requireNonNull(mail, "Mail should not be null.");
    this.mail = mail;
}
 
public Optional<String> getAddress(){
    return address;
}
 
public void setAddress(String address) {
    this.address = Optional.of(address);
}
在Java 8的情況下,我提供以下主要的trade-off比較給大家參考:
  • 允許Optional於欄位讓語意清楚: 效能較差、維護成本較高(有序列化需求要特別套其它library)。
  • 允許null於欄位並僅在回傳值使用Optional: 僅有語意問題,null控制好就無大礙。

Rule#7: Avoid using identity-sensitive operations on Optionals. For example don’t use reference equality == with Optionals.

這個Rule是告訴大家不要把Optional的物件使用==去操作,要用equals;除了這個以外,也不要把它拿來synchronized。主要原因是Optional本質上是一個包裝物件的box,未來有很大的機會變成Value Type,參考此link

其它

反對Optional

在演講中有提到有些反對Optional的論述,有興趣的人可以自行參考。

Effective Java還有提及的

  1. 為了減少boxing與unboxing的開銷,int、long、double可以使用OptionalInt、OptionalLong、OptionalDouble。
  2. 不建議使用在map的key上,因為Optional包含著有值與沒有值的情況,使用在map上只是增添不必要的複雜度。最後再次強調: it is almost never appropriate to use an optional as a key, value, or element in a collection or array.

留言

這個網誌中的熱門文章

解決RobotFramework從3.1.2升級到3.2.2之後,Choose File突然會整個Hand住的問題

考慮到自動測試環境的維護,我們很久以前就使用java去執行robot framework。前陣子開始處理從3.1.2升級到3.2.2的事情,主要先把明確的runtime語法錯誤與deprecate item處理好,這部分內容可以參考: link 。 直到最近才發現,透過SeleniumLibrary執行Choose File去上傳檔案的動作,會導致測試案例timeout。本篇文章主要分享心路歷程與解決方法,我也送了一條issue給robot framework: link 。 我的環境如下: RobotFramework: 3.2.2 Selenium: 3.141.0 SeleniumLibrary: 3.3.1 Remote Selenium Version: selenium-server-standalone-3.141.59 首先並非所有Choose File的動作都會hang住,有些測試案例是可以執行的,但是上傳一個作業系統ISO檔案一定會發生問題。後來我透過wireshark去比對新舊版本的上傳動作,因為我使用 Remote Selenium ,所以Selenium會先把檔案透過REST API發送到Remote Selenium Server上。從下圖我們可以發現,在3.2.2的最後一個TCP封包,比3.1.2大概少了500個bytes。 於是就開始了我trace code之路。包含SeleniumLibrary產生要送給Remote Selenium Server的request內容,還有HTTP Content-Length的計算,我都確認過沒有問題。 最後發現問題是出在socket API的使用上,就是下圖的這支code: 最後發現可能因為開始使用nio的方式送資料,但沒處理到尚未送完的資料內容,而導致發生問題。加一個loop去做計算就可以解決了。 最後我有把解法提供給robot framework官方,在他們出新的版本之前,我是將改完的_socket.py放在我們自己的Lib底下,好讓我們測試可以正常進行。(shutil.py應該也是為了解某個bug而產生的樣子..)

Show NIC selection when setting the network command with the device option

 Problem  在answer file中設定網卡名稱後,安裝時會停在以下畫面: 所使用的command參數如下: network --onboot = yes --bootproto =dhcp --ipv6 =auto --device =eth1 Diagnostic Result 這樣的參數,以前試驗過是可以安裝完成的。因此在發生這個問題後,我檢查了它的debug console: 從console得知,eth1可能是沒有連接網路線或者是網路太慢而導致的問題。後來和Ivy再三確認,有問題的是有接網路線的網卡,且問題是發生在activate階段: Solution 我想既然有retry應該就有次數或者timeout限制,因此發現在Anaconda的說明文件中( link ),有提到dhcptimeout這個boot參數。看了一些人的使用範例,應該是可以直接串在isolinux.cfg中,如下: default linux ksdevice = link ip =dhcp ks =cdrom: / ks.cfg dhcptimeout = 90 然而我在RHEL/CentOS 6.7與6.8試驗後都無效。 因此我就拿了顯示的錯誤字串,問問Google大師,想找一下Anaconda source code來看一下。最後找到別人根據Anaconda code修改的版本: link ,關鍵在於setupIfaceStruct函式中的setupIfaceStruct與readNetConfig: setupIfaceStruct: 會在dhcp時設定dhcptimeout。 readNetConfig: 在writeEnabledNetInfo將timeout寫入dhclient config中;在wait_for_iface_activation內會根據timeout做retry。 再來從log與code可以得知,它讀取的檔案是answer file而不是boot command line。因此我接下來的測試,就是在answer file的network command上加入dhcptimeout: network --onboot = yes --bootproto =dhcp --ipv6 =auto --device =eth1 --...

Robot Framework - Evaluate該怎麼用?

Evaluate該怎麼用? 前言 Builtin的RobotFramework Library提供了Evaluate Keyword。它所提供的功能是「執行Python描述句」。但實際上到底有什麼用途呢?原本我僅僅拿來將string轉為int的功用,經過一些查詢與試驗,我將心得整理給大家。 Builtin Builtin的function可以參考Library Doc for Evaluate。我以有使用過的function做說明。 數字轉換 Python提供了int、long、float與complex等function讓你可以將字串轉為數字,也可以透過它們做四則運算。首先以字串轉數字為例,我將8設於${num_str}中,再透過Evaluate+int轉為數字。這裡必須注意的是: 「int()中放變數必須以單引號'括起」。否則,假如你設定的數字為08,在轉換int時會出現Syntax Error。 ${num_str} | Set Variable | 8 ${num} | Evaluate | int('${num_str}') 其中int與long的第二個參數為base,這是根據你的input所決定: Comment | num = 9 ${num} | Evaluate | int('11', 8) Comment | num = 11 ${num} | Evaluate | int('11', 10) Comment | num = 17 ${num} | Evaluate | int('11', 16) 其它還有像bin、oct、hex,可以將整數轉為2、8、16進位。 運算 四則運算: 直接將運算子加上即可: ${num} | Evaluate | int('${hour}')*60 + int('${min}') 指數: 可以用pow。以下面兩個例子來說,第一個是2的3次方為8,第二個是2的3次方再mod 7為1。需注意的是: 「傳入值必須是數字不可為字串」。 ${num} | Evaluate | pow(2,3) ${num} | Evaluate | pow(2,3,7) 取最大最小值: 使用max/min,可以選擇丟一個array的方式...