跳到主要內容

WireMock - Record Disconnection Behavior

Problem

我有一隻待測程式(SUT)會相依於外部服務(External Service),操作流程如下:

  1. SUT觸發一個async command。
  2. 接著外部服務將會重置而導致SUT無法連線。
  3. SUT會不停的Get去等待外部服務再次連線。
在我導入WireMock要替代外部服務並錄製腳本過程中,發現WireMock只要發生網路連線問題就會回應以下內容:

Network failure trying to make a proxied request from WireMock to https://10.146.125.169/api/v1
Connect to 10.146.125.169:443 [/10.146.125.169] failed: Connection timed out: connect

這導致SUT接到非預期的500 status code,使工作的執行無法順利完成。本篇文章主要分享我的解決方法。(code: link)

How to?

(對嘗試過程沒興趣可以直接看方法2)

方法1

我的第一個方法,是直接找到造成500問題的地方(link ProxyResponseRenderer),修改WireMock程式碼直接retry。這會讓工作能夠繼續執行並完成。最後我透過修改錄製出來的腳本,加上長時間的response delay強迫client timeout去模擬類似情境:
"response": {
        "status": 200,
        "fixedDelayMilliseconds": 120000
}
Note. 嘗試過在HttpClientFactory加socket timeout是沒有幫助的,這受到作業系統設定限制。

方法2

後來研究了一下Extending WireMock內容後,覺得應該有機會可以透過擴充的方式去達到我的目的,因此有了方法2。

Extend ResponseTransformer

首先我看上了ResponseTransformer,它可以讓你對Response加工。在Simulating Faults內容有提及WireMock模擬Fault的一些方式,其中這部分內容激起了我的靈感:
{
    "request": {
        "method": "GET",
        "url": "/fault"
    },
    "response": {
        "fault": "MALFORMED_RESPONSE_CHUNK"
    }
}
我想應該可以根據connection timed out這種特定錯誤情境,讓WireMock產生Fault的Response,在這裡我使用了Fault.CONNECTION_RESET_BY_PEER:
public class SocketTimedOutResponseTransformer extends ResponseTransformer {
 
    @Override
    public Response transform(Request request, Response response, FileSource files, Parameters parameters) {
    	if(response.getStatus()==500&&response.getBodyAsString().contains("Network failure")) {
    		return Response.Builder.like(response)
    				.body(String.valueOf(Fault.CONNECTION_RESET_BY_PEER))
    				.fault(Fault.CONNECTION_RESET_BY_PEER).build();
    	}
        return response;
    }
 
    @Override
    public String getName() {
        return "SocketTimedOutResponseTransformer";
    }
}
response我除了模擬fault以外,也在body塞Fault.CONNECTION_RESET_BY_PEER;這是另一段故事,請讓我在下一段做說明。

Extend StubMappingTransformer

在套用上面方法後,工作是能夠如下圖執行完畢:

但產生出來的腳本並不包含fault動作,也代表著無法重現整個流程。我Trace了一下WireMock程式碼,發現LoggedResponse轉為ResponseDefinition時,並沒有取用Fault欄位,這導致了資料的遺失:

因此我將腦筋動到了另外一個Extension StubMappingTransformer上。與前一個extension成對,當收到500且有Fault的ResponseDefinition時,就會把body內的字串轉為Fault並產生新的ResponseDefinition,最後塞到StubMapping讓它有辦法產生我們預期的內容:

public class FaultStubMappingTransformer extends StubMappingTransformer {
 
 
    @Override
    public String getName() {
        return "FaultStubMappingTransformer";
    }
 
    private Fault getFault(ResponseDefinition responseDef) {
    	String body = Objects.toString(new String(responseDef.getByteBody()), "");
    	try {
			return Fault.valueOf(body);
    	} catch (IllegalArgumentException e) {
			return null;
		}
    }
 
    private void setupFaultResponseDef(StubMapping stubMapping) {
    	ResponseDefinition responseDef = stubMapping.getResponse();
    	Fault fault = getFault(responseDef);
    	if( fault == null )
    		return;
 
    	ResponseDefinition faultResponseDef = ResponseDefinitionBuilder.like(responseDef).withFault(fault).build();
		stubMapping.setResponse(faultResponseDef);
    }
 
	@Override
	public StubMapping transform(StubMapping stubMapping, FileSource files, Parameters parameters) {
		ResponseDefinition responseDef = stubMapping.getResponse();
 
		if( responseDef.getStatus() == 500) {
			setupFaultResponseDef(stubMapping);
		}
		return stubMapping;
	}
}

最後產生的mapping file終於有fault的字眼:

 "response" : {
    "status" : 500,
    "base64Body" : "Q09OTkVDVElPTl9SRVNFVF9CWV9QRUVS",
    "fault" : "CONNECTION_RESET_BY_PEER"
  }


留言

這個網誌中的熱門文章

解決RobotFramework從3.1.2升級到3.2.2之後,Choose File突然會整個Hand住的問題

考慮到自動測試環境的維護,我們很久以前就使用java去執行robot framework。前陣子開始處理從3.1.2升級到3.2.2的事情,主要先把明確的runtime語法錯誤與deprecate item處理好,這部分內容可以參考: link 。 直到最近才發現,透過SeleniumLibrary執行Choose File去上傳檔案的動作,會導致測試案例timeout。本篇文章主要分享心路歷程與解決方法,我也送了一條issue給robot framework: link 。 我的環境如下: RobotFramework: 3.2.2 Selenium: 3.141.0 SeleniumLibrary: 3.3.1 Remote Selenium Version: selenium-server-standalone-3.141.59 首先並非所有Choose File的動作都會hang住,有些測試案例是可以執行的,但是上傳一個作業系統ISO檔案一定會發生問題。後來我透過wireshark去比對新舊版本的上傳動作,因為我使用 Remote Selenium ,所以Selenium會先把檔案透過REST API發送到Remote Selenium Server上。從下圖我們可以發現,在3.2.2的最後一個TCP封包,比3.1.2大概少了500個bytes。 於是就開始了我trace code之路。包含SeleniumLibrary產生要送給Remote Selenium Server的request內容,還有HTTP Content-Length的計算,我都確認過沒有問題。 最後發現問題是出在socket API的使用上,就是下圖的這支code: 最後發現可能因為開始使用nio的方式送資料,但沒處理到尚未送完的資料內容,而導致發生問題。加一個loop去做計算就可以解決了。 最後我有把解法提供給robot framework官方,在他們出新的版本之前,我是將改完的_socket.py放在我們自己的Lib底下,好讓我們測試可以正常進行。(shutil.py應該也是為了解某個bug而產生的樣子..)

Show NIC selection when setting the network command with the device option

 Problem  在answer file中設定網卡名稱後,安裝時會停在以下畫面: 所使用的command參數如下: network --onboot = yes --bootproto =dhcp --ipv6 =auto --device =eth1 Diagnostic Result 這樣的參數,以前試驗過是可以安裝完成的。因此在發生這個問題後,我檢查了它的debug console: 從console得知,eth1可能是沒有連接網路線或者是網路太慢而導致的問題。後來和Ivy再三確認,有問題的是有接網路線的網卡,且問題是發生在activate階段: Solution 我想既然有retry應該就有次數或者timeout限制,因此發現在Anaconda的說明文件中( link ),有提到dhcptimeout這個boot參數。看了一些人的使用範例,應該是可以直接串在isolinux.cfg中,如下: default linux ksdevice = link ip =dhcp ks =cdrom: / ks.cfg dhcptimeout = 90 然而我在RHEL/CentOS 6.7與6.8試驗後都無效。 因此我就拿了顯示的錯誤字串,問問Google大師,想找一下Anaconda source code來看一下。最後找到別人根據Anaconda code修改的版本: link ,關鍵在於setupIfaceStruct函式中的setupIfaceStruct與readNetConfig: setupIfaceStruct: 會在dhcp時設定dhcptimeout。 readNetConfig: 在writeEnabledNetInfo將timeout寫入dhclient config中;在wait_for_iface_activation內會根據timeout做retry。 再來從log與code可以得知,它讀取的檔案是answer file而不是boot command line。因此我接下來的測試,就是在answer file的network command上加入dhcptimeout: network --onboot = yes --bootproto =dhcp --ipv6 =auto --device =eth1 --...

Robot Framework - Evaluate該怎麼用?

Evaluate該怎麼用? 前言 Builtin的RobotFramework Library提供了Evaluate Keyword。它所提供的功能是「執行Python描述句」。但實際上到底有什麼用途呢?原本我僅僅拿來將string轉為int的功用,經過一些查詢與試驗,我將心得整理給大家。 Builtin Builtin的function可以參考Library Doc for Evaluate。我以有使用過的function做說明。 數字轉換 Python提供了int、long、float與complex等function讓你可以將字串轉為數字,也可以透過它們做四則運算。首先以字串轉數字為例,我將8設於${num_str}中,再透過Evaluate+int轉為數字。這裡必須注意的是: 「int()中放變數必須以單引號'括起」。否則,假如你設定的數字為08,在轉換int時會出現Syntax Error。 ${num_str} | Set Variable | 8 ${num} | Evaluate | int('${num_str}') 其中int與long的第二個參數為base,這是根據你的input所決定: Comment | num = 9 ${num} | Evaluate | int('11', 8) Comment | num = 11 ${num} | Evaluate | int('11', 10) Comment | num = 17 ${num} | Evaluate | int('11', 16) 其它還有像bin、oct、hex,可以將整數轉為2、8、16進位。 運算 四則運算: 直接將運算子加上即可: ${num} | Evaluate | int('${hour}')*60 + int('${min}') 指數: 可以用pow。以下面兩個例子來說,第一個是2的3次方為8,第二個是2的3次方再mod 7為1。需注意的是: 「傳入值必須是數字不可為字串」。 ${num} | Evaluate | pow(2,3) ${num} | Evaluate | pow(2,3,7) 取最大最小值: 使用max/min,可以選擇丟一個array的方式...