如何衡量一個投資策略?

金融投資與普通人之間的距離已經不像之前一樣遙遠,越來越多的人決定掌控自己資金的投資決定。由此,衡量投資策略十分重要。


我們所處的世界對絕對回報有著非常嚴重的執迷,當人談起投資大佬時,基本都會談到他們的年化回報,然而這些大佬所用策略的風險則很少有人提及,當然,這隻是低級錯誤,大部分有一定專業知識的朋友至少也會用夏普比例這個風險調整回報的指標來評估投資策略。另一種執念是對“兩倍標準差”(two sigma)的執念。為什麼叫兩倍標準差?兩倍標準差的意思是有95%的信心,策略的正回報是真實存在而非隨機生成的。這個的意義在哪呢?在於能找到“兩倍標準差”便被認為是找到了一個新的投資回報來源,當然這個說法也並不準確。


雖然兩倍標準差的標準並不夠嚴格(稍後會詳談),但一定程度上標準差相對於夏普比例而言的確更加客觀,因為它考慮的信息更加全麵,一個簡單的計算標準差的方法是:


標準差 = 夏普比例 × 年份^(1/2)


比方說

如果一個策略的夏普比例是1,測試的年份是四年,那麼它的標準差便是2

如果一個策略的夏普比例是2,測試的年份是四年,那麼它的標準差便是4

如果一個策略的夏普比例是1,測試的年份是九年,那麼它的標準差便是3


這個衡量方式與一些大佬對投資策略夏普比例的批判很吻合,比方說Cliff Asness一直吐槽人們對策略的評估是基於十年內的數據,隻看夏普比例。這樣來看‘標準差’這個衡量方式的確更為客觀。常見策略的標準差是多少呢?以趨勢,價值,成長,以及市場指數四個策略為例。



測試時間是87年,四個策略的標準差分別為6.16, 3.82, 3.45,3.82


都遠遠高於2,似乎兩倍標準差不是一件特別困難的事情?四個策略看起來都很厲害。其實它們的意思隻是,按照這些方式投資,長期來看的回報是正的。這句話看起來是廢話,但是其實對少部分人而言還是有意義的,尤其是那些聲稱投資股市是“七虧兩平一賺”的人:就算是長期持有股指這麼簡單的投資方式,長期來看虧的可能性是非常小的。這些似乎特別明顯,但是如果給了另一個更現實的情況,標準差作為衡量方式的優勢便會有所凸顯。


比方說如下策略,十年回報了140%,我們是否應該因它長期向上的走向把它看作一個有效的策略?答案或許是是,也可能不是,完全取決於衡量方法。



那麼對投資策略一個比較合理的衡量是什麼呢?


凡事都不可一概而論,如果單從策略曆史表現來看,“三倍標準差”應該比“兩倍標準差”更加合理。這種論調聽起來或許很傻,看起來就是提高了對策略的選取標準,似乎是不說大家也都知道的一件事情。但是“兩倍標準差不可取”在這種論調下站不住腳,畢竟95%的確信度與99%的確信度的差別看起來實在不大。事實並非如此,關鍵人往往忽視了“多重檢測”(Multiple testing)的考量。“兩倍標準差”對應的並非是95%的確信度,取決於檢測的數量,數量越大實際的確信度其實越低。


這到底是什麼意思呢?以一個故事為例


比如有一個全國擲色子大賽,有一億個參賽選手,十輪之後可能裏麵會有一個人連續十次都擲出6,然後大賽舉辦方把他作為“色子王”推向世界,聲稱這個人有神之手,具備連續擲出十個6的能力,甚至用二項分布計算p值,說我們接近100%確信這個人的確有神之手。


大家也能看出問題了吧,其實投資策略也是如此。如果從多個策略中剔除失敗的策略,隻留下成功的策略,對這個所謂成功策略的衡量標準還是“兩倍標準差”未免就有些太寬鬆了。


就算是“三倍標準差”的說法也是定性大於定量,隻是說考慮進去了這個時代大部分研發投資策略的人都會有多個策略用來測試。就算有五十個策略,如果其中有一個策略達到了“三倍標準差”,我們也有是95%的確信度這個策略是有效的。隨著數理與計算機的人才湧入策略研發這個領域,不提上百,其實上萬次模擬都不再罕見,這種情況下,三倍甚至四倍標準差都並不足夠對策略的有效性得出肯定的結論。


之前的那個策略其實是下圖中200個策略隨機模擬中選出的最好的一個策略,它的標準差計算結果雖然是3,但是在200次模擬麵前這個標準差並不合格,統計意義上我們對它的確信度是小於5%的,而它實際上也的確是隨機產生的一個策略。



如果有一萬次模擬而要達到95%的確信度的話,其實我們需要策略的標準差達到4.5左右。


筆者之前可能一直給人的感覺是站在數據驅動的反麵(參看《一無所知的藝術》),但其實平心而論,數據驅動的策略如果能在調整多重檢測後拿到很高的標準差,那麼可能也是非常有效的,甚至可能是發現新的市場異常的一個途徑,比方說Cliff Asness十年前談趨勢投資的時候就談及自己不知道趨勢為什麼會有超額回報,Andrew Ang五年前談低風險投資的時候也談到自己不清楚為什麼低風險異常會存在。


對於理論驅動的投資策略而言,或許我們能降低對策略統計數據上的要求,因為策略本身並非是數據驅動的,而是基於某個或某些經濟現實,比方說獨眼博士Michael Burry精準的計算出了信貸市場能承擔的極限水平與承受時間,大量購入CDS的決定並非對賭,而是基於經濟必然;Fischer Black當時對Valueline市場指數定價錯誤的認識也造就了非常經典的統計套利策略;同樣的還有Joel Greenblatt與Jamie Mai的不對稱機遇風格。但從另一個層麵上來看,理論驅動的投資策略本身就不會存在過多的模擬或檢測,這樣的話標準差方法作為衡量的依據其實並沒有不合適。


以標準差作為衡量方式本身也隻是一個參考,不是絕對依據。因為它並沒有考慮到大部分策略存在的尾端狀況,比方說它會誇大利差策略做空波動率策略的吸引程度,也沒有考慮策略在自身外的意義,比方說日本市場的趨勢在統計意義上雖然幾乎不存在,但是趨勢仍能通過對價值策略的分散作用提高整體投資組合的風險調整回報。



投資產業中真正對策略的評估,投資經理的選取過程非常複雜,並不是看幾個數值就能做決定的,下圖給大家一個參考



這篇主要寫給對投資策略感興趣的朋友,如果人們能在策略的選取中考慮到統計中最簡單的“多重檢測”概念,那麼對策略的認識和選取可能會合理很多。


References:

Ang, A., 2014. Asset management: A systematic approach to factor investing. Oxford University Press.

Asness, C., 2011. Momentum in Japan: The exception that proves the rule. The Journal of Portfolio Management37(4), pp.67-75.

Asness, C.S., Moskowitz, T.J. and Pedersen, L.H., 2013. Value and momentum everywhere. The Journal of Finance68(3), pp.929-985.

Gray, W.R. and Vogel, J.R., 2016. Quantitative Momentum: A Practitioner's Guide to Building a Momentum-Based Stock Selection System. John Wiley & Sons.

Harvey, C.R. and Liu, Y., 2014. Evaluating trading strategies. The Journal of Portfolio Management40(5), pp.108-118.

Jaye, N., 2014. The Art of Knowing Nothing Brilliantly. CFA Institute Magzine25(3), pp.34-37.

Pedersen, L.H., 2015. Efficiently inefficient: how smart money invests and market prices are determined. Princeton University Press.

Narang, R.K., 2013. Inside the Black Box: A Simple Guide to Quantitative and High Frequency Trading (Vol. 883). John Wiley & Sons.

Schwager, J.D., 2012. Hedge fund market wizards: How winning traders win. John Wiley & Sons.


“免責聲明:本文所涉及的數據和信息均來自第三方提供的或公開披露的資料,我們不保證該數據和資料的準確性、完整性或實時性。我們提供的是一個信息分享平台和我們自己的一些看法,不提供專業投資意見。我們對任何讀者依賴我們提供的信息和看法進行投資行為所產生的損失不負任何責任。我們建議讀者谘詢專業投資意見。”


Fred 13/08/2017