作者背景
在深入探討《機器交易》這本書的課程之前,先來認識一下作者。他是陳恩尼斯特博士(Dr. Ernest Chan),一位量化交易員。他的職業生涯起步於 IBM 研究中心,從事模式識別工作。之後轉戰華爾街,在摩根士丹利和瑞士信貸工作,開發系統化交易策略,這正是本書的核心內容。
他還創立了 QTS 資本管理公司,一家系統化交易公司,並創建了 PredictNow.ai,幫助投資者做出數據驅動的決策,主要使用人工智能機器學習交易。在這期間,他還出版了幾本關於量化交易的有影響力的書籍,這些書籍塑造了許多交易員的市場交易方法,包括我和我的許多朋友。
課程一:從簡單開始
這似乎有點違反直覺,因為如果其他人都在使用超級複雜的技術從市場中提取 alpha,作為零售交易員,我們可能也需要做類似的事情。但陳恩尼斯特強調,在未來轉向更複雜的技術之前,要從最簡單的技術開始。
大多數交易員喜歡操之過急。如果你是一名開發人員,你會看到每個人都想直接進入機器學習領域,添加一些人工智能層,並認為這就是他們獲得優勢的方式。但實際情況往往恰恰相反。
以我自己在期貨市場和現在的加密貨幣市場上運行的自動化策略組合為例,它們都基於非常簡單的技術,主要提取風險溢價和一些資本受限的低效率。這意味著那些更大的玩家無法真正在那個領域競爭,因為它們非常缺乏流動性,或者它們無法在其中投入太多資金,所以不值得它們花時間。這就是我喜歡競爭的地方,如果我在尋找純粹的低效率。此外,我的投資組合的很大一部分是基於風險溢價。如果你不太確定這些是什麼意思,我有其他關於這些主題的視頻。但主要是你因為承擔額外的風險而獲得報酬,這就是你獲得超額回報的方式。
課程二:每個參數都必須爭取自己的位置
陳恩尼斯特警告說,過多的參數是最容易過度擬合策略的方式。只保留具有統計顯著性並具有明確目的的參數,無論是產生回報還是控制風險。
如果你不確定如何做到這一點,一個很好的方法是使用參數敏感性。我在這個頻道上有一個關於這個主題的視頻。主要是根據性能指標檢查兩個參數值,並將其繪製在熱圖或 3D 表面圖上,以了解該參數值一旦稍微改變,如何影響性能。
例如,假設你有一個 20 移動平均線和一個 50 移動平均線。它們之間的間隔是一或二。如果性能迅速下降,例如 22 是峰值性能,而 25 是糟糕的性能,這很可能是一個過度擬合的策略。而如果從 20 到 50 性能緩慢下降,這實際上是一個好兆頭,表明整個性能集群沒有被擬合到噪音中,實際上可能有一些東西可以提取。
有三種偏差需要注意: 1. 前瞻偏差:本質上是使用明天的價格來交易今天。 2. 生存偏差:使用當前的樣本數據進行回測,而不是使用歷史準確的樣本數據。 3. 數據窺探偏差:使用具有大量參數或交易規則的非常複雜的模型對歷史數據進行過度擬合。
這三種偏差往往會誇大回測性能,從而高估實際回報。它們非常危險,因為它們會鼓勵你交易該策略,而你很可能會虧錢。而傾向於壓低回測性能的偏差則不那麼危險,因為你只會決定不進行交易。
課程三:目標不是找到一個完美的策略
直接引用這本書的話,關鍵是多元化。我們在投資組合中擁有的獨立策略越多,它們同時停止工作或出現虧損的可能性就越小。陳恩尼斯特建議同時維護多個策略進行實時交易,並不斷進行調整和優化。
我認為這是很多人犯的最經典的錯誤之一,他們在 YouTube 上尋找那個完美的策略,比如 90% 勝率的策略,以後能產生持續的回報。簡單地說,這是不存在的。在任何大公司,他們都在不斷研究新的想法和新的方法來利用市場,甚至進行個別交易。對於零售交易員來說,情況也沒有什麼不同,你會不時地遇到新的策略。
運行多個獨立或不相關或低相關的策略還有一個巨大的優勢,那就是提高整體風險調整後的回報。簡單地說,這意味著你有更少的虧損,並且在大多數情況下,對於那種虧損,你有更高的回報。如果你想知道具體如何做到這一點,以及它是如何分解的,還有一些背後的數學原理,我有一個關於聖杯的視頻。之所以稱之為聖杯,是因為雷·達利奧和吉姆·西蒙斯也將其稱為交易中的聖杯,就像交易中的免費午餐一樣,主要是低相關或不相關的策略。
課程四:專注於低效率市場
較新或效率較低的市場提供了更好的機會。這些市場通常伴隨著其他風險,例如不太清晰的基礎設施、不太清晰的監管等。但由於這些原因,通常有更多的 alpha 可以被發現。
一個很好的例子是跨交易所套利,這在股票市場上已經不存在了。股票市場非常有效率,你不會找到一個地方可以在兩個股票交易所之間套利價格,甚至在經紀商和平台之間也很難。但在加密貨幣市場,這種情況存在了很長一段時間,而且由於不斷有新的代幣出現,以及加密貨幣市場不如股票市場成熟,這種情況仍然存在。
但這也帶來了潛在的風險。在加密貨幣市場,一個非常明顯的風險是經紀商和交易所通常不是最受監管或最安全的。我們經歷了整個 FTX 爆雷等事件。所以你在承擔潛在的風險,你不一定每天都能看到這種風險,但你在技術上是因為承擔這種風險才能進行加密貨幣交易。
課程五:為什麼大多數機器學習交易會失敗
我不知道我的觀眾中有多少人是必要的開發人員。我知道你們中有很大一部分人是,或者至少你們正在進入開發和學習代碼的領域。經常出現的一件事是,特別是當我與許多其他開發人員交談時,因為你有這個優勢,大多數其他交易員不知道如何編碼。如果你知道如何編碼或正在學習,你想應用那些先進的技術。但這並不是優勢或 alpha 的真正來源。
這是因為金融數據通常非常有限,而且在統計意義上肯定不是穩定的,這導致使用機器學習時的一個常見結果,即過度擬合。不要誤會我的意思,機器學習可以用於交易,但在零售層面上,你要使用並克服所有這些過度擬合的風險可能非常困難,而且它肯定不是最容易獲得的成果。
相反,如果你真的想使用機器學習,正如他在這本書中所討論的那樣,它可以用於風險分配和投資組合優化。例如,如何將資本分配給投資組合中的不同策略、不同資產等。這本書中還提到,作為一名系統化交易員,我們不必太擔心執行,因為大多數時候我們可以自動化它。但我們必須擔心並一直害怕的是過度擬合。如果你的模型陷入過度擬合的陷阱,它就沒有用了。雖然在你將其部署到實際環境中並有足夠的樣本等之前,你永遠不會百分之百地知道你是否過度擬合了,但這是我們一直在努力防止的事情。
課程六:持續研究
策略有有限的生命,而糟糕的回測策略甚至可能一開始就不起作用。因此,理想情況下,你想使用快速原型設計,即快速構建、徹底測試(仍然使用樣本數據、參數敏感性和我在這個頻道上也談到的其他指標),然後快速放棄失敗的策略。你不想專注於同一個策略,試圖進一步改進它,試圖獲得更多的回報,試圖修復一個總是最糟糕的策略。你必須接受,這個遊戲很大程度上是關於研究、測試,然後從那裡繼續前進。
請記住,沒有策略可以永遠有效。他實際上有一個很好的頁面專門討論這個問題。如果你想暫停並閱讀它,請隨意。如果你想了解更多關於回測和自動化的信息,請查看描述中的第一個鏈接。希望你喜歡這個視頻。