近年來,隨著人工智能(AI)技術的飛速發展,量化投資領域正迎來新一輪深刻變革。
以生成式AI為代表的新一代模型興起,顛覆了傳統數據處理方式,促使基金公司加速探索AI的深度應用。麵對海量且複雜的金融市場數據,算力資源分配與穩定性也逐漸成為AI量化模型的製勝關鍵。
不過,盡管AI技術在量化投資領域展現出強大潛力,模型的“黑盒”特征以及相應的可解釋性不足依然困擾著業界。多家機構指出,AI模型要真正發揮作用,還需要提升模型的透明度與可解釋性。
量化投資邁入AI時代
近年來,AI技術的快速發展已引發量化投資領域的新一輪變革,尤其是生成式AI模型的出現,使得數據應用場景發生深刻變化,傳統的因子模式也麵臨巨大的衝擊,中大型基金公司開始紛紛探索AI的深度應用。
在接受券商中國記者采訪時,路博邁基金副總經理、CIO兼基金經理魏曉雪詳細闡述了人工智能技術在量化投資中的關鍵作用。在梳理量化策略模型的發展史時,魏曉雪介紹稱,量化1.0是簡單選股策略階段,以基本統計方法為主,使用簡單數學模型進行投資分析,主要依賴於人工挖掘因子,波動控製具有一定的局限性。量化2.0是多因子模型階段,使用多因子模型捕捉線性信息,通過更多樣的數據集提高準確性與穩定性,缺點是人工依賴度高。量化3.0則是AI加高頻交易,使用AI機器學習算法識別和捕捉非線性的股票高頻特征,預測短期股票價格波動。不過,這一模型也有缺點,即因子衰減快,預測周期較短。
隨著DeepSeek正式落地,路博邁的量化3.5模型也在此基礎上應運而生。其選股頻率為周度調整,這一高頻更新特征也是AI量化效率的重要體現。路博邁基金認為,相較於傳統模型通常采用的月度調整機製,量化3.5通過更高頻次的動態調整,能夠更有效地捕捉短期市場機會,展現出更強的靈活性和適應性。
浙商基金也表示,LLM模型被不斷優化,極大地降低了文本數據的應用難度,量化可以利用的文本數據呈指數級增加,量變引發質變。日常實踐中,多模態、生成式大模型對於日常工作的輔助,對於認知的重構已經非常顯著。未來,AI量化投資方法會不會有天翻地覆的變化,也值得期待。
浙商基金多年來也在AI賦能量化投資上深耕。通過內部智能投研係統Lucy,投研團隊可以跟蹤分門別類的數據,同時基於AI模型學習的結果以及主觀研究的經驗,給出對應的投資建議。這使得AI模型的輔助幾乎滲透到所有公司在管產品中,而投資經理和研究員在主動研究時也會向AI模型尋求建議和幫助。
算力是AI量化投資的基石
AI技術在量化投資中的運用,與金融市場數據的爆炸式增長息息相關。在魏曉雪看來,在傳統的數據處理中,投資者主要依賴價格、成交量等結構化數據,而隨著信息技術的飛速發展,新聞、社交媒體、財報文本等非結構化數據的湧現,給投資分析帶來了巨大挑戰。AI技術,特別是自然語言處理和圖像識別等技術,能夠高效地處理和分析這些海量的多維度數據,挖掘出傳統方法難以捕捉的信息。
目前,路博邁集團量化策略的管理規模已接近百億美元,覆蓋發達市場和新興市場的股票與債券。因此,算力成為支持策略運行的關鍵。魏曉雪透露,路博邁總部每天處理的數據量已達太字節(1024GB)級別,相關的數據處理經驗能夠支持模型高效處理,並進行持續優化。
銀河基金對DeepSeek-R1的觀察同樣證明了算力的重要性。1月20日,DeepSeek-R1正式發布並同步開源模型權重。然而,由於短期內用戶需求的大量爆發,造成了自有算力緊張,2月6日,該模型暫停了API服務充值。這也從側麵說明,麵對大規模用戶需求時,算力資源的分配與係統穩定性成為製約AI模型發展的關鍵因素。
針對國產大模型目前麵臨的算力穩定性問題,銀河基金的基金經理鄭巍山指出,國產算力的發展需要深入到基礎設施層麵進行分析。具體而言,算力層作為AI大模型迭代的載體,主要分為AI算力芯片、AI服務器和AI組網三個方麵。
其中,AI算力芯片是AI算力的核心,需求有望率先擴張。當前市場以GPU和ASIC芯片為主導,盡管全球市場長期被海外廠商占據,但國產廠商正在加速追趕並逐步縮小差距。
AI服務器則是算力的重要載體,有望在AI算力芯片的發展下進一步擴張。市場需求將伴隨芯片發展而進一步擴張,尤其是涉及GPU、印製電路板(PCB)、存儲等關鍵電子元器件領域的發展值得持續關注。
最後,AI服務器通過通信連接實現大規模AI組網集群,用來支持超大參數的大模型訓練,也就是AI組網。組網規模的持續擴大將直接推動光模塊、銅纜連接、交換機等設備需求的增長。
AI量化需突破“黑盒”困境
雖然當前AI技術為量化投資帶來了諸多突破,但在多家機構看來,現階段模型仍是偏“黑盒”的特征,可解釋性較弱,製約了其在金融領域的進一步深入應用。
浙商基金指出,當下端到端賦能投資的AI模型、機器學習模型還是仍是通過堆砌大量數據和構造比較複雜的模型去輸出結果。這樣,一方麵可解釋性不高,可能不適應金融場景,另一方麵可能存在模型過擬合的問題。
尤其在生成式模型爆發後,模型在研報閱讀、財報梳理、簡單的代碼生成等方麵具有強大優勢,但生成式模型的發散思考能力又與傳統量化的偏確定性投資建議存在衝突。這意味著,雖然生成式模型的應用顯著提高了可解釋性,但也帶來了可追溯性降低的問題。
對此,浙商基金認為,未來AI量化投資的發展方向應當還是以多模態的生成式模型為主,為了追求可驗證的投資能力,需要部分約束生成式模型的發散能力,提升更為準確的曆史先驗知識的占比,加強與人類智慧的合作,讓AI模型真正讀懂人類的需求,特別是投資領域的需求。
滬上一位公募研究人士向券商中國記者表示,盡管AI技術在量化投資中的應用為市場預測、風險控製和策略優化提供了許多創新途徑,但也存在不少局限性。首先,金融市場數據通常存在噪聲較多、非平穩性強的問題。AI模型容易過度擬合曆史數據中的異常情況,降低了預測的可靠性。此外,曆史數據中的隨機因素和特定時期的極端事件也可能被模型誤讀,導致實際市場表現不及預期。
與此同時,模型所假設的理想市場條件與現實交易環境存在較大差距,頻繁的交易可能帶來顯著的交易成本、滑點及流動性風險,進一步影響策略的實際效果。此外,由於金融市場易受政治、經濟以及心理因素的多重幹擾,突發的“黑天鵝”事件通常超出模型的預測能力,這也意味著純粹依靠曆史數據訓練的模型在麵對極端市場狀況時可能表現欠佳。