思考了一會兒,周昀連上服務器,新建了一個文件夾。
本來他還以為上一個課題結束之后,服務器賬號就會被收回,他還特地問過這件事情,畢竟八卡的H100就算是租也需要一筆不小的費用。
哪知道鄧永華大手一揮,讓他先用著,等組里買好服務器了再說。
那周昀總不能拒絕吧?
既然老師說了繼續用,那就繼續用唄。
技術方面的事情周昀心里有數,他剛剛就想到了幾種還不錯的方案,只不過具體有沒有效果還要實驗了才知道。
想要實驗,最重要的還是數據,而想要數據,他就需要盡快定下來,想要預測的股票,才能去網上爬數據。
“該選什么股票呢?”周昀雙手放在鍵盤上,遲遲沒有動手。
股票的事情他其實不太熟悉,主要是他從來沒有去深入了解過,所以在他眼里股市=賭場,這種概率性太大的事情他一向不太喜歡去做。
“周昀,想啥呢?你也要買股票?”一旁的邱彥聽到周昀好像說了“股票”兩個字,這才問了一嘴。
“嗯,不是我要買,我是想著,現在不是有很多量化公司嗎?但是這東西說白了就是深度學習模型,
我想著能不能選一只股票用模型來預測一下,如果成了說不定還能賺點錢。”
邱彥頓時眼睛一亮:“這個想法好啊!如果真的能成,到時候不說大賺,至少不會虧的這么慘了?!?/p>
“是?。〔贿^這要實現起來應該挺難的吧?”沈瑞覺得這事情沒這么容易。
周昀點點頭:“技術方面我有了一些想法,只是需要時間驗證,現在的問題是,我不知道該選什么股票?!?/p>
“這確實得好好想一下,我有一點想法,可以作為參考?!庇崽祛J种篙p敲桌面緩緩開口,要說實驗室里誰對股市最為了解,那絕對是他了。
一萬的本金,他花了一年的時間讓其翻到了三萬多,這在普通人里已經算是非常NB了,畢竟這是年化300%的收益率。
“師兄你說。”對于不了解的領域,周昀向來是虛心學習。
“其實我并不建議你選擇個股,因為很大程度上來說,
個股的走勢受多重復雜因素影響,比如財報暴雷、高管變動、產品事故、股東減持這些不可預測事件,
更別說有些盤子小的股票可能會存在被資本大手操控的情況,所以相比個股,我更建議選擇ETF,
因為ETF的走勢更多由系統性因素驅動,簡單來說受個人的影響很?。ó斎灰灿欣猓?,這樣的情況下,各種技術指標的可靠性就會更高,也更加容易預測,
比如有些厲害的人都能預測其大致的走向,我覺得深度學習模型應該會做的比人更好,
而且ETF的波動一般都不大,極難出現一天十個點的情況,所以就算日后真的虧錢了,也能把虧損控制在一個合理的范圍內,
我比較推薦兩支ETF,都是我自己重倉的,一個是黃金,一個就是恒科,這兩個ETF都支持T 0交易,也就是當日買,當日賣。
不過具體怎么選,還需要師弟自己調研一下,我的話也不一定對,只能做個參考?!?/p>
周昀一邊聽著一邊順手記了一下:“謝謝師兄,我再自己了解一下。”
“沒事,這些東西就算不告訴你,也很容易了解,算不了什么?!?/p>
雖然聽師兄說了個大概,不過周昀還是自己查了點資料。
接下來的一周,他都在研究股市,不過身上沒什么錢,只能拿模擬盤操作一下了。
戰績也是非常輝煌。
-18%
虧了十八個點,毫不意外的血虧,其中17%都是在個股上虧得,明明每一次買進的時候他都覺得不會再跌了,結果第二天還是照跌不誤。
經過調研加上親身實踐,他最終決定了,就選黃金ETF!
主要是他記得,未來黃金似乎都在一直上漲,就算預測的不準,應該也不會虧錢。
而實驗室的師兄師姐知道了周昀又有新的idea之后,毫不猶豫地想要加入,周昀自然是來者不拒。
雖然核心的模型架構設計和算法上師兄師姐們幫不上什么忙,但是收集數據,清洗數據,數據標注,對他們來說還是小菜一碟。
這種工作一般都是研零或者研一才會干的事情,畢竟處理數據這種事情就兩個——麻煩。
現在倒是有點倒反天罡的意思了,不過幾位師兄師姐卻沒抱怨什么。
自己什么水平,各自都清楚,周昀這種剛來就能發NeurIPS的,在他們眼里已經是妥妥的大佬了,幫大佬打雜,
順便混一篇A會打底的二作三作,傻子才不干,雖然對找工作沒什么用,但是對評獎學金有用啊。
至于給年齡,都什么年代了,懂不懂什么叫達者為師??!
鄧永華也通過組會知道了這個事情,他也沒反對,只是提醒大家先做好自己本職的科研工作,否則自己畢業都成問題的話,混個二作三作也是啥用沒有。
時間很快來到了七月份。
實驗室里,師兄師姐都圍在周昀身后,所有人的眼睛都死死盯著屏幕。
屏幕上一共有兩個界面,一個比較簡陋,只有一根折線圖,另一個則是交易平臺的軟件,上面顯示的是黃金ETF的實時走勢。
粗略地看上去,兩根折線似乎是一模一樣的,但是如果仔細觀察就能發現,很多細節上,兩者的走勢完全不同。
這就是周昀他們近兩個多月的研究成果,一種全新架構的時間序列預測模型。
“還是有點問題,不過暫時也只能做到這種程度了。”周昀看著兩個界面嘆了口氣。
“我覺得已經很好了,不超過0.1%的誤差,還不夠嗎?”
“是啊,其它的模型我們不是也跑過了嗎?誤差基本都在1%以上?!?/p>
雖然話是這么說,但是周昀還是覺得這個模型其實是有很大優化空間的,不能提升的原因還是一個——資源不夠了。
哪怕是八卡的H100,也是有上限的,而如果想要更進一步的預測走勢,就需要更多的數據,這里的數據就不僅僅是歷史的價格了,
更是包括了和黃金相關的各種新聞,信息,這些消息來自世界各地,形式也多種多樣,有視頻、文字、音頻、圖片。
這就涉及到了另一個領域——多模態大模型。
而一旦涉及到了大模型這三個字,八張H100是遠遠不夠的,因為他要的是訓練,而不是推理。