暴擊美股
就在北京時(shí)間1月27日深夜,國(guó)產(chǎn)大模型公司深度求索(DeepSeek)憑一己之力掀翻美國(guó)科技股。
截至美股1月27日收盤(pán),道指漲0.65%,標(biāo)普500指數(shù)跌1.46%,納指跌3.07%。英偉達(dá)暴跌16.97%,單日市值蒸發(fā)5890億美元,創(chuàng)史上最大單日個(gè)股市值蒸發(fā)紀(jì)錄。英偉達(dá)的暴跌也使得創(chuàng)始人黃仁勛的身家大幅縮水210億美元。
此外,甲骨文下跌13.78%,超微電腦下跌12.49%,芯片制造商博通下跌17.4%,臺(tái)積電跌13%。《華爾街日?qǐng)?bào)》稱,道瓊斯市場(chǎng)數(shù)據(jù)顯示,周一的“市場(chǎng)大屠殺”總共使股市市值蒸發(fā)了約1萬(wàn)億美元。
消息面上,1月27日早間,DeepSeek應(yīng)用登頂蘋(píng)果中國(guó)地區(qū)和美國(guó)地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜,在美區(qū)下載榜上超越了ChatGPT。DeepSeek系量化巨頭幻方量化旗下大模型公司,1月20日,該公司正式發(fā)布推理大模型DeepSeek-R1。
1月27日早間,DeepSeek應(yīng)用登頂蘋(píng)果中國(guó)地區(qū)和美國(guó)地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜,在美區(qū)下載榜上甚至超越了ChatGPT。DeepSeek是量化巨頭幻方量化旗下大模型公司,1月20日,該公司正式發(fā)布推理大模型DeepSeek-R1。
推出后不久,R1就憑借其開(kāi)源的性質(zhì)、大幅下降的售價(jià)和訓(xùn)練成本獲得了廣泛關(guān)注。作為一款開(kāi)源模型,R1在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上的性能能夠比肩OpenAI o1模型正式版,并采用MIT許可協(xié)議,支持免費(fèi)商用、任意修改和衍生開(kāi)發(fā)等。
更令市場(chǎng)驚訝的是,據(jù)DeepSeek介紹,R1的預(yù)訓(xùn)練費(fèi)用只有557.6萬(wàn)美元,在2048塊英偉達(dá)H800 GPU(針對(duì)中國(guó)市場(chǎng)的低配版GPU)集群上運(yùn)行55天完成。
市場(chǎng)人士稱,DeepSeek的R1大型語(yǔ)言模型或引發(fā)行業(yè)重估大模型成本。華爾街開(kāi)始考慮科技行業(yè)巨頭對(duì)AI基礎(chǔ)設(shè)施的巨額投資以及對(duì)英偉達(dá)芯片的需求是否合理。
值得注意的是,近日DeepSeek需求火爆,AI服務(wù)在24小時(shí)內(nèi)經(jīng)歷了多次宕機(jī)。服務(wù)狀態(tài)頁(yè)面顯示,“近期DeepSeek線上服務(wù)受到大規(guī)模惡意攻擊,注冊(cè)可能繁忙,請(qǐng)稍等重試。已注冊(cè)用戶可以正常登錄,感謝理解和支持?!?
暴擊完美股,DeepSeek又拋出新模型。
1月28日,DeepSeek發(fā)布開(kāi)源多模態(tài)模型Janus-Pro,其中70億參數(shù)版本的Janus-Pro-7B模型在使用文本提示的圖像生成排行榜中優(yōu)于OpenAI的 DALL-E 3和Stability AI的Stable Diffusion。
Github社區(qū)信息顯示,Janus-Pro是去年發(fā)布的Janus的高級(jí)版本,可顯著提高多模式理解和視覺(jué)生成。相比此前的Janus,Janus-Pro優(yōu)化的訓(xùn)練策略、擴(kuò)展的訓(xùn)練數(shù)據(jù)和擴(kuò)展到更大的模型尺寸。通過(guò)這些改進(jìn),Janus-Pro在多模態(tài)理解和文本到圖像的指令遵循能力方面都取得了顯著的進(jìn)步,同時(shí)也增強(qiáng)了文本到圖像生成的穩(wěn)定性。
英偉達(dá):DeepSeek未來(lái)仍需大量芯片
據(jù)路透社等外媒報(bào)道,當(dāng)?shù)貢r(shí)間27日,英偉達(dá)發(fā)表聲明表示,中國(guó)人工智能公司深度求索(DeepSeek)所取得的進(jìn)展,顯示出其芯片在中國(guó)市場(chǎng)的實(shí)用價(jià)值,且未來(lái)為滿足DeepSeek的服務(wù)需求,將需要更多英偉達(dá)芯片。
當(dāng)?shù)貢r(shí)間27日,因投資者擔(dān)憂DeepSeek的英偉達(dá)芯片遠(yuǎn)少于美國(guó)公司,卻達(dá)到了與OpenAI等競(jìng)爭(zhēng)對(duì)手相當(dāng)?shù)乃?,英偉達(dá)股價(jià)暴跌17%。之后,英偉達(dá)發(fā)布了一份聲明。
英偉達(dá)在聲明中稱:“DeepSeek在人工智能領(lǐng)域取得了卓越進(jìn)展,是‘測(cè)試時(shí)間縮放’的絕佳范例。DeepSeek的成果展示了如何利用這一技術(shù),借助廣泛可得的模型以及完全符合出口管制規(guī)定的計(jì)算資源,來(lái)創(chuàng)建新模型。”
英偉達(dá)還表示,DeepSeek等AI公司的推理需要大量英偉達(dá)GPU(圖形處理器)和高性能網(wǎng)絡(luò),DeepSeek的爆火表明市場(chǎng)對(duì)其芯片仍有需求。
開(kāi)源和閉源的沖突 對(duì)AI行業(yè)和英偉達(dá)都是短期利空長(zhǎng)期利好
DeepSeek暴擊美股的消息忙壞了中國(guó)網(wǎng)友,以下摘選一些犀利表達(dá)供參考:
當(dāng)初openAI推出的時(shí)候,整個(gè)中國(guó)的科技界似乎都被震動(dòng)了。悲觀者感嘆中國(guó)幾十年也趕不上美國(guó)的人工智能,樂(lè)觀者也覺(jué)得至少差那么三五年。
短短半年多以后,中國(guó)就推出了Deep SeekR1,用僅僅不到600萬(wàn)美元的成本實(shí)現(xiàn)了openAI幾十億美元才達(dá)到的性能和效率,更是打破了依靠先進(jìn)芯片堆砌算力而壟斷人工智能優(yōu)勢(shì)的夢(mèng)想。
這可不是彎道超車(chē)啊,而是頭頂飛躍。簡(jiǎn)直讓人瞠目結(jié)舌,目瞪口呆!用不入流的芯片,只用了讓覺(jué)得可憐得要命的資金就占領(lǐng)了人工智能的高地。
開(kāi)源和閉源的沖突。正確的理解是開(kāi)放源代碼正在超越傳統(tǒng)專有模式,但關(guān)于開(kāi)源是否真的僅僅只是開(kāi)放源代碼這么簡(jiǎn)單,這部分暫時(shí)超出了我的認(rèn)知,我不懂。但可以確定的是deepseek背后是接近50000臺(tái)英偉達(dá)最先進(jìn)A100芯片在支撐,而不是某些傻白甜想的對(duì)算力的需求大降,反而是隨著使用的人數(shù)開(kāi)始爆發(fā)式增長(zhǎng),面臨著頂級(jí)算力不夠的風(fēng)險(xiǎn)。但關(guān)于在美國(guó)技術(shù)封鎖后這家公司為何依然能源源不斷獲得英偉達(dá)最先進(jìn)的算力顯卡,這部分無(wú)法明說(shuō),我只能說(shuō)我認(rèn)知之內(nèi)的是,開(kāi)源的投喂量和訓(xùn)練量是閉源是幾十倍,開(kāi)源想長(zhǎng)期領(lǐng)跑,最好的顯卡就是唯一的競(jìng)爭(zhēng)。開(kāi)源能長(zhǎng)期獲勝的關(guān)鍵是是否能一直拿到老黃的最新的芯片,中長(zhǎng)期而言CUDA 無(wú)法替代。
兩千年前中國(guó)人發(fā)明弩,普通農(nóng)民稍加訓(xùn)練就可以洗腳上陣,戰(zhàn)爭(zhēng)不再是貴族的專利,直接導(dǎo)致中國(guó)貴族社會(huì)解體;又如這一年多戰(zhàn)場(chǎng)上廣泛應(yīng)用的廉價(jià)無(wú)人機(jī)干掉昂貴傳統(tǒng)兵器,小技術(shù)低價(jià)格往往能改變戰(zhàn)爭(zhēng)勝負(fù)的天平。
真正的仿大腦結(jié)構(gòu),就如人的記憶,需要的時(shí)候調(diào)出數(shù)據(jù),不需要時(shí)就沉默在記憶深處。
DeepSeek團(tuán)隊(duì)剛在康奈爾發(fā)表的論文,其中每一個(gè)作者都值得我們銘記,大部分都是30歲以下的年輕人,來(lái)自國(guó)內(nèi)的頂尖大學(xué),有的還在讀博士,其中,無(wú)人具有海外的學(xué)術(shù)背景。(也有網(wǎng)友表示“偷著樂(lè)悶頭整就成了,為何非要去康奈爾發(fā)表?”)
用后反饋
關(guān)于DeepSeek的使用反饋,不少網(wǎng)友表示“比其他國(guó)產(chǎn)AI平臺(tái)更好用?!?
網(wǎng)友隨機(jī)提問(wèn)截圖
但DeepSeek的使用仍需要細(xì)化問(wèn)題,也就是你的提問(wèn)必須要精準(zhǔn),它才能提供即時(shí)的詳細(xì)答案。不過(guò)在提問(wèn)了大宗商品相關(guān)后,如果參照它的答案,還是有可能掉坑的。它總結(jié)了一些謠言在里面作為分析結(jié)論。
但有個(gè)反之的問(wèn)題,如果市場(chǎng)交易者應(yīng)用這個(gè)模型做分析,形成共識(shí),就會(huì)影響一段行情。然后分析師依靠AI寫(xiě)報(bào)告,AI再根據(jù)分析師報(bào)告做深度思考,提供結(jié)果,分析師再根據(jù)AI模型寫(xiě)報(bào)告.......
不管怎樣,DeepSeek請(qǐng)繼續(xù)折射人類千年文明的星光吧~
新聞來(lái)源:ICC訊石綜合整理
相關(guān)文章