艳妇乳肉豪妇荡乳av无吗…,干干啪人妻,艳妇乳肉豪妇荡乳在线播放

“DeepSeek在基座大模型上做出的突破，是天才級(jí)別的。”

近，國產(chǎn)大模型公司深度求索（DeepSeek）引發(fā)的輿論震動(dòng)，讓今年春節(jié)成為“最有AI味的年”。談到DeepSeek旗下標(biāo)志性大模型DeepSeek-R1，多位業(yè)內(nèi)人士向澎湃新聞?dòng)浾弑磉_(dá)了高度贊賞。

1月28日，大洋彼岸的人工智能巨頭Open AI CEO山姆·奧特曼(Sam Altman)發(fā)文回應(yīng)DeepSeek帶來的挑戰(zhàn)：“DeepSeek推出的R1令人影響深刻，我們當(dāng)然會(huì)推出更好的模型，有新的競(jìng)爭(zhēng)對(duì)手也令人振奮。”

國內(nèi)某Top2 AI初創(chuàng)企業(yè)也對(duì)記者坦言，他們感受到了同行帶來的壓力：“后續(xù)我們會(huì)加快產(chǎn)品研發(fā)的角度。”

與之對(duì)比的是在產(chǎn)品上的快速迭代：除夕當(dāng)天，DeepSeek悄無聲息地發(fā)布開源多模態(tài)模型Janus-Pro。此前1月27日早間，DeepSeek應(yīng)用曾登頂蘋果中國地區(qū)和美國地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜，在美區(qū)下載榜上超越ChatGPT。

“多模態(tài)考驗(yàn)的是對(duì)人類世界和環(huán)境的認(rèn)知，相信DeepSeek在此刻發(fā)布多模態(tài)大模型，一定有自己的信心和底氣。”1月28日，360創(chuàng)始人周鴻祎告訴澎湃新聞?dòng)浾撸爸袊竽Ｐ图夹g(shù)復(fù)仇者聯(lián)盟戰(zhàn)隊(duì)里一定有DeepSeek的一份，因?yàn)檫@家公司和它的創(chuàng)始人非常低調(diào)，他們技術(shù)能力和未來前景被市場(chǎng)嚴(yán)重低估了。”

“現(xiàn)在硅谷都把DeepSeek叫做來自東方的神秘力量，中國AI公司的創(chuàng)造力已經(jīng)剎不住車了。”周鴻祎表示。

AI軍備競(jìng)賽已進(jìn)入深水期，曾有觀點(diǎn)認(rèn)為，在字節(jié)、阿里、騰訊等大廠包圍下，AI創(chuàng)業(yè)公司將面臨洗牌，難逃被并購的命運(yùn)，而殺出重圍的卻是似乎“名不見經(jīng)傳”的DeepSeek。DeepSeek走紅的秘密是什么，為國內(nèi)大模型行業(yè)帶來哪些啟示？

DeepSeek優(yōu)秀在哪？

“DeepSeek公司高層明確對(duì)商業(yè)化不感興趣，只想做技術(shù)研究，這樣的高度一般人達(dá)不到。”

有了解DeepSeek人士向記者透露，自己曾經(jīng)面試過一些AI領(lǐng)域的人才，最后拒絕了自己的公司，去了DeepSeek，理由是他們科研氛圍好，是一個(gè)真正做事的團(tuán)隊(duì)。

“從薪資來看，其實(shí)他們只是業(yè)內(nèi)中流水平，高，但并不是最高的。”他向記者坦言，“如果說人才密度，可能還比不上頭部大廠。并不是大廠的人不聰明，而是大廠的聰明人花了太多精力在技術(shù)之外。大廠雖然薪資高，但是內(nèi)部斗爭(zhēng)也多，想要真正專心做事，反而不如這樣的技術(shù)公司純粹。”

盡管在外界眼中，DeepSeek仿佛是一夜爆紅，但此前早有多項(xiàng)成就引發(fā)行業(yè)關(guān)注。2024年，在大模型行業(yè)率先發(fā)起價(jià)格戰(zhàn)的正是DeepSeek，但并未引起外界關(guān)注，此后智譜、字節(jié)跳動(dòng)等跟進(jìn)，才引發(fā)整個(gè)行業(yè)的降價(jià)潮流。

當(dāng)時(shí)的DeepSeek，還未真正讓他人看到它的實(shí)力。2024年，智譜AI COO張帆在接受采訪時(shí)曾開玩笑說：“我們是主流廠商中第一個(gè)降價(jià)的。”當(dāng)時(shí)有人提醒，首個(gè)降價(jià)的廠商其實(shí)是DeepSeek，張帆表示：“我說的是主流廠商”。 DeepSeek最引人矚目的，是其顯著降低了大模型開發(fā)成本。1月20日，DeepSeek正式發(fā)布推理模型R1，其API（編程接口）服務(wù)定價(jià)為每百萬輸入tokens（詞元）僅需1元（緩存命中）/4 元（緩存未命中），每百萬輸出tokens為16元。DeepSeek的定價(jià)約等于Meta旗下Llama 3-70B的七分之一，GPT-4 Turbo的七十分之一。因此，DeepSeek也被戲稱為AI界的“拼多多”，實(shí)現(xiàn)高效低價(jià)背后的原因是什么？國內(nèi)某知名AI公司董事長向記者解釋稱，這主要得益于DS-V3的多項(xiàng)技術(shù)創(chuàng)新。首先，DeepSeek采用MoE架構(gòu)（Mixture of Experts，混合專家模型），通過將大模型變成多個(gè)稀疏的專家小模型，并通過多個(gè)模型聚合來達(dá)到和傳統(tǒng)大模型相當(dāng)?shù)哪芰Γ行Ы档土擞?jì)算成本。其次，DS-V3在訓(xùn)練方法上進(jìn)行了重要?jiǎng)?chuàng)新。采用FP8混合精度訓(xùn)練，效率是常規(guī)BF16精度的約1.6倍；同時(shí)優(yōu)化了并行流水線，提升了訓(xùn)練和推理效率。這些優(yōu)化加上訓(xùn)練的一次成功，使得V3的訓(xùn)練成本降至約550萬美元。而在最新發(fā)布的DS-R1中，DeepSeek采用了創(chuàng)新性的GRPO（組相關(guān)策略優(yōu)化）強(qiáng)化學(xué)習(xí)方法，無需龐大的人類標(biāo)注數(shù)據(jù)庫。通過讓模型自主生成并驗(yàn)證結(jié)果的方式，R1展現(xiàn)出了強(qiáng)大的推理能力。隨著訓(xùn)練步數(shù)增加，其思維鏈（Chain-of-Thought，CoT）的長度不斷增長，模型甚至開始在推理過程中進(jìn)行自我反思。

“DeepSeek R1的成功意味著，如果基礎(chǔ)模型能力夠強(qiáng)，在強(qiáng)化學(xué)習(xí)過程中它就能自己學(xué)會(huì)推理。這也是為什么國外AI圈的人看到DS-R1后驚呼AGI竟然離我們?nèi)绱酥脑颍阂驗(yàn)镽1證明了能力足夠強(qiáng)的模型是可以不依靠人類自己進(jìn)化的，盡管現(xiàn)階段的reward還是需要標(biāo)簽。”上述人士表示。

《麻省理工科技評(píng)論》分析稱，DeepSeek R1 采用類似ChatGPT o1使用的“思維鏈”方法，它可以通過逐步處理查詢來解決問題。這可能是美國對(duì)華高端AI芯片出口管制帶來的意外結(jié)果，迫使中國的初創(chuàng)企業(yè)“優(yōu)先考慮效率”。

有意思的是，如果問DeepSeek自己R1模型相比OpenAI有哪些特點(diǎn)，DeepSeek的回答是，創(chuàng)新點(diǎn)可能在“注意力機(jī)制”和“參數(shù)效率”，R1在處理長文本時(shí)更聚焦關(guān)鍵部分（比如法律合同中的條款），減少計(jì)算量，類似“讀書時(shí)用熒光筆劃重點(diǎn)，只反復(fù)看關(guān)鍵段落”。在參數(shù)效率方面，用類似MoE（混合專家系統(tǒng)）的結(jié)構(gòu)，把模型分成多個(gè)“子專家”，不同任務(wù)激活不同部分，既節(jié)省算力又提升效果（類似“看病時(shí)分科室掛號(hào)，心臟問題找心內(nèi)科專家，不用讓全科醫(yī)生從頭學(xué)到尾”）

DeepSeek自我評(píng)價(jià)道，“DeepSeek像一家精品店，在特定領(lǐng)域更專精；OpenAI像大型超市，啥都有但價(jià)格高。”

DeepSeek能否改寫AI戰(zhàn)局？

真正厲害的領(lǐng)導(dǎo)，從做“壞人”開始:選人要3慢，開人要3快

DeepSeek能否改寫AI戰(zhàn)局？

機(jī)構(gòu)：AI原生APP月活突破2.4億，DeepSeek、豆包等位居Top 3

周鴻祎：開源才是真正難以逾越的壁壘，中美AI技術(shù)將交替領(lǐng)先

原創(chuàng)“戰(zhàn)疫”雜技節(jié)目《出征》：頂上芭蕾詮釋愛與力量

農(nóng)資免費(fèi)送田間 河北清河防疫備耕兩不誤

真正厲害的領(lǐng)導(dǎo)，從做“壞人”開始:選人要3慢， 開人要3快

農(nóng)資免費(fèi)送田間河北清河防疫備耕兩不誤

真正厲害的領(lǐng)導(dǎo)，從做“壞人”開始:選人要3慢，開人要3快