出品|虎嗅商業消費組
作者|苗正卿
題圖|視覺中國
出品|虎嗅商業消費組
作者|苗正卿
題圖|視覺中國
面對DeepSeek沖擊,互聯網大廠們正在重新調整AI策略。
3月初,騰訊元寶徹底擁抱DeepSeek,并借力DeepSeek完成熱度反超。幾乎與此同時,字節旗下火山引擎、飛書,阿里旗下國際站、阿里云、釘釘紛紛宣布接入DeepSeek。
一場互聯網大廠的DeepSeek愈演愈烈,而這背后是各大廠針對AI的關鍵博弈。
在這波接入DeepSeek熱潮中,京東也身處其中。2月初,京東云正式上線 DeepSeek - R1 和 DeepSeek - V3 模型,并率先在行業里推出DeepSeek一體機。
和騰訊、字節通過元寶、豆包發力AI to C市場不同,2024年京東在AI端重點發力言犀大模型、數字人、智能體平臺、智能編碼助手JoyCoder等B端產品。截至2024年底,京東平臺上已經有80萬商家使用了京東AI工具。
不過,擺在京東面前的也是更為激烈的2025年:隨著字節、阿里紛紛在AI to B領域加注,以及百川、智譜等AI獨角獸公司進一步轉向B端市場,圍繞AI to B的競爭進一步加劇。
DeepSeek到底改變了AI圈的哪些底層邏輯?to B市場到底有哪些關鍵機會?京東做好準備了嗎?
在京東云宣布接入DeepSeek后,虎嗅第一時間與京東科技人工智能業務部總裁、京東探索研究院院長何曉冬進行了交流,請他分享了對于DeepSeek沖擊、AItoB行業競爭以及AI技術趨勢的一系列思考。值得注意的是,近日中國人工智能學會發布2024年度“吳文俊人工智能科學技術獎”公告,京東科技人工智能團隊憑借“多模態交互式數字人關鍵技術及產業應用”項目榮獲中國智能科學技術最高獎——吳文俊人工智能科學技術獎的特等獎,也是本年度唯一的特等獎。
下附交流實錄,有刪改:
DeepSeek重塑了商業格局
虎嗅:DeepSeek年初的這波熱潮對你而言沖擊比較大的地方是什么?
何曉冬:我覺得有兩點很有意思,DeepSeek技術上做的深度推理以及它R1的開源模式。這兩點深刻重塑了AI行業格局。
技術上講,OpenAI 把API分了5個層次,就是L1到L5,第一層是偏人機對話語言理解這部分,第二層就開始涉及到深度推理。如果按照這個分類看,OpenAI發布的O1和DeepSeek發布的R1意味著我們正式從L1向L2階段邁進了。
其實在2023年底,硅谷的技術圈就有說OpenAI在開發一個叫做Q-Star的強化學習算法項目為GPT-5做準備。當時我們只是聽到這個名字,但一聽到名字就能想到Q能力就是經典的強化學習。我們聯想到,或許有點類似于AlphaGo這樣的方式,就是會用強化學習配上搜索來做深度推理。只是當時我們覺得,圍棋畢竟是一個固定域或者說封閉域,如果做到開放域,也就是大模型上的開放智能,其實是有很多技術挑戰的。
但看得出來,2023年底,其實大家已經看到這個技術方向了,2024年7月o1就開始做出來了。2024年4月份的時候,我在清華大學參加一個AI人工智能論壇時,說了一個觀點,未來可能有兩個方向,一個是深度強化學習,就是用模型來訓練模型,因為光靠人訓練模型在GPT4已經快到頂了。第二個方向就是 “合成數據”,因為普通數據幾乎用完了,下一步可能需要通過更加高效的合成數據來做這個事情。
可以說技術的進步確實挺快的,很多人雖然都看到了這個技術方向,但真正做出來的并不多。但對于未來大家應該更有信心了,尤其是模型開源和論文開源后。
另一個沖擊或者說影響是,開源本身重塑了商業格局。比如OpenAI就首先受到了沖擊,它的商業模式受到很大影響。但說到底,開源是一個非常好的事情,它降低了模型的成本,打開了應用的空間,大小公司都可以更低成本去運用AI能力構建應用,這會帶來生態的百花齊放。
京東也在考慮怎么利用這個機會,包括我們也快速把DeepSeek上到了京東云,給我們大小客戶提供這個能力,我們還提供私有化部署DeepSeek的能力,包括面向行業的解決方案。
虎嗅:當剛才你也說到,其實從23年底大家都在討論或者說都看到了一些趨勢,但為什么做出來的只有這么一家公司?
何曉冬:2024年上半年,很多人還是把精力放在了“大”上,比如追求更大的模型、追求更多的卡,搞萬億級或者10萬億級規模,大家只看到了所謂的尺寸Scale,并沒有真正深度認識到推理的重要性。
到了2024年下半年,大家看到了推理的重要性。DeepSeek是一個非常純粹的技術公司,他們基于這種純粹性更能夠看到技術本身的深刻性,所以在推理這些方面投入會更加堅決。
虎嗅:DeepSeek引發的另一個熱議話題就是開源,好像一年前乃至于2024年四季度,大模型圈對于開源閉源的判斷并不像今天這樣,為什么DeepSeek堅決走這條路?
何曉冬:回到一年前,只有OpenAI的技術領先且能比別人拉開一個身位,它不開源,所以大家會覺得開源的意義沒有那么大。其實一年多前,Meta的Llama模型也在開源,但它的效果確實比OpenAI差一些。以及,大家會覺得,閉源或許是一個可以成立的商業模式。
DeepSeek為什么對于開源這件事影響這么大呢?我覺得是因為它用一個很高質量的模型沖擊了OpenAI的護城河,大家會覺得開源生態能夠建起來了。所以很多時候,關鍵公司、關鍵的人的一些影響,會改變大家對一些問題的根本性看法。
虎嗅:開源的想象力空間打開后,對于京東在做的事情有哪些影響?
何曉冬:AI的技術競賽會持續下去,這意味著需要進一步投入。我們不能停也不會停。從京東做大模型的實踐中,我們看到在應用層確實現出現了很多機會,尤其是DeepSeek帶來的周邊生態影響。大量客戶都意識到可以用相對低廉的價格部署一個高質量的DeepSeek模型。所以你看京東云以及其他的云,都在部署。隨之而來的,也帶來了一些機會。
在技術和應用上,大家都會有更大的動作。在技術上,我們會吸收這些最新的論文里面的技術,比如進一步做強化訓練、進一步使用包括蒸餾在內的技術。市面上現在頭部的模型,都在嘗試這種綜合性蒸餾以提高效率。
在應用上,我們在擁抱DeepSeek本身,快速接入到我們的AI全系產品中,直接給客戶提供端到端的服務。比如用它來寫直播文稿、營銷文案,我們一直在嘗試。但同時也發現了一些問題,比如幻覺太高。在嚴肅使用的場景里,需要我們微調的地方還有很多,比如用DeepSeek生成權益文案,有時候會出現一些并不存在的權益,對于商家而言這是不可接受的。對于整個B端而言,開源的DeepSeek目前在適配中存在的最大挑戰就是幻覺,我們在想各種辦法把幻覺降下來。
AI to B市場拼的不只是技術
虎嗅:你覺得在AI to B市場,今年的競爭情況是怎樣的?
何曉冬:其實AI to C和AI to B都是我們想做的。AI to B其實可以分為兩個層次,一個叫做Model Service,一個叫做Software Service,前者是更加基礎的服務。這個Model Service包括了模型、API接口,以及剛才提到的DeepSeek上云,以及更上層智能應用的開發。我們目前就在提供這樣的能力,不久的將來我們會提供新一代的能力,比如API調用等。
Software Service,是一種端到端的產品,比如一些深度閉環的AI產品,包括智能客服、智能營銷,還有數字人直播,就是這樣的產品。
通過這兩類AItoB產品,我們可以形成商業化閉環,我覺得大家都有機會。
虎嗅:好像和之前京東在AI上的思路沒啥變化?
何曉冬:對,京東的戰略是比較有定力的。DeepSeek開源,對于京東而言,可以讓我們之前想做的一些商業化模式有更高的效率或者說更低的成本。但是DeepSeek開源并不會改變京東根本性的思路。
虎嗅:你們是選擇MaaS多一些還是SaaS多一些?
何曉冬:這兩邊都在并行推進。在DeepSeek開源后,MaaS的機會確實不太一樣。開源之前,我們做MaaS往往基于云之上,然后采用自己或者業界的開源模型,但當時業界的開源模型一般效果會差一點,所以自己的模型收費一般更高一些。但DeepSeek開源后帶來的較大的沖擊是,我們自己的收費模型需要和免費的開源DeepSeek做出差異化,才能讓商業模式閉環。
所以現在的情況變了,一種是拼部署成本誰更低,包括了更低的成本或者更高的并行推理技術;第二種是在DeepSeek基礎上做進一步的微調,或者說做強化學習、做蒸餾,改變它的幻覺問題,也就是在特定行業上做培育,幫助企業構建自己的大模型,這樣DeepSeek的價值可以更好地呈現。這兩個模式,都是當下MaaS可以做的,也是京東有技術積累,能夠商業化的部分。
在SaaS部分,基座模型只是其中一部分,整體效率、場景、端到端體驗都是核心問題。這就會衍生出在應用層的差異化,由此會帶來新的商業模式。
這一部分我們現在做的比較多的是AI客服、AI營銷以及數字人。以數字人為例,現在數字人已經不只是語言大模型和其他大模型的多模態結合了。它是一個綜合性的產品級比拼,商家看重的是AI帶動最終的銷售效果。就好比在互聯網時代,當互聯網已經變成了基礎設施,大家拼的就不是網速而是不同的應用了。而當時京東能夠勝出,除了有技術因素,也包括了整體終端的體驗、運營方法論、直播流量與玩法等一系列因素。
京東發力AI分了三步走
虎嗅:你們做AI時,當時有具體的目標嗎?
何曉冬:早在2020年左右,我們提出過一個規劃,現在回看我們其實還是按照這個規劃走的。我們當時講要做到“一個平臺三級火箭”。一個平臺是指,我們需要一個基礎大模型平臺,當時,我們已經看到模型的規模效應價值了,所以這個是必須要做的。而在這個平臺上,我們規劃了三級火箭:從AI智能客服,到AI營銷,然后智能交互媒體,指的是數字人等產品。
AI客服其實是一個比較具象的產品,在2020年我們就做好了。當時我們也開始做AI營銷,主要是想用AI把營銷升級。我們也希望AI可以給營銷帶來一些顛覆性創新,比如用AI語音去做營銷推廣、關系維護,甚至做助理和導購。在這個領域,我們進一步看到了智能交互的價值,包括延展到今天數字人這樣新型的人機的界面。這幾個方向是我們當時規劃好的,我們今天其實也依然按照這幾個方向在做。
智能客服其實是一個比較成熟的賽道,AI營銷未來還有巨大的空間。你看國外的幾個巨頭,它們AI的商業化很多都包含營銷。智能交互包含AIGC,這里面不只是數字人,還有AI生圖、AI生音視頻,這些技術又能支撐很多新的APP和業態出現,也就是說,它可以把社交、內容、搜索、電商都重新做一遍。這個想象空間是巨大的。
它其實很像當年的互聯網,互聯網剛出現時,大家一窩蜂覺得賣網關最賺錢,后來出現的早期商業模式也只是發郵件。但你回看,會發現這些只是前菜,后來那么多巨頭公司、萬億級別公司,在二三十年前最早的互聯網時代幾乎都不存在。
虎嗅:這幾年京東在AI投入上的比例是怎樣的?
何曉冬:我們一直在堅定的投入AI。 DeepSeek給我們的啟示是,我們整個計劃提速了,這其實是一個動態競爭,DeepSeek讓圍繞AI的競爭更加激烈了,當然機會也更多。
虎嗅:2023年的時候,你們糾結過嗎?
何曉冬:2023年的時候糾結過,包括投入規模、以及先后次序、時間空間上到底怎么分配資源。
虎嗅:你們在AI上的投入,和你們實現商業化之間有一些關聯嗎?
何曉冬:我們比較大的項目是通過專項去投入。京東探索研究院里有很多致力于長期研究的AI方向,集團層面對AI是有長期信心的。
虎嗅:你們當時規劃京東的AI戰略時,參考了什么國內外公司的樣板嗎?
何曉冬:前期主要是通過技術的發展趨勢做研判,通過技術趨勢做核心技術的積累與突破,這個是由京東探索研究院以及基礎算法的同學承擔這個責任。
第二個階段,我們是想形成一個能力平臺,這樣才能夠落地生成產品化應用。第三個階段則是強化生態,我們要把技術生態、產品生態、服務生態都做起來。從我們現在做的事情來看,我們處于第三個階段。但我們也看到,平臺光有API是不夠的,你需要有標桿式的示范性、拳頭產品。一方面這些產品本身可以帶來利潤,另一方面這些產品可以讓生態伙伴看到標桿性案例,才能吸引大家來一起做生態。
虎嗅:此刻你對AI未來,有哪些核心預判?
何曉冬:首先是合成數據應該會成為趨勢,它會類似我們合成材料一樣,成為未來的基礎。我們現在用的主要是大眾數據,就是互聯網上幾千億、幾萬億的數據,我們關心的其實是數據里面的智力而不是數據本身,所以在訓練模型時我們實際上是要把這些數據之中的智力榨取出來。但大眾數據能夠提供的智力已經快到邊界了,接下來如果我們想進一步提升模型智力水平,不能依靠大眾數據里面的智力了,而是需要更高智力密度的數據。這也是為什么現在很多模型用數學奧賽題做訓練,然后再通過其他模型蒸餾、做強化學習。
合成數據和強化學習,模型與模型之間的對抗,是接下來模型發展的關鍵。而更深的一層是,要讓這些模型的智力水平進一步提升讓其走入真實世界,并在真實世界接任務、進行交互與對抗,繼續提高智力水平。
虎嗅:在這些方面,京東探索研究院做了哪些準備工作嗎?
何曉冬:京東探索研究院有一個三步臺階的布局——從語言大模型到多模態智能再到具身智能。這其實是整個AI走向AGI(通用人工智能)或者ASI(超級人工智能)的過程。也就是說,從語言和認知智能擴展到多模態智能后,下一步一定是實體世界智能。
支持一下 ??修改