speaker1
歡迎來到我們的播客!今天我們將帶您深入了解中國AI公司DeepSeek的崛起之路。DeepSeek如何在美國的嚴厲制裁下,利用有限的資源,開發出性能不輸OpenAI的AI模型?我是你的主持人,今天非常開心邀請到我的協主持人,一起來探討這段令人驚嘆的歷程。
speaker2
嗨,大家好!這裡是協主持人。我對這個話題非常感興趣,DeepSeek的故事聽起來真的很驚人。主持人,你能先給我們介绍一下DeepSeek的成立背景嗎?
speaker1
當然可以。DeepSeek是由中國的對沖基金幻方量化於2023年成立的。幻方量化是一家利用AI進行投資的公司,他們在金融市場上取得了非常豐碩的報酬。幻方量化的共同創辦人之一梁文鋒,在2022年ChatGPT問世後,意識到AI新時代的到來,開始在公司內研發大語言模型,並採購輝達的GPU。這就是DeepSeek成立的緣起。
speaker2
哇,聽起來真的很有趣。那DeepSeek的第一個大語言模型是什麼?它有哪些特點?
speaker1
DeepSeek的第一個大語言模型是DeepSeek-Coder,於2023年10月28日發布。這是一個專門用於程式設計的模型,當時表現已經非常出色。接著在11月29日,他們發布了DeepSeek-LLM,這是一個通用的大語言模型,性能也非常強大。短短幾個月內,DeepSeek就發佈了多個模型,這显示了他們的研發能力非常強大。
speaker2
太驚人了!那DeepSeek V3有哪些性能和成本優勢呢?為什麼它受到了如此多關注?
speaker1
DeepSeek V3是一個參數高達6,710億的大語言模型,它的預訓練只用了55天,使用2048張H800 GPU叢集,費用僅557.6萬美元。這對動輒耗資數十億美元的美國先進AI公司來說,無疑是一個巨大的衝擊。DeepSeek V3速度快、好用,而且有免費版,雖然在精深或困難問題的回應上還比不上美國的頂尖LLM,但它的性能仍然非常傑出。
speaker2
那DeepSeek R1呢?它的性能如何?對全球市場有哪些影響?
speaker1
DeepSeek R1是一個推理模型,於2025年1月20日發布,這也是開源模型。DeepSeek R1在數學、代碼、自然語言推理等任務上的性能與OpenAI o1正式版相當。发布後,它在全球範圍內受到了廣泛關注,短短數星期,下载次數超過1,800萬次,成為很多地區AI類App的下載次數排行榜前列。這對全球AI市場產生了巨大影響。
speaker2
真是太棒了!那DeepSeek的開發資源和技術創新有哪些值得一提的地方?
speaker1
DeepSeek的開發資源非常豐富。根據SemiAnalysis網站的資料,DeepSeek可運用的算力資源包括A100 1萬張、H20 3萬張、H800 1萬張、H100 1萬張。這些GPU應該是幻方量化在2021年起就開始購買的,推測A100是禁令前購買,H800、H20應該是合法購買,因為它們是為中國市場生產的降規版GPU。這些GPU加上組裝成伺服器及營運成本4年預估總共約25.73億美元。
speaker2
哇,這個數字真的很驚人。那DeepSeek的開放源碼策略是什麼?為什麼選擇這樣做?
speaker1
DeepSeek選擇開源是因為他們希望讓更多人能夠使用和改進他們的模型。DeepSeek的開源模型包括DeepSeek R1、DeepSeek-V2、DeepSeek-V3等。這些模型可以自由下載並安裝在終端設備上,個人電腦加裝高階圖形顯示卡後,即可運行這些模型。這種開放源碼策略不僅促進了技術的傳播,也讓更多的開發者能夠參與進來,推動AI技術的進步。
speaker2
那DeepSeek對全球AI市場有哪些具體的影響呢?對其他國家的AI開發模式有什麼啟示?
speaker1
DeepSeek的成功對全球AI市場產生了巨大影響。首先,它打破了美國在AI領域的壟斷地位,讓更多國家看到了開發高性能AI模型的可能性。其次,DeepSeek的開放源碼策略為其他國家提供了借鑒,例如俄羅斯、伊朗、巴基斯坦等受美國管制AI晶片出口的國家,也可以循此模式開發出類似的大語言模型。這無疑將推動全球AI技術的進步和創新。
speaker2
真是太有意思了!那麼DeepSeek的商業模式和市場策略是什麼?他們未來有什麼計劃?
speaker1
DeepSeek的商業模式主要是通過提供低價的API服務來獲利。例如,DeepSeek-V2的API定價為每百萬Tokens輸入人民幣1元、輸出人民幣2元,價格僅為GPT-4 Turbo的百分之一。這種低價策略讓更多的企業和開發者能夠使用他們的模型,從而擴大市場份額。未來,DeepSeek計劃繼續推出更多的高性能模型,並進一步優化現有模型的性能,以保持其在全球AI市場的競爭優勢。
speaker2
真是太精彩了!今天這期播客讓我們對DeepSeek有了更全面的了解。感謝主持人帶來的精彩分享,也希望聽眾們能夠從中獲得不少啟示。
speaker1
非常感謝大家的收聽!如果你對DeepSeek或AI技術有任何感想或問題,歡迎在評論區留言。我們下期見!
speaker1
AI專家/主持人
speaker2
協主持人