DeepSeek,全稱杭州深度求索人工智能基礎技術研究有限公司,成立于2023 年 7 月 17 日,是一家創新型科技公司,專注于開發先進的大語言模型(LLM)和相關技術。
在硅谷,DeepSeek 很早就被稱作“來自東方的神秘力量”,也是網上熱議的“杭州六小龍”之一。
2024年底,DeepSeek 發布了新一代大語言模型 V3 ,同時宣布開源。測試結果顯示,它的多項評測成績超越了一些主流開源模型,并且還具有成本優勢。
隨后,在世界經濟論壇 2025 年年會開幕當天,中國深度求索公司發布其最新開源模型 R1 ,再次引發全球人工智能領域關注。據該公司介紹,R1 模型在技術上實現了重要突破——用純深度學習的方法讓 AI 自發涌現出推理能力,在數學、代碼、自然語言推理等任務上,性能比肩美國開放人工智能研究中心(OpenAI)的 o1 模型正式版,該模型同時延續了該公司高性價比的優勢。據了解,深度求索公司 R1 模型訓練成本僅為 560 萬美元,遠遠低于美國開放人工智能研究中心、谷歌、“元”公司等美國科技巨頭在人工智能技術上投入的數億美元乃至數十億美元。
在海外出圈之后,DeepSeek 的服務需求激增。此前據媒體報道,DeepSeek旗下 AI(人工智能)服務經歷了多次宕機,可能與新模型發布后的訪問量激增有關。