Memos WorldMemos World
全部时间线

Deepseek

DeepSeek(深度求索)是一家中国AI公司,专注于大型语言模型的研究与开发,代表性产品包括DeepSeek系列模型,如DeepSeek-V2、DeepSeek-R1等。

29 个节点AI
  1. 2026

  2. 微软成为DeepSeek全球最大AI中间商

    彭博社报道,微软已成为全球最大AI模型中转站,既将ChatGPT卖给中国企业,也反向将DeepSeek模型(DeepSeek-R1和DeepSeek-V4)卖给西方客户,构建跨中美AI模型双向贸易网络。

  3. DeepSeek识图模式全量上线

    DeepSeek全量上线网页版识图模式,App进入内测;据报道完成首轮融资,募资超74亿美元,估值或超500亿美元,投资方包括腾讯、宁德时代。

  4. V4-Pro/V4-Flash 权重更新(疑似 V4.1)

    HuggingFace 仓库同步更新权重,对应网页版 6-15 起灰度的 V4.1 Flash;官方 news 页仍停在 4-24,无正式公告。

  5. 首轮融资基本收尾

    据报道募资约 510 亿元、投后估值近 4000 亿元,刷新国产 AI 单轮融资纪录(未经官方确认)。

  6. V4-Pro API 永久降价 75%

    限时优惠结束后三档计费永久调为原价 1/4。

  7. 传梁文锋个人出资 200 亿领投首轮融资

    据报道:梁文锋出资最高 200 亿元(占 40%),腾讯/宁德/京东等跟投,估值 3 周翻 5 倍至约 3500 亿元(未经官方确认)。

  8. DeepSeek-V4 Preview

    发布 DeepSeek-V4 Preview,开源 MoE 新系列,主打百万 token 长上下文处理。

  9. DeepSeek首次外部融资,估值超100亿美元

    据The Information报道,DeepSeek正进行成立以来首次外部融资,目标估值至少100亿美元,融资额至少3亿美元。

  10. 2025

  11. DeepSeek-V3.2 系列

    正式开源 DeepSeek-V3.2 与 V3.2-Speciale;Speciale 斩获 IMO 2025、CMO 2025、ICPC World Finals 2025、IOI 2025 金牌级成绩。

  12. DeepSeek-V3.2-Exp

    发布 V3.2-Exp,引入 DeepSeek 稀疏注意力(DSA);API 再度大幅降价过半。

  13. DeepSeek-V3.1

    发布 DeepSeek-V3.1,思考/非思考双模式混合架构,在 SWE-bench、Terminal-bench 等基准上较 V3/R1 提升超 40%。

  14. DeepSeek-R1-0528

    发布 R1-0528:推理与理解能力显著增强,逼近 o3、Gemini 2.5 Pro,降低幻觉、增强函数调用与编码体验。

  15. DeepSeek-V3-0324

    在 MIT 许可下发布 V3 更新版 DeepSeek-V3-0324。

  16. 开源周

    启动技术「开源周」,连续发布并开源多项底层技术与工程实现。

  17. 震动全球

    DeepSeek App 登顶美区 App Store 免费榜、超越 ChatGPT;引发英伟达股价单日暴跌约 17%、市值蒸发近 6000 亿美元(美股史上单日单公司最大损失),被称「AI 界拼多多」「斯普特尼克时刻」。

  18. DeepSeek-R1 发布并开源

    发布推理模型 DeepSeek-R1 并同步开源权重(MIT 许可),性能媲美 OpenAI o1;同日上线免费 App。

  19. 2024

  20. DeepSeek-V3 开源

    开源 DeepSeek-V3,671B 参数 MoE(约 37B 激活),训练成本估算约 550–600 万美元,性能全面对标海外闭源旗舰。

  21. DeepSeek-R1-Lite 预览

    上线首个推理模型预览版 R1-Lite,媲美 o1-preview,并为之后 V3 的后训练提供合成数据。

  22. DeepSeek-V2.5

    推出 V2.5,并于当年 12 月修订。

  23. DeepSeek-Coder V2

    在 V2 基础上加训 6 万亿 tokens 代码与数学数据,编码及数学推理显著增强,支持编程语言从 86 种扩展到 338 种。

  24. DeepSeek-V2,掀起价格战

    发布 DeepSeek-V2,引入 MLA(多头潜在注意力)架构;API 价格仅为 GPT-4o 约 2.7%,一周内字节、阿里、百度、腾讯纷纷降价跟进。

  25. 2023

  26. DeepSeek LLM 67B

    发布首款通用大语言模型 DeepSeek LLM 67B,对标 Meta LLaMA2 70B,在近 20 个中英文公开榜单上表现更佳。

  27. DeepSeek Coder 开源

    交出首份答卷:开源代码大模型 DeepSeek Coder,含 1B/7B/33B 多种尺寸,提供 Base 与指令调优模型。

  28. 公司成立

    杭州深度求索人工智能基础技术研究有限公司成立,由量化巨头幻方量化创立、梁文锋任 CEO。前身 AGI 实验室于 2023 年 4 月由幻方宣布设立。