DeepSeek
杭州深度求索人工智能基础技术研究有限公司推出的AI助手
DeepSeek是杭州深度求索人工智能基础技术研究有限公司推出的AI助手,免费体验与全球领先AI模型的互动交流,于2025年1月15日正式上线。
研发背景
随着数字经济的蓬勃发展以及各行业对高效、智能解决方案的迫切需求,以及数据量呈指数级增长,信息传播速度加快,人工智能(AI)技术成为推动行业革新的关键力量,2024年12月,视觉模型DeepSeek-VL2、模型DeepSeek-V3首个版本相继发布并同步开源。2025年1月15日,DeepSeek官方App正式上线。
发展历程
2025年1月15日,DeepSeek官方App正式发布,上线平台包括苹果App Store等;1月28日,DeepSeek日活跃用户数首次超越豆包;2月1日,DeepSeek日活跃用户数突破3000万。2月8日,DeepSeek应用日活跃用户数达2215万。截至2月9日,DeepSeek App的累计下载量已超1.1亿次,周活跃用户规模最高近9700万。2月10日,DeepSeek获顶级域名认可。
2025年2月11日,DeepSeek-V3 API服务的优惠价格体验期已结束,从2月9日开始将调整为新的价格:每百万输入tokens 0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens 8元。同日,国家超算互联网平台宣布推出“AI生态伙伴加速计划”,提供3个月DeepSeek API接口免费使用、千万卡时算力资源池等激励。
2025年2月21日,DeepSeek团队在社交平台上官宣将从下周开始开源5个代码库,DeepSeek团队将这一计划定义为“Open Source Week”;同日,数据分析平台QuestMobile最新数据显示,DeepSeek App从上线以来至2月9日,累计下载量超1.1亿次,周活跃用户规模最高近9700万。其中,1月20日至1月26日,DeepSeek App周下载量达到226万次。次周,下载量则直接飙升至6300万次,环比增长超2700%。
2025年2月,DeepSeek API 开放平台页面显示,DeepSeek已重新开放 API 充值。2月24日,DeepSeek宣布启动“开源周”,首个开源的代码库为Flash MLA。2月25日,DeepSeek第二天的开源项目DeepEP正式发布。2月26日消息,浪潮云帆道路病害检测智能体,全面接入DeepSeek系列大模型;云南省融信服平台接入DeepSeek。2月26日,中国软件国际发布公告,中软国际AIGC研究院推出分别面向智慧政务和企业领域的一体机解决方案,一体机以DeepSeek 大模型为引擎。2月,DeepSeek宣布开源Optimized Parallelism Strategies。同月,字节跳动旗下的AI视频生成产品“即梦”考虑接入DeepSeek。2月,上海数据交易所正式接入DeepSeek大模型。2月27日,DeepSeek宣布开源Optimized Parallelism Strategies。2月,上海移动全面接入DeepSeek。2月28日,DeepSeek宣布开源面向DeepSeek全数据访问的推进器3FS。2月,四川省都江堰水利发展中心引入DeepSeek,完成AI大模型本地化部署,正式上线“DS都江堰”智慧大模型。2月28日,同程旅行宣布同程程心大模型将全面接入DeepSeek,成为首家接入DeepSeek大模型的OTA平台。2月以来,同济医院,协和医院,武大人民医院、中南医院,武汉市第一医院等接入DeepSeek人工智能大模型。
2025年3月1日,DeepSeek于知乎开设官方账号,发布《DeepSeek-V3/R1推理系统概览》技术文章,首次公布模型推理系统优化细节,并披露成本利润率关键信息,理论利润率达545%。根据官方公布的这一理论数据测算,用每日56.2万美元的收入,减去每日8.7万美元的GPU成本,DeepSeek理论上最高每天可盈利47. 5万美元(折合人民币约346万元)。3月2日消息,昌平区档案馆依托数字档案馆建设,在国内档案领域率先接入DeepSeek大模型进行本地化部署,实现了档案检索功能重塑,使得“查档”不再是冰冷的数据匹配,而是人与AI的智慧对话。3月,汤姆猫接受机构调研时表示,在底层模型上,汤姆猫AI情感陪伴机器人产品采用MoE(混合专家模型)架构,搭载了公司与西湖心辰定制的“汤姆猫情感陪伴垂直模型”,同时也调用了豆包、DeepSeek等模型的部分能力,有效增强了产品的意图识别、响应速度、数学能力等功能。3月3日消息,泰康保险集团接入DeepSeek系列模型。3月,大同DeepSeek大模型和AI公务员“DeepTong”正式上线。同月,辽宁省疾病预防控制中心正式宣布接入DeepSeek,成为东北地区首家引入AI技术全面赋能公共卫生管理的省级疾控机构。3月,呼和浩特市司法局正式接入国内领先的人工智能技术平台——DeepSeek,成为全市首批引入该模型的政府部门之一。3月3日,中国信息通信研究院宣布,其“智御”个人信息保护大模型正式接入 DeepSeek,实现了个人信息保护领域专业语义精准捕获、多维信息关联分析及持续进化的合规态势感知综合能力跃升。3月,同程旅行宣布同程程心大模型将全面接入DeepSeek,成为首家接入DeepSeek大模型的在线旅行社平台。3月,贵州日报天眼新闻APP 7.0上线,全新接入DeepSeek。3月,宁夏回族自治区81家二级以上公立医院全部接入宁夏卫生健康委员会本地部署DeepSeek国产医疗大模型。3月4日,北京市市场监管局企业登记注册场景接入DeepSeek大模型技术。3月,绍兴市人民医院接入DeepSeek、阿里千问等多款人工智能大模型,围绕患者核心需求,构建全天候的“智能医助”智能体,带来更智能化、人性化的全新就诊体验;数智助手“穗小测”全面接入DeepSeek。3月4日消息,广东药科大学附属第一医院神经外科团队通过DeepSeek筛选方案、机器人精准定位,成功为一名帕金森病患者实施了双侧脑起搏器(DBS)植入手术。3月5日, 华厦眼科DeepSeek模型本地化部署暨AI创新平台。3月,宏昆酒店集团成功接入DeepSeek大模型,推出全新AI工具——“宏小昆”。3月,西安中科立德红外科技有限公司接入DeepSeek。3月7日,晋江市第四实验小学成功完成国产大模型DeepSeek-R1的校园本地化部署。3月10日,华为擎云商用PC新品支持端侧DeepSeek。3月10日,全球领先的商用显示解决方案提供商海信商显正式发布全球首款会议智能体接入DeepSeek的会议平板。3月10日,安徽省率先在全国省级层面完成DeepSeek满血版(671B)本地化部署。3月11日消息,黄河水利委员会加快实施“人工智能+水利”行动,完成国产大语言模型DeepSeek本地化部署。3月14日消息,巨人网络旗下社交推理游戏《太空杀》接入DeepSeek,首创基于DeepSeek打造的原生游戏玩法。3月,山东外国语职业技术大学成功部署Deepseek大模型。教职员工可通过钉钉-智慧校园-山外Deepseek使用本地版Deepseek。3月17日,郑州市城市管理保障中心举办Deepseek、无人机协同查处违法建没专题讲座,旨在提高治违人员运用Deepseek处理无人机图片能力,提升查违治违工作的效率。3月18日,人工智能通识及应用网络专题培训在浙江省委党校正式开班。此次专题培训由浙江省委组织部会同省委党校等单位共同研究谋划,旨在提升全省干部的人工智能素养。此次培训时间为3月到6月,共开展10期教学。3月20日,华为正式发布了“阔折叠”手机Pura X,搭载全新AI助手小艺,深度融合盘古大模型与DeepSeek技术。3月26日,从美团获悉,美团外卖“神抢手”已全面接入DeepSeek。消费者可以使用AI进行“缘分测试”,获得商品卖点和健康指引等信息。3月31日报道,据AI分析平台aitools.xyz,DeepSeek已经成为全球增长最快的AI工具,其每月新增网站访问量已经超过OpenAI的ChatGPT。 报告称,DeepSeek2025年2月访问量达到5.25亿次,超过ChatGPT5亿次。 DeepSeek市场份额6.58%,仅次于ChatGPT和Canva,二者分别占比43.16%和8.27%。3月缅甸发生中部地震后,中国驻缅甸使馆称,前方在使用基于DeepSeek紧急开发的中缅英互译系统。
功能服务
DeepSeek其核心技术优势包括自然语言处理(NLP)、机器学习与深度学习大数据分析、个性化推荐、智能交互、跨平台整合以及安全性与隐私保护,并在以下八大领域展现出强大能力:
具备强大的逻辑推理和问题解决能力,能处理复杂的查询和任务,提供准确的答案和解决方案。
能进行高质量的文本分析、翻译、摘要生成等任务。
在图像识别、视频内容分析等领域具有高精度,能实现物体检测、场景理解、面部识别等功能。
能准确识别和合成语音,支持多语言和方言,适用于语音助手、语音输入等应用。
能根据用户行为和偏好,提供个性化内容推荐,提升用户满意度和参与度。
能高效处理和分析大规模数据,挖掘数据中的模式和趋势,支持数据驱动的决策。
支持文本、图像、语音等多种模态的数据融合和学习,能实现更丰富和全面的理解和推理。
智能助手和聊天机器人实现实时的自然语言交互,快速响应用户需求。
核心技术
数据蒸馏技术:DeepSeek使用数据蒸馏技术来生成高质量数据。这项技术通过提取和利用数据中的关键信息,优化了训练数据集,从而提高了训练效率。
“混合专家”方法:DeepSeek采用了一种创新的“混合专家”方法。在用户提出问题时,模型会智能地判断是否需要激活其内部的医疗专家、翻译、律师或物理学家等特定领域的专家系统。这与传统模型不同,传统模型往往会同时激活所有专家系统,造成能源和计算能力的浪费。DeepSeek通过将这些小型“专家”系统与一个“通才”系统结合,实现了相同的功能,但更加高效。“通才”系统对各个主题都有一定的了解,能够有效地协调各个专家系统之间的互动,从而提升整体性能。
核心团队
重要事件
接入模型
商业活动
2025年2月15日,2025年第一期郑州全市领导干部“问学前沿”讲堂举行,邀请清华大学元宇宙文化实验室主任、新媒体研究中心主任、新闻学院和人工智能学院双聘教授沈阳,围绕“AIGC(人工智能生成内容)与DeepSeek”作专题辅导。
2025年2月,深圳市福田区上线福田区政务大模型2.0,率先推出基于DeepSeek开发的AI数智员工,首批70名已“上岗”。
2025年2月,小恒数科官宣旗下自主研发的大语言模型“恒纪元”正式接入DeepSeek,开启了数智金融服务的新纪元。
2025年2月,已有超过12个省区市政府部门宣布开展DeepSeek大模型的相关应用。
2025年2月,四川省人民医院通过国产自主研发的“DeepSeek大模型”,将人工智能(AI)技术用在看病全流程中,成为省内首家实现医疗全场景智能化落地的三甲医院。
禁用事件
2025年2月5日,韩国外交、国防和产业部门对中国产人工智能大模型DeepSeek平台采取屏蔽措施。多数政府相关人士称,因各方对DeepSeek存在技术性忧虑,担心敏感信息外泄,国防部、外交部和产业通商资源部自行决定限制通过支持外网连接的电脑登录该平台。2月17日,韩国政府表示,出于对中国人工智能(AI)应用程序DeepSeek的担忧,已暂停该应用程序的下载。
2025年2月4日,澳大利亚政府以所谓“担心安全风险”为由,已禁止在所有政府设备中使用DeepSeek。
2025年2月,美国国会提出《2025年美国人工智慧能力与中国脱钩法案》,该法案禁止美国人协助中国推动AI,并禁止美国人下载或使用DeepSeek,否则将被定性为犯罪,最高可判处20年监禁及处以100万美元的罚款。当地时间2月6日,两名美国两党众议员提交议案,呼吁禁止中国人工智能(AI)应用程序DeepSeek在联邦设备上使用。谈及原因时,两人重复着所谓“国家安全”“虚假信息”等陈词滥调。但其中一人坦承,封禁DeepSeek,因为美国“输不起”。当地时间2月7日,美国总统特朗普表示,不认为DeepSeek是国家安全的威胁。并称,这是技术的发展,将有助于降低人工智能(AI)的成本。
2025年2月11日,丹麦Radio4广播电台援引当地政府的消息报道,丹麦五大区中已有三个大区出于安全考虑禁止政治家们使用中国的DeepSeek聊天机器人。这项法案重复了国会禁止联邦政府人员在政府的设备上使用短视频应用TikTok的策略。
2025年3月13日,美国人工智能公司OpenAI 向美国政府提交了一份长达15页的信函,称DeepSeek的最新模型R1是一个值得关注的进展。OpenAI还在信中攻击DeepSeek,称其会带来“重大风险”,并要求美国政府采取行动。
2025年3月,据路透社和两名知情人士看到的消息,美国商务部各部门最近几周通知工作人员,中国人工智能(AI)模型深度求索(DeepSeek)已被禁止在其政府设备上使用。
2025年2月6日,针对一些国家禁止或限制使用DeepSeek,外交部发言人郭嘉昆表示:中国政府高度重视并依法保护数据隐私和安全,从来没有也不会要求企业或个人以违法的形式采集或存储数据。中方一贯反对泛化国家安全概念、将经贸科技问题政治化的做法,同时中方也将坚定维护中国企业的合法权益。
2025年2月17日,韩国暂停DeepSeek下载,外交部发言人郭嘉昆回应称:中国政府一贯要求中国企业在严格遵守当地法律法规的基础上开展海外运营。我们也希望有关国家避免采取将经贸科技问题泛安全化、政治化的做法。
2025年3月10日,外交部发言人毛宁主持例行记者会。法新社记者提问,据《华尔街日报》报道,美国总统特朗普正在权衡限制DeepSeek的措施,包括禁止政府设备使用DeepSeek。中方对此有何回应?毛宁表示,我们一贯反对泛化国家安全概念,将经贸和科技问题政治化。我们也将坚定维护中国企业的合法权益。
2025年3月18日,在举行的中国外交部例行记者会上,外交部发言人毛宁在回应外媒记者美商务部已禁止在政府设备上使用DeepSeek对此有何评论的提问时表示,中方一贯反对泛化“国家安全”概念,将经贸和科技问题政治化,我们也将坚定维护中国企业的合法权益。
卖课事件
2025年2月,随着DeepSeek的流行,网络上涌现大量与DeepSeek相关的课程,但很多只是拼凑公开资料牟利。6日,DeepSeek官方发布声明,其平台不含广告和付费项目,也未设立非官方群组,提醒消费者防范假冒收费行为。
用AI赶作业
2025年2月,学生用DeepSeek等AI应用赶作业引发热议。有老师测试发现,虽然DeepSeek能给出正确答案,但解题过程存在逻辑漏洞,类似学生猜测答案后浑水摸鱼。
被当作老中医
2025年2月,有人向DeepSeek索求中医处方。记者体验发现,DeepSeek能针对症状提供可能的病因、处方建议等。但医生指出,由于缺少性别、年龄等关键信息,AI的诊断可能不精确。中医的“望闻问切”在AI问诊中无法实现,尤其是舌诊这一重要环节。同时,虽有医学博主因DeepSeek更新医学指南而感到震惊,但资深医生认为,AI目前还不能完全取代医生的专业判断。
股价影响
2025年1月,DeepSeek推出低成本的开源大语言模型R1,挑战了依赖高算力芯片的AI训练商业模式,导致英伟达市值大跌。黄仁勋回应称,AI技术不仅有预训练,还有重要的后训练阶段,其计算需求量相当大,对英伟达依然有利。
2025年2月,北京市政协委员王磊称,非专业人士切勿用DeepSeek炒股票。
算力影响
2025年2月,随着DeepSeek大模型被广泛适配和接入,算力硬件及租赁市场迎来翻转,需求增长快速显现。
优化策略
2025年2月27日10点5分,DeepSeek发布了其“开源周”第四日的内容:优化的并行策略,其中包括DualPipe,一种用于V3/R1训练中计算与通信重叠的双向管道并行算法, 以及EPLB,一种针对V3/R1的专家并行负载均衡器。
高利润
2025年3月2日,DeepSeek在开源周最后一天公布V3/R1推理系统理论日利润高达346万元人民币(约合47.5万美元),引发业界广泛讨论。
DeepSeek澄清称,这一理论收益并非实际收入,实际收入远低于理论数值。
DeepSeek方面表示,V3版本定价较低,且收费服务仅占一部分,网页端和应用程序对用户免费开放,夜间还有折扣政策,因此实际收入远低于理论数值。
被禁止在美国政府设备上使用
2025年3月,据路透社和两名知情人士消息,美国商务部各部门最近几周通知工作人员,中国人工智能(AI)模型深度求索(DeepSeek)已被禁止在其政府设备上使用。在3月18日举行的中国外交部例行记者会上,外交部发言人毛宁在回应外媒记者“对此有何评论”的提问时表示,中方一贯反对泛化“国家安全”概念,将经贸和科技问题政治化,我们也将坚定维护中国企业的合法权益。
网页不可用
2025年3月20日午间,DeepSeek服务状态页面显示,DeepSeek R1网页/API不可用。随后,DeepSeek更新状态显示,问题已被解决。
库克回应
2025年3月23日,据中国新闻网消息,库克现身中国发展高层论坛开幕式,被问及是否用过DeepSeek?库克表示:当然,很棒!
影响评价
DeepSeek在电池知识问答和电池文本挖掘任务上均表现优异,在电池设计任务上具备初步的总结能力,但尚欠缺科学分析能力,仍需要垂直领域大模型解决。(中国科学院院士、平台理事长欧阳明高 评)
DeepSeek采取的开源策略,是其迅速走红全球的另一大关键。在美国的技术“围剿”、封闭源代码成为常态背景下,DeepSeek在封锁线上“凿开”了突破口,毅然选择开源,打破了AI领域的闭源模式,推动了开放生态的拓展。此举不仅吸引了大量开发者围绕DeepSeek构建应用生态,还提升了行业透明度和创新性,展现了中国AI科技企业的开放态度和责任担当。(央视网 评)
DeepSeek公司取得的重大进展,代表着一批中国公司在人工智能领域的崛起。DeepSeek公司坚持开放开源的技术路线,开源共享推动了人工智能技术在全球的普遍应用,为世界贡献了“中国智慧”。通过DeepSeek这类公司的兴起,我们可以看到中国在科技发展上的创新性和包容性。(十四届全国人大三次会议大会发言人娄勤俭)
2025年3月5日,十四届全国人大三次会议上,教育部部长怀进鹏表示,DeepSeek和机器人在最近一段时间引起国内外的广泛关注,从一个方面也说明了中国科技创新和人才培养的效果。历史上每一次重大科技革命和产业变革,都对社会提出了特别重要的需求,尤其是对教育,所以DeepSeek和机器人是教育改革和发展的重大机遇。
2025年3月,商务部部长王文涛表示,深度求索(DeepSeek),凭借着低成本高性能的开源模式,降低了全球技术使用的门槛。
2025年3月7日,中共中央政治局委员、外交部长王毅在十四届全国人大三次会议新闻中心举行记者会。王毅表示,从当年的“两弹一星”到神舟、嫦娥,再到5G、量子计算,还有DeepSeek,一代代中国人的奋斗从未止步,中国的科技强国之路越走越宽。当然这条道路并非一片坦途,无论是航天科技,还是芯片制造,外部施加的无理打压从未停歇过,但哪里有封锁,哪里就有突围,哪里有打压哪里就有创新。
参考资料
DeepSeek APP.DeepSeek.2025-01-16
最新修订时间:2025-04-03 16:47
目录
概述
研发背景
发展历程
参考资料