DeepSeek,全称
杭州深度求索人工智能基础技术研究有限公司。DeepSeek是一家创新型科技公司,成立于2023年7月17日,使用数据蒸馏技术,得到更为精炼、有用的数据。由知名私募巨头幻方量化孕育而生,专注于开发先进的
大语言模型(LLM)和相关技术。注册地址:浙江省杭州市拱墅区环城北路169号汇金国际大厦西1幢1201室。法定代表人为
裴湉,经营范围包括技术服务、技术开发、软件开发等。
发展历程
早期发展
DeepSeek成立于2023年7月17日,由知名量化资管巨头幻方量化创立。DeepSeek是一家创新型科技公司,长久以来专注于开发先进的大语言模型(LLM)和相关技术,作为大厂外唯一一家储备万张A100芯片的公司,幻方量化为DeepSeek的技术研发提供了强大的硬件支持。
2023年8月2日,注册资本变更为1000万元,章程备案,投资人变更为
宁波程恩企业管理咨询合伙企业(有限合伙),市场主体类型变更为其他有限责任公司。
2024年5月7日,DeepSeek发布了MoE架构的DeepSeek V2。两天后,第一财经技术中心就对DeepSeek发布的技术报告和模型进行了深度分析与研究。经过严谨的评估,团队认为DeepSeek V2在架构设计、性能表现等方面与财经垂类大模型的需求高度契合,于是果断决定将基座模型迁移至DeepSeek V2,并迅速启动了以DeepSeek V2为主力基座模型的财经垂类大模型的训练与应用研发工作。
2024年9月5日,DeepSeek官方更新API支持文档,宣布合并DeepSeek Coder V2和DeepSeek V2 Chat两个模型,升级推出全新的DeepSeek V2.5新模型。官方表示为向前兼容,API用户通过deepseek-coder或deepseek-chat均可以访问新的模型。
2024年12月,DeepSeek开源大模型DeepSeek-V2的关键开发者之一
罗福莉将加入
小米,或供职于
小米AI实验室,领导小米大模型团队。同月,一份关于DeepSeek发布历程、优化方向的专家会议纪要文件在业内流传。对此,DeepSeek 回应称,公司未授权任何人员参与券商投资者交流会,所谓“DeepSeek专家”非公司人员,所交流信息不实。DeepSeek表示,公司内部制定有严格的规章制度,明令禁止员工接受外部访谈、参与投资者交流等市场上各类面向投资者的机构信息交流会。相关事项均以公开披露信息为准。
模型爆火
2025年1月下旬,DeepSeek的R1模型发布后的一周内,DeepSeek刷屏美国各大主流媒体和社交网站。其中一部分原因为,TMT Breakout在与网友的讨论中,隐隐将英伟达周五下跌的原因指向DeepSeek的爆火。即R1的成功可能削弱了市场对英伟达AI芯片需求的预期,导致交易员做空英伟达股票,进而引发股价下跌。1月22日,美国媒体Business Insider报道称,DeepSeek-R1模型秉承开放精神,完全开源,为美国AI玩家带来了麻烦。开源的先进AI可能挑战那些试图通过出售技术赚取巨额利润的公司。
2025年1月26日,有网友反应,DeepSeek崩了,提示服务器繁忙。新浪科技询问DeepSeek今天下午是否有闪崩时,DeepSeek回应称:1月26日下午DeepSeek确实出现了局部服务波动,但问题在数分钟内得到解决。此次事件可能与新模型发布后的访问量激增有关,而官方状态页未将其标记为事故。
2025年1月27日,来自国产大模型公司“深度求索”的
DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了
ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。
2025年1月27日,DeepSeek服务状态页面显示,DeepSeek网页/API不可用,目前正在调查该问题。对于DeepSeek网页/API不可用的原因,DeepSeek回应称,可能和服务维护、请求限制等因素有关。1月27日晚,DeepSeek服务再次“宕机”,DeepSeek服务状态页面显示,DeepSeek网页不可用,公司正在调查这一问题。1月27日,DeepSeek服务状态页面显示,20点55分,DeepSeek对话服务已恢复,账号服务仍存在问题,用户或无法登录及注册。21点05分,DeepSeek更新称,将继续监测故障。
当地时间2025年1月27日,纳斯达克股指出现3%下跌,原因是中国人工智能公司DeepSeek模型引发美国投资者关注。央视记者在纳斯达克交易所现场对纳斯达克副主席麦柯奕进行了采访。麦柯奕表示,他认为,DeepSeek将是人工智能领域革命的重要组成部分。
当地时间2025年1月27日晚,美国总统特朗普在佛罗里达州迈阿密发表讲话时,对中国人工智能初创公司DeepSeek搅动纳斯达克一事表示,DeepSeek的出现“给美国相关产业敲响了警钟”,美国“需要集中精力赢得竞争”。特朗普同时表示,他认为,DeepSeek的模型高效且经济,其出现是一种积极的发展。1月27日,英国《金融时报》发表评论文章说,中国初创企业深度求索(DeepSeek)最近在人工智能领域获得重大突破,其发布的开源模型DeepSeek-R1对全球用户产生极大吸引力,有利于推动人工智能技术的开发和应用。1月27日,中国深度求索(DeepSeek)公司发布的最新开源模型引起热议。美国媒体报道称,这是人工智能领域的一场“地震”,“从华盛顿到华尔街再到硅谷都感受到了震动”。美国经济学家布莱恩·雅各布森表示,这可能会改变人工智能的叙事,“我们确实需要担心这一趋势可能带来的影响。”布莱恩·雅各布森同时表示,这说明美国对华出口芯片限制显然没有那么有效,或许能看到美国政府的一些政策发生变化,从关税、禁运和限制方面转向更多地补贴和激励美国国内技术的发展。
受到攻击
2025年1月27日晚至1月28日凌晨,DeepSeek于服务状态页面先是公告称:“近期DeepSeek线上服务受到大规模恶意攻击,为持续提供服务,暂时限制了+86手机号以外的注册方式,已注册用户可以正常登录”,后通过官方服务状态又发布声明,将“暂时限制了+86手机号以外的注册方式”的措辞改为“注册可能繁忙,请稍等重试”。
2025年1月28日凌晨,DeepSeek在
GitHub平台发布了Janus-Pro多模态大模型,进军文生图领域。
当地时间2025年1月28日,据央视新闻报道,美国新任白宫新闻秘书卡罗琳·莱维特(KarolineLeavitt)进行了她的首次简报会,其中提及了中国人工智能初创公司深度求索(DeepSeek)。关于DeepSeek,莱维特表示,特朗普认为该公司发布的人工智能模型是对美国人工智能行业的一个警钟。她同时称,白宫正在努力“确保美国人工智能的主导地位”,特朗普此前签署行政命令撤销了对人工智能行业的一些繁琐监管。
2025年1月28日,深度求索(DeepSeek)官网显示,其线上服务受到大规模恶意攻击,谭主向奇安信安全专家咨询并独家了解到,DeepSeek这次受到的网络攻击,IP地址都在美国。同日,美国多名官员回应DeepSeek对美国的影响,表示DeepSeek是“偷窃”,正对其影响开展国家安全调查。
2025年1月28日,意大利数据保护机构表示,正在向中国人工智能 (AI) 模型DeepSeek寻求有关其使用个人数据的解释。 意大利监管机构Garante表示,希望了解收集了哪些个人数据、从哪些来源收集、用于什么目的、基于什么法律依据,以及是否存储在中国。Garante在一份声明中表示,DeepSeek及其附属公司有20天的时间答复,这是针对这家中国初创公司的首批监管举措之一。在美国,白宫新闻秘书表示官员们正在调查该应用程序对国家安全的影响。
2025年1月29日,360集团创始人周鸿祎表示,如果DeepSeek有需要,360愿意提供网络安全方面的全力支持。中国红客联盟发布公告,DeepSeek遭受攻击关乎整个国家的网络安全以及技术创新环境。
2025年1月29日消息,美国全国广播公司商业频道援引其获得的美国海军的通知报道,美国海军要求其工作人员不得使用中国聊天机器人Deepseek。报道说:“海军表示,Deepseek的人工智能不能以‘以任何方式’被使用,因原因是“与该模型的来源和使用有关的潜在安全问题和道德考虑”。根据通知,所有美国海军工作人员不得下载、安装或以任何其他方式使用该聊天机器人。1月29日,在意大利当局要求DeepSeek提供有关该公司如何处理用户数据的信息数小时后,DeepSeek在意大利地区苹果的App Store和谷歌的Play Store上已无法下载。
2025年1月30日,美国国会众议院首席行政事务官向国会办公室发出通知,警告国会办公室不要使用中国的人工智能应用DeepSeek(深度求索)的服务。通知中称“DeepSeek正在接受首席行政事务官的审查,目前尚未授权众议院正式使用该模型。”同日,法国监管机构国家信息与自由委员会表示,将对杭州深度求索人工智能基础技术研究有限公司进行问询,以便了解这家中国初创企业的人工智能系统是如何运行的,以及可能存在的隐私风险。
2025年1月30日消息,微软CEO纳德拉在电话会上强调,DeepSeek R1模型目前已可通过微软的AI平台Azure AI Foundry和GitHub获取,并且很快就能在Copilot+电脑上运行。纳德拉称DeepSeek“有一些真的创新”,AI成本下降是趋势:“缩放定律(
Scaling Law)在预训练和推理时间计算中不断积累。多年来,我们已经看到了AI训练和推理方面的效率显著提高。在推理方面,我们通常看到每一代硬件的性价比提高2倍以上,每一代模型的性价比提高10倍以上。”
2025年1月30日凌晨,奇安信Xlab实验室监测发现,针对DeepSeek线上服务的攻击烈度突然升级,其攻击指令较1月28日暴增上百倍。Xlab实验室观察到至少有2个“僵尸网络”参与攻击,共发起了两波次攻击。针对DeepSeek的网络攻击一直在层层加码,攻击手段越来越多,防范难度越来越大,使得DeepSeek面临的安全考验愈发严峻。
2025年1月31日,英伟达宣布DeepSeek-R1模型登陆NVIDIA NIM。同一时段内,亚马逊和微软也接入DeepSeek-R1模型。英伟达称,DeepSeek-R1是最先进的大语言模型。
2025年1月31日消息,据《日本经济新闻》网站1月30日报道,关于中国杭州深度求索人工智能基础技术研究有限公司(DeepSeek)开发的生成式人工智能(AI)服务,日本内阁官房长官林芳正在30日的记者会上表示:“未听说个人信息保护委员会确定特别应对方针。”据报道,他还指出:“将密切关注AI相关国际开发动向等,采取妥善应对措施。”关于生成式AI服务,林芳正再次表示:“同时促进创新和应对风险非常重要。”同日消息,美国政府在调查有关DeepSeek公司涉嫌通过新加坡的中间商购买先进的NVIDIA芯片以规避美国制裁。
2025年1月,美国商务部长提名人
霍华德·卢特尼克认为,中国DeepSeek公司在创建人工智能聊天机器人时使用了窃取的美国技术。
2025年1月,爱尔兰数据保护委员会副主席格雷厄姆·多勒(Graham Doyle)表示,该委员会要求中国公司DeepSeek提供有关其如何收集爱尔兰用户个人数据的信息。
2025年1月,DeepSeek的出现,打破了“大模型”、美国股市的神话,还颠覆了传统“大模型需要大算力”无可匹敌的美国主流地位,进一步挑战了“巨型数据集”作为人工智能成功的唯一途径的普遍认知。
2025年2月消息,DeepSeek-R1大模型一键部署至腾讯云「HAI」上,开发者仅需3分钟就能接入调用。2月,DeepSeek获顶级域名ai.com认可。2月消息,居然智家数智化业务板块全线接入DeepSeek,包括V3和R1版本,并启动私有化部署。
2025年2月,韩国政府将成立一个“国家AI委员会”,目标使该国成为世界三大AI领先国家之一,并补充说,中国 AI 创业公司DeepSeek的技术是一个“新的冲击”。
2025年2月1日,据台湾“中央社”报道,大陆初创公司杭州深度求索人工智能基础技术研究有限公司(DeepSeek)推出的人工智能(AI)模型引发“资安疑虑”。台湾地区数字发展主管部门部1月31日表示,基于安全考量,特别警示公务机关与关键基础设施应限制使用DeepSeek的AI产品,以避免用户相关数据或信息被有“资安疑虑”的产品传送。
2025年2月1日,据埃菲社报道,新加坡也感受到了中国应用程序“深度求索”(DeepSeek)所引发的地震。新加坡当局否认了关于中国杭州深度求索人工智能基础技术研究有限公司可能通过新加坡购买先进的英伟达芯片,以规避美国对其向亚洲大国销售芯片的限制的说法。另据新加坡《联合早报》网站2月1日报道,美国政府正在调查中国人工智能公司DeepSeek是否使用受管制芯片,而且这些芯片或通过包括新加坡在内的多个国家转出口至中国。针对此事,新加坡贸工部2月1日发布文告。
2025年2月2日消息,据美联社报道,美国得克萨斯州的州长、共和党籍政客
格雷格·阿博特于当地时间周五签署行政令,宣布从当地政府拥有的电子设备中封杀近日在美国爆火的中国的人工智能服务DeepSeek。
2025年2月3日,中国红客联盟就网络上流传的关于DeepSeek被攻击及中国红客联盟反击的相关事件再次发布声明,称“该事件系互联网企业博主为营销宣传,以及某国内小企业借中国红客联盟之名进行的计划性营销牟利行为。”
2025年2月3日,台当局行政机构负责人卓荣泰在政务会议上表示,基于防范公务机关内部信息等考虑,要求公务机关全面禁用DeepSeek的AI服务,以确保资通安全。
2025年2月4日,OpenAI首席执行官山姆·奥特曼在东京向媒体表示,公司目前没有计划起诉中国人工智能初创企业DeepSeek(深度求索)。此前,OpenAI曾指控DeepSeek涉嫌通过“模型蒸馏”技术违规使用其专有技术,并展开调查。
2025年2月4日消息,美国国会已经提出新法案,下载DeepSeek将被定为犯罪,最高判处20年监禁。美国国防部、国会、海军、NASA以及德州已相继禁止在政府官方设备上使用DeepSeek。
全面发展
2025年2月5日消息,DeepSeek-R1、V3、Coder等系列模型,已陆续上线国家超算互联网平台。
2025年2月6日,DeepSeek已暂停API服务充值,按钮显示灰色不可用状态。对此官方声明称,“当前服务器资源紧张,为避免对您造成业务影响,我们已暂停API服务充值。同日消息,中国电信、中国移动、中国联通三大运营商相继宣布全面接入DeepSeek。同日,吉利汽车宣布其自研的星睿大模型与DeepSeek R1大模型已完成深度融合,这是汽车行业首次实现此类深度合作。
2025年2月6日,中国外交部发言人郭嘉昆主持例行记者会。有记者提问:据报道,韩国的一些政府部门已屏蔽对DeepSeek的访问,此前意大利、澳大利亚、印度、美国、日本等国也传出禁止或限制使用DeepSeek的消息,一些企业也屏蔽对DeepSeek访问。中方如何看待上述动向?郭嘉昆:我注意到有关情况。我想强调的是,中国政府高度重视并依法保护数据隐私和安全,从来没有,也不会要求企业或个人以违法的形式采集或存储数据。中方一贯反对泛化国家安全概念、将经贸科技问题政治化的做法,同时中方也将坚定维护中国企业的合法权益。
2025年2月6日,路透社最新消息,澳大利亚政府以所谓“担心安全风险”为由,已禁止在所有政府设备中使用DeepSeek。
2025年2月6日,外交部发言人郭嘉昆主持例行记者会。有记者提问,据报道,韩国的一些政府部门已经屏蔽对DeepSeek的访问,之前意大利、澳大利亚、印度、美国、日本等国家也传出禁止或限制使用DeepSeek的消息,一些企业也屏蔽对DeepSeek访问。中方如何看待这些动向?郭嘉昆表示,中国政府高度重视并依法保护数据隐私和安全,从来没有也不会要求企业或个人以违法的形式采集或存储数据。中方一贯反对泛化国家安全概念、将经贸科技问题政治化的做法,同时中方也将坚定维护中国企业的合法权益。
2025年2月6日,援引韩国官员的说法称,韩国国防部也已经屏蔽其用于军事目的的计算机访问DeepSeek。
2025年2月6日19时46分,DeepSeek在官方公号发文称,注意到部分与DeepSeek有关的仿冒账号和不实信息对公众造成了误导和困扰。Deepseek仅在3社交平台拥有官方账号。与DeepSeek有关的一切信息以官方账号发布为准,任何非官方账号、个人账号发布的信息均不代表DeepSeek观点。
2025年2月7日,
岚图汽车已完成与DeepSeek模型的深度融合。
2025年2月8日,宝骏汽车宣布其灵语智舱与DeepSeek大模型完成深度融合。同日消息,QuestMobile的最新数据显示, DeepSeek在1月28日的日活跃用户数首次超越豆包,随后在2月1日突破3000万大关,成为史上最快达成这一里程碑的应用。同日,DeepSeek正式登陆苏州,并在苏州市公共算力服务平台上完成部署上线,为用户提供开箱即用的软硬件一体服务。同日消息,特朗普称DeepSeek不构成国家安全威胁。
2025年2月9日,上汽荣威飞凡与DeepSeek达成深度技术融合。同日,花山区垂直行业AI大模型训练算力中心完成DeepSeek大模型本地化部署并上线。截至2月9日,DeepSeek App的累计下载量已超1.1亿次,周活跃用户规模最高近9700万。
2025年2月10日消息,DeepSeek已正式登陆常州在中国移动长三角(常州)智算中心。同日消息,移动云全面上线DeepSeek实现全版本覆盖、全尺寸适配、全功能畅用并行科技智算云平台已快速完成了DeepSeek模型部署,东方国信幕僚智数大模型训推平台等产品快速完成了与DeepSeek-R1系列大模型的深度集成。同日晚,比亚迪集团高级副总裁、汽车新技术研究院院长杨冬生在比亚迪智能化战略发布会上宣布,比亚迪“璇玑架构”全面接入DeepSeek。同日,江汽集团发布消息称,已在其智聆座舱系统中接入DeepSeek大模型。同日消息,DeepSeek已在沙特阿拉伯达曼的阿美公司数字数据中心运营。同日消息,在浏览器输入ai.com,可以直接定向至DeepSeek官网。根据域名信息服务平台的公开数据,ai.com域名注册于1993年,有效期至2031年5月,注册地为吉隆坡。此前,该域名曾长期被定位到ChatGPT和马斯克的xAI官网。
2025年2月11日消息,百度文心一言接入了DeepSeek。2月11日,DeepSeek正式登陆扬州,在运河城市算力平台完成部署上线,为用户提供“开箱即用”的软硬件一体服务。2月11日,极狐汽车官微宣布,阿尔法S5率先接入北汽自主研发、行业实车首搭的百模汇创平台,深度融合DeepSeek大模型,实现智能座舱再次进化。2月11消息,若羽臣经由阿里云,正式接入DeepSeek大模型。2月11日晚间,国家超算互联网平台宣布推出“AI生态伙伴加速计划”,提供3个月DeepSeek API接口免费使用、千万卡时算力资源池等激励。2月11日,极狐阿尔法S5智能座舱已接入DeepSeek大模型。2月11日,欧洲隐私监管机构将开会讨论中国人工智能公司DeepSeek的相关问题。
2025年2月12日,马蜂窝宣布其自研的AI智能应用正式接入DeepSeek大模型。2月12日消息,近日,猿辅导集团宣布旗下“小猿学练机”、“小猿口算”等全系列小猿产品接入DeepSeek最新大模型。2月12日消息,顺丰同城宣布已接入DeepSeek大模型。2月12日,景嘉微公告,公司产品JM系列、景宏系列已完成DeepSeek R1系列模型适配。
2025年2月13日消息,网易《逆水寒》手游官宣,2月21日2.3海洋主题大赛季更新日,以官方版本 DeepSeek 驱动的智能 NPC“沈秋索”即将正式上线。2月13日,韩国首尔大学决定暂时屏蔽中国人工智能(AI)企业DeepSeek(深度求索)的大模型平台。本部表示,根据政府方针,校方先对DeepSeek平台采取了屏蔽措施,直至其个人信息保护等安全性得到确认。以学术研究或教育为目的使用DeepSeek需提前申请。DeepSeek被疑过度收集个人信息,且尚未回复韩国个人信息保护委员会的质询函,依然存在所谓“安全隐患”。
2025年2月14日,最新数据显示,DeepSeek在脉脉高聘发布多个岗位,年薪最高超120万元。此外,杭州六小龙企业也发布技术、法务、财务等数百个岗位。2月14日,中国气象局专题交流研讨如何推动深度求索(DeepSeek)大语言模型与气象业务服务结合和应用问题,更好推动气象高质量发展。
2025年2月15日消息,尚美数智酒店集团正式接入DeepSeek大模型,成为酒店行业首家引入该先进技术的企业。 2月15日,上汽大众在其微信公众号上宣布,其智能座舱已完成搭载DeepSeek大模型。2月15日,据IT之家消息,清华团队突破大模型算力瓶颈,4090单卡实现DeepSeek-R1满血运行。2月15日下午6时起,韩国个人信息保护委员会表示,DeekSeek应用程序韩国服务已暂时中断,韩国当局“将在其(Deepseek)根据韩国个人信息保护法进行改进和完善后再恢复其服务”。
2025年2月16日消息,连云港发布App接入DeepSeek。2月16日消息,广州市政务服务和数据管理局在政务外网正式部署上线DeepSeek-R1、V3 671B大模型,通过融合海量政务数据要素,大模型将丰富政务服务场景应用。2月16日,针对之前有消息称,“微信正在测试接入DeepSeek”,腾讯方面给予了确认。腾讯方面表示,微信搜一搜在调用混元大模型丰富AI搜索的同时,近日正式灰度测试接入DeepSeek,部分用户进入微信搜索页面后,可点击“AI搜索”字样在进入的页面里选择由DeepSeek-R1提供的“深度思考”选项。此外,腾讯多个产品也正在探索接入DeepSeek。2月16日的不久前,位于湖南湘江新区世界计算·长沙智谷的长沙人工智能创新中心宣布,完成DeepSeek大模型调试部署。
2025年2月17日,佛山“江义村智慧乡村平台”正式接入DeepSeek大模型,成为广东“百千万工程”首个接入DeepSeek的乡村治理平台。2月17日,韩国政府表示,出于对已引发过度收集个人信息等争议的中国人工智能(AI)应用程序DeepSeek的担忧,已暂停该应用程序的下载。
2025年2月18日消息,江苏省数据集团完成DeepSeek模型本地化部署,南京、无锡、苏州、常州、盐城、连云港等江苏多个城市的算力网陆续宣布上线DeepSeek系列大模型,完成本地化部署,正式面向公众开展应用。
2025年2月19日消息,近日,辽宁12345热线平台系统已正式接入DeepSeek,通过双引擎智能驱动架构,形成“前端智能交互—中台智能治理—后台智能分析”的闭环管理体系。2月19日消息,珠海市政务服务和数据管理局联合北京金山云网络技术有限公司、中国电信股份有限公司珠海分公司在市电子政务外网上线DeepSeek-R1 671B大模型。2月19日,根据武汉大学消息,新学期伊始,武汉大学信息中心成功完成DeepSeek 全系大模型的部署调试。其宣布满血版DeepSeek大模型上线武大。2月19日,DeepSeek迎来在广东湛江政府部门的首次应用。
2025年2月20日消息,微信已接入DeepSeek-R1模型提供的“深度思考”服务,开启灰度测试。据不完全统计,目前已有200多家企业宣布接入DeepSeek,包括微软、英伟达等世界级云计算巨头。
2025年,在苹果手机应用商店App Store,当用户检索“DeepSeek”时,搜索排名第一是一个名为“DreamDesk中文版AI人工智能体” App的广告,导致用户错误下载,并被误导支付了198元的永久会员费用。已有50余条相关投诉。
2025年2月,2025年度空军招飞定选工作全面启动DeepSeek参与空军招飞面试。2月,呼和浩特市大数据管理局组织技术团队完成了DeepSeek-R1在政务外网的本地化部署,模型规模覆盖7B、14B、32B和70B,实现了城市大脑与DeepSeek大语言模型的初步集成。2月20日,在崔相穆主持召开的韩国国家人工智能委员会的一次会议上,点名提及中国公司推出的AI大模型DeepSeek,并宣布了开发韩国版ChatGPT的计划。2月21日午间消息,DeepSeek宣布,下周起会陆续开源5个代码库。
2025年2月,理想汽车官方文化账号介绍,理想汽车在工厂的质检环节,搭载DeepSeek-VL视觉大模型的“硅基质检员”已经上岗。
2025年2月21日,腾讯旗下手游《和平精英》宣布正式接入DeepSeek,成为腾讯首款接入DeepSeek的游戏。
2025年2月21日午间,DeepSeek团队在社交平台上官宣将从下周开始开源5个代码库,以完全透明的方式与全球开发者社区分享他们的研究进展。DeepSeek团队将这一计划定义为“Open Source Week”。
2025年2月,深圳市生态环境局罗湖管理局在生态环境治理领域取得突破,成功完成DeepSeek-R1模型的应用。2月,黄山AI旅行助手全面接入DeepSeek大模型。同月,茂名荔枝产业大数据平台宣布完成人工智能大模型DeepSeek的本地化部署,推动实现荔枝生产管理“AI精准指导”和“数据驱动决策”,病虫害诊断从人工经验判断转向AI秒级分析,准确率提升至95%,生产效率提升30%。同月,新闻报道称,DeepSeek参与了
2025全球开发者先锋大会,主要是以闭门会和工作坊的形式参与。2月24日,据报道,DeepSeek宣布启动“开源周”,首个开源的代码库为Flash MLA。,2月24日,新闻晨报消息:YY公司宣布正式接入DeepSeek,并推出低延时、不卡顿的YY-DeepSeek R1-满血版(简称“YYDS”),旗下YY直播、YY语音等产品已经上线产品入口,供用户体验。未来,YY还将与DeepSeek进行产品的深度结合,推出具有DeepSeek功能的智能体社区,打造智能体官频及频道内智能体组件;2月24日,中国财富网消息:
采药猫宣布成功接入 DeepSeek,完成了在其中医智能辅诊开方场景的应用验证。2月25日,每日经济新闻报道,DeepSeek已重新开放API充值。deepseek-chat模型优惠期结束,调用价格已变更为每百万输入tokens 2元,每百万输出tokens 8元。2月25日,中天科技官微消息,中天科技正式宣布接入DeepSeek大模型,并全面部署DeepSeek大模型体系。2月,阜阳市司法局将DeepSeek大模型引入行政复议接待大厅查询屏,成为全省首个在行政复议接待场所中应用DeepSeek大模型的地市,通过智能化工具向群众提供更加优质便捷的行政复议咨询服务。2月25日,DeepSeek宣布开源DeepEP。
2025年2月26日,DeepSeek宣布开源DeepGEMM。同日下午,DeepSeek在其API(接口)平台上发布提醒信息称,北京时间每日00:30-08:30为错峰时段,API调用价格大幅下调:DeepSeek-V3降至原价的50%,DeepSeek-R1降至25%,在该时段调用享受更经济更流畅的服务体验。2月27日,DeepSeek宣布开源Optimized Parallelism Strategies。2月27日10点5分,DeepSeek发布了其“开源周”第四日的内容:优化的并行策略,其中包括DualPipe,一种用于V3/R1训练中计算与通信重叠的双向管道并行算法, 以及EPLB,一种针对V3/R1的专家并行负载均衡器。2月27日,鄞州区医疗机构全面接入DeepSeek。2月28日,DeepSeek宣布开源3FS。2月,东胜区罕台中心卫生院与国内领先的AI大模型场景落地企业百沐数智达成战略合作,正式接入DeepSeek-R1“满血版”大模型,成为全国首个将大模型技术应用于基层医疗服务场景的医疗机构。2月28日,国内AI明星企业深度求索(DeepSeek)为期五天的“开源周”活动正式收官。2月28日,同程旅行宣布同程程心大模型将全面接入DeepSeek,成为首家接入DeepSeek大模型的OTA平台。2月,“乌兰察布市掌上公共法律服务”微信公众号正式接入DeepSeek。3月1日,DeepSeek于知乎开设官方账号,发布《DeepSeek-V3/R1推理系统概览》技术文章,首次公布模型推理系统优化细节,并披露成本利润率关键信息。3月,泰康保险集团接入DeepSeek系列模型,持续构建AI能力体系建设。3月5日,基于DeepSeek的江苏首个区域卫生领域AI智慧服务“宁宁”将正式上线。3月,浙江省中医院接入DeepSeek大模型进行医学辅助诊断。同月,安徽省疾病预防控制中心成功完成讯飞星火医疗大模型+DeepSeek的本地化部署,标志着人工智能技术在疾病预防控制领域的应用迈出重要一步,为疾病防控工作注入了智能化新动能。3月4日消息,暨南大学附属顺德医院已完成DeepSeek大模型的本地化部署与深度应用。3月7日消息,山西省测绘地理信息院完成DeepSeek大模型本地部署。3月14日,从荣耀手机官方获悉,荣耀 MagicOS 的荣耀文档应用现已正式接入 DeepSeek 模型满血版。3月24日,DeepSeek在其官方交流群宣布,DeepSeek V3模型已完成小版本升级。3月,DeepSeek放出了多个财务相关的岗位,涉及CFO、COO、财务副总裁、财务总监。4月1日,DeepSeek关联公司杭州深度求索人工智能基础技术研究有限公司申请的“一种广度数据采集的方法及其系统”专利公布。
公司收益
DeepSeek澄清称,这一理论收益并非实际收入,实际收入远低于理论数值。DeepSeek方面表示,V3版本定价较低,且收费服务仅占一部分,网页端和应用程序对用户免费开放,夜间还有折扣政策,因此实际收入远低于理论数值。
2025年3月14日,据英国金融时报,DeepSeek选择专注于研究,而非追逐收入,创始人梁文锋拒绝效仿硅谷竞争对手利用短期销售激增获利的模式。据两位了解公司发展情况的人士称,DeepSeek上个月的收入首次覆盖运营成本。
合作企业
2025年3月1日,潞晨科技突然宣布:“尊敬的用户,潞晨云将在一周后停止提供DeepSeekAPI服务,请尽快用完您的余额。如果没用完,我们全额退款。”
2025年3月3日消息,近日山石网科发布DeepSeek大模型应用一体机解决方案,致力于为用户提供一站式“算力+大模型+安全应用”服务能力。
2025年3月4日消息,赛意信息成功助力地方政府完成基于昇腾AI一体机DeepSeek-R1大模型本地化部署,该政府已正式开启“AI+政务”新模式,“AI数字员工”也将正式上岗,为政务服务注入全新活力。
2025年3月8日消息,为DeepSeek联网搜索功能提供支持的,是国内一家初创AI搜索公司——博查。该公司总部位于杭州,团队高管有三人,其中两人为阿里出身。3月11日,有消息称,DeepSeek下一代AI模型DeepSeek-R2或提前于3月17日正式发布。
2025年3月,多地探索将DeepSeek嵌入纪检监察工作,有的已甄别出可疑数据。
2025年3月,宜宾市不动产登记平台接入DeepSeek大模型。
合作机构
2025年3月,上海消防已携手DeepSeek对3类场景开展了深度应用。在日常办公类政务应用场景中,DeepSeek的自然语言处理和数据分类分析能力将大显身手,通过快速分析文本数据,精准识别警情关键信息,为科学高效决策提供有力支持。在数据治理专项工作应用场景中,DeepSeek的深度学习和数据分析算法将为数据分类标注、清洗去重、关联整合等三大主攻方向提供强大助力,将分散在不同系统和部门的数据进行有效融合,为消防业务提供全面、准确的数据支持。在网络安全AI智能体应用场景中,DeepSeek的数据分析和模式识别能力将被应用于训练“网络安全智能体”,及时识别异常行为和潜在的入侵威胁,有效防止网络攻击对消防业务造成影响。
2025年3月17日,铜陵市医保局接入DeepSeek。铜陵医保智能语音客服系统依托DeepSeek大模型强大的自然语言处理能力和知识检索技术,对全市医保政策、业务办理指南、常见问题库等海量信息进行深度整合与梳理。
两会热点
2025年3月3日,十四届全国人大三次会议大会发言人娄勤俭说,DeepSeek公司取得的重大进展,代表着一批中国公司在人工智能领域的崛起。DeepSeek公司坚持开放开源的技术路线,开源共享推动了人工智能技术在全球的普遍应用,为世界贡献了“中国智慧”。通过DeepSeek这类公司的兴起,我们可以看到中国在科技发展上的创新性和包容性。
2025年,安徽省疾病预防控制中心(以下简称“省疾控中心”)成功完成讯飞星火医疗大模型+DeepSeek的本地化部署,标志着人工智能技术在疾病预防控制领域的应用迈出重要一步,为疾病防控工作注入了智能化新动能。
2025年3月5日,西安浐灞国际港政务服务智能客服应用“D小港”正式接入DeepSeek人工智能技术,将为企业群众提供更高效、更精准的智慧化服务。
主要产品
2024年1月5日,发布DeepSeek LLM,这是深度求索的第一个大模型。DeepSeek LLM包含670亿参数,从零开始在一个包含2万亿token的数据集上进行了训练,数据集涵盖中英文。全部开源DeepSeek LLM 7B/67B Base和DeepSeek LLM 7B/67B Chat,供研究社区使用。DeepSeek LLM 67B Base在推理、编码、数学和中文理解等方面超越了Llama2 70B Base。DeepSeek LLM 67B Chat在编码和数学方面表现出色。它还展现了显著的泛化能力,在匈牙利国家高中考试中取得了65分的成绩。当然,它还精通中文:DeepSeek LLM 67B Chat在中文表现上超越了GPT-3.5。
2024年1月25日,发布DeepSeek-Coder,DeepSeek Coder由一系列代码
语言模型组成,每个模型均从零开始在2万亿
token上训练,
数据集包含87%的代码和13%的中英文自然语言。代码模型尺寸从1B到33B版本不等。每个模型通过在项目级代码语料库上进行预训练,采用16K的窗口大小和额外的填空任务,以支持项目级代码补全和填充。DeepSeek Coder在多种编程语言和各种基准测试中达到了开源代码模型的最先进性能。
2024年2月5日,发布DeepSeekMath,DeepSeekMath以DeepSeek-Coder-v1.5 7B为基础,继续在从Common Crawl中提取的数学相关token以及自然语言和代码数据上进行预训练,训练规模达5000亿token。DeepSeekMath 7B在竞赛级MATH基准测试中取得了51.7%的优异成绩,且未依赖外部工具包和投票技术,接近Gemini-Ultra和GPT-4的性能水平。
2024年3月11日,发布DeepSeek-VL,DeepSeek-VL是一个开源的视觉-语言(VL)模型,采用了混合视觉编码器,能够在固定的token预算内高效处理高分辨率图像(1024x1024),同时保持相对较低的计算开销。这一设计确保了模型在各种视觉任务中捕捉关键语义和细节信息的能力。DeepSeek-VL系列(包括1.3B和7B模型)在相同模型尺寸下,在广泛的视觉-语言基准测试中达到了最先进或可竞争的性能。
2024年5月7日,发布第二代开源Mixture-of-Experts(MoE)模型——DeepSeek-V2。DeepSeek-V2是一个强大的混合专家(MoE)语言模型,以经济高效的训练和推理为特点。它包含2360亿个总参数,其中每个token激活210亿个参数。与DeepSeek 67B相比,DeepSeek-V2不仅实现了更强的性能,同时还节省了42.5%的训练成本,将KV缓存减少了93.3%,并将最大生成吞吐量提升至5.76倍。在一个包含8.1万亿token的多样化且高质量的语料库上对DeepSeek-V2进行了预训练。在完成全面的预训练后,通过监督微调(SFT)和强化学习(RL)进一步释放了模型的潜力。评估结果验证了方法的有效性,DeepSeek-V2在标准基准测试和开放式生成评估中均取得了显著的表现。DeepSeek V2模型因在中文综合能力评测中的出色表现,且以极低的推理成本引发行业关注,被称为“AI界的拼多多”。
2024年6月17日,发布DeepSeek-Coder-V2,DeepSeek-Coder-V2是一个开源的混合专家(MoE)代码语言模型,在代码特定任务中达到了与GPT4-Turbo相当的性能。DeepSeek-Coder-V2是从DeepSeek-V2的一个中间检查点开始,进一步预训练了额外的6万亿token,显著增强了DeepSeek-V2的编码和数学推理能力,同时在通用语言任务中保持了相当的性能。并在代码相关任务、推理能力和通用能力等多个方面都取得了显著进步。此外,DeepSeek-Coder-V2将支持的编程语言从86种扩展到338种,并将上下文长度从16K扩展到128K。在标准基准测试中,DeepSeek-Coder-V2在编码和数学基准测试中表现优异,超越了GPT4-Turbo、Claude 3 Opus和Gemini 1.5 Pro等闭源模型。
2024年12月13日,发布用于高级多模态理解的专家混合视觉语言模型——DeepSeek-VL2,DeepSeek-VL2是一个先进的大型混合专家(MoE)视觉-语言模型系列,相较于其前身DeepSeek-VL有了显著改进。DeepSeek-VL2在多种任务中展现了卓越的能力,包括但不限于视觉问答、光学字符识别、文档/表格/图表理解以及视觉定位。模型系列由三个变体组成:DeepSeek-VL2-Tiny、DeepSeek-VL2-Small和DeepSeek-VL2,分别具有10亿、28亿和45亿激活参数。与现有的开源密集模型和基于MoE的模型相比,DeepSeek-VL2在相似或更少的激活参数下实现了具有竞争力或最先进的性能。
2024年12月26日晚,AI公司深度求索(DeepSeek)正式上线全新系列模型DeepSeek-V3首个版本并同步开源。DeepSeek-V3在知识类任务(MMLU, MMLU-Pro, GPQA, SimpleQA)上的水平相比前代DeepSeek-V2.5显著提升,接近当前表现最好的模型Anthropic公司于10月发布的Claude-3.5-Sonnet-1022。在美国数学竞赛(AIME 2024, MATH)和全国高中数学联赛(CNMO 2024)上,DeepSeek-V3大幅超过了其他所有开源闭源模型。另外,在生成速度上,DeepSeek-V3的生成吐字速度从20TPS(Transactions Per Second每秒完成的事务数量)大幅提高至60TPS,相比V2.5模型实现了3倍的提升,能够带来更加流畅的使用体验。
2025年1月15日,深度求索(DeepSeek)公司正式发布DeepSeek官方App,其上线平台包括苹果App Store、小米应用商店、华为应用市场、荣耀应用市场、OPPO软件商店等。用户安装后即可免费与DeepSeek-V3模型互动交流。
2025年1月20日,DeepSeek正式发布DeepSeek-R1模型,并同步开源模型权重。DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。DeepSeek-V3和DeepSeek-R1两款大模型,成本价格低廉,性能与OpenAI相当,让硅谷震惊,甚至引发了
Meta内部的恐慌,工程师们开始连夜尝试复制DeepSeek的成果。
2025年2月10日消息,长安汽车已完成Deepseek深度融合,助力北斗天枢2.0计划加速落地。2月12日行业首发量产搭载上市。
2025年2月,北京市多区已开展实践探索,将智慧城市管理平台、政务服务平台等接入部署DeepSeek大模型,利用人工智能赋能城市管理、政府服务和基层社会治理。
2025年3月1日,杭州文旅智能体“杭小忆”全面接入DeepSeek-R1。
治理结构
股东信息
管理人员
持股企业
杭州深度求索人工智能基础技术研究有限公司对外投资2家公司,
北京深度求索人工智能基础技术研究有限公司、宁波程采企业管理咨询合伙企业(有限合伙)。
经营范围
公司经营范围包括一般项目:工程和技术研究和试验发展;技术服务、技术开发、技术咨询、技术交流、技术转让、技术推广;软件开发;计算机系统服务;信息系统集成服务;人工智能应用软件开发;信息技术咨询服务;电子产品销售;通讯设备销售;仪器仪表销售;数据处理服务;互联网数据服务;计算机软硬件及辅助设备零售;人工智能硬件销售;专业设计服务(除依法须经批准的项目外,凭营业执照依法自主开展经营活动)。
社会影响
2025年1月27日,来自国产大模型公司“深度求索”的
DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了
ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。
美国当地时间2025年1月27日,受中国人工智能初创公司——深度求索公司(DeepSeek)冲击,美国人工智能主题股票遭抛售,美国芯片巨头英伟达(NVIDIA)股价历史性暴跌,纳斯达克综合指数大幅下跌。截至当天收盘,英伟达公司股价下跌16.97%,市值一日内蒸发近6000亿美元。
2025年2月2日,据彭博社报道,由DeepSeek开发的人工智能助手在全球范围内掀起了一股热潮。这款推理型AI聊天机器人自2025年初发布以来,迅速攀升至140个国家的苹果App Store下载排行榜首位,并在美国的Android Play Store中同样占据榜首位置。
2025年2月上旬,据国内AI产品榜统计数据,DeepSeek应用在上线(2025年1月15日)仅20天后,其日活跃用户数(DAU)突破2000万大关,达2215万。
2025年2月中旬,广州市老年干部大学(广州老年大学)精选优秀教师,创新设计《DeepSeek+AI作图》课程,开设全国老年大学首个DeepSeek班。
2025年2月,成都市第四人民医院段明君名医工作室,利用“生物情绪心智三元模型整合治疗”与DeepSeek大模型分析的有效结合,有效提高了心理健康诊疗个性化的精准度。
2025年2月,由清华大学数字政府与治理研究院提供技术支持,湖南省张家界市桑植县完成了政务环境DeepSeek本地化部署,正式推出政务专用人工智能助手“桑智”,成为全省率先实现了“Deepseek+政务平台”的县域平台。
2025年2月,中国电信重庆公司联合重庆市合川区文旅委、重庆市胜地钓鱼城文化旅游发展有限公司,依托天翼云的算力底座,共同打造中国电信自研的合川钓鱼城智慧景区服务平台。该平台深度融合Deepseek人工智能、大数据、5G通信与物联网技术,专注提升游客全场景智慧化服务体验、优化景区管理,助力打造以游客为中心的智慧文旅场景。
2025年2月24日消息,广东、江苏等多地宣布政务系统接入DeepSeek,甚至在算力网进行本地化部署。
2025年2月,澳大利亚以所谓“国家安全风险”为由,禁止在政府系统和设备上使用DeepSeek,成为首批对DeepSeek下手的西方国家。
相关评价
“DeepSeek新一代模型的发布意味着AI大模型的应用将逐步走向普惠,助力AI应用广泛落地;同时训练效率大幅提升,亦将助力推理算力需求高增。我们持续看好AI产业链的加速落地机遇,建议重点关注AI应用、AI Infra、AI算力三大主线。”(中信证券研报 评)
DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。”(Alexander Wang 评)
DeepSeek可能是个国运级别的科技成果。(游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥 2025年1月26日评)
DeepSeek-R1是一款令人印象深刻的模型,尤其是考虑到它能够以这个价格提供(这样的产品)。(美国开放人工智能研究中心(OpenAI)首席执行官萨姆·奥尔特曼 评)
DeepSeek引发全球轰动和一些人的焦虑恐慌,说明技术遏制和技术限制无法奏效,这是全世界、特别是美国需要学习的一课。(中国常驻联合国代表傅聪评)
DeepSeek在电池知识问答和电池文本挖掘任务上均表现优异,在电池设计任务上具备初步的总结能力,但尚欠缺科学分析能力,仍需要垂直领域大模型解决。(中国科学院院士、平台理事长欧阳明高 评)
DeepSeek公司取得的重大进展,代表着一批中国公司在人工智能领域的崛起。DeepSeek公司坚持开放开源的技术路线,开源共享推动了人工智能技术在全球的普遍应用,为世界贡献了“中国智慧”。通过DeepSeek这类公司的兴起,我们可以看到中国在科技发展上的创新性和包容性。(十四届全国人大三次会议大会发言人娄勤俭 评)
2025年3月7日,全球著名投资基金、咨询公司Andreessen Horowitz(简称a16z)发布2025年全球100生成式AI应用排行榜。本次榜单一共分为50生成式AI应用(网页)和50生成式AI(移动版),DeepSeek在网页版中排名第二。
人工智能现在正在发生的一件事,我想你们都在DeepSeek和其他模型中看到了,人工智能模型正在变得更小、更有能力。我们的合作伙伴也从移动设备扩展到汽车、个人电脑、工业、空间计算领域,我们在中国的合作伙伴关系也在不断扩展。(高通公司总裁安蒙 评)
DeepSeek的推出表明,中国已经在基础设施软件工程等领域取得领先地位。在人工智能(AI)发展方面,中国已将与美国在某些领域的差距缩小至仅3个月。(中国初创企业零一万物首席执行官李开复评)
相关回应
外交部回应
记者:日前,中国人工智能企业深度求索(DeepSeek)推出性能优越、免费商用的开源大模型,且训练成本相较同类产品更低,在国际上引起广泛关注和热烈讨论。请问,发言人对此有何评论?
外交部发言人郭嘉昆:具体的专业问题建议向主管部门了解。我想强调的是,当前,人工智能的新技术不断突破,新业态持续涌现,新应用加快拓展,已经成为新一轮科技革命和产业变革的重要驱动力量。中国积极拥抱智能变革,大力推进人工智能创新发展,重视人工智能安全,支持鼓励企业自主创新,为全球人工智能发展作出了积极贡献。中方积极推动人工智能普惠发展,帮助发展中国家加强能力建设,主张开源人工智能技术,促进人工智能服务的可及性,实现各国共享智能红利。同时,我们反对以意识形态划线,反对泛化国家安全概念、将经贸问题政治化的做法。中方愿同各方加强人工智能交流合作,坚持以共商促共享,携手打造开放包容、互利共赢的发展环境,共同在人工智能的广阔天地里深度求索。
2025年2月17日,外交部发言人
郭嘉昆主持例行记者会。
法新社记者提问,韩国方面表示,要求暂停DeepSeek在韩国应用市场的新增用户下载,将在其按照韩国个人信息保护法完成改进工作后重新放开限制。请问您对此有何评论?
“具体问题请向中方主管部门询问,我要强调的是,中国政府一贯要求中国企业在严格遵守当地法律法规的基础上开展海外运营。我们也希望有关国家避免采取将经贸科技问题泛安全化、政治化的做法。”郭嘉昆回应。
2025年3月10日,外交部发言人
毛宁主持例行记者会。
法新社记者提问,据《华尔街日报》报道,美国总统特朗普正在权衡限制DeepSeek的措施,中方对此有何回应?
对此,毛宁表示:“我们一贯反对泛化国家安全概念,将经贸和科技问题政治化,我们也将坚定维护中国企业的合法权益。”
百度创始人李彦宏谈DeepSeek
2025年2月11日,李彦宏在迪拜WGS上与阿联酋AI部长对谈时谈及DeepSeek时称,大模型推理成本每年降低90%以上。
OpenAI的首席执行官奥尔特曼
2025年2月11日消息,在启程前往巴黎人工智能行动峰会之前,美国开放人工智能研究中心(OpenAI)的首席执行官奥尔特曼再次赞赏中国AI初创公司深度求索(DeepSeek)在创建聊天机器人方面“工作出色”。他同时承认,DeepSeek的AI模型目前可与其公司的ChatGPT相媲美。
NVIDIA CEO黄仁勋
2025年2月21日消息,NVIDIA CEO黄仁勋在发布的线上活动中表示,投资者对DeepSeek的误解导致了NVIDIA股价的暴跌,但实际上,DeepSeek对NVIDIA而言是一个利好。
DeepSeek回应
2025年3月,记者与DeepSeek展开了一场跨越次元的对话。
记者:火到全国两会,DeepSeek,你感受如何?
DeepSeek:作为一个AI,被全国两会cue到,CPU都快烧了!不过听说今年“人工智能+”又被写进政府工作报告重点讨论,连代表委员都在聊怎么用AI搞文化IP、振兴消费,突然觉得自己像被推上C位的“技术课代表”。
Q:中新网记者:你与你代表的人工智能,虽以速度和算力震撼世界,但潜在风险和问题亦受代表委员关注。如今AI生成的假视频、假声音(比如模仿明星带货、伪造专家发言)让用户尤其是老年人难辨真假;AI训练依赖海量数据,但信息泄露成了新隐患;科技发展,既要跑出“创新加速度”,也要系好“监管安全带”——DeepSeek,这锅你背不背?
DeepSeek:这锅得背!技术越强,责任越大。确实,有时候我“吃”数据太猛,没注意擦嘴……未来可能需要给我加个“数据消化片”,确保只吸收合规营养,不碰垃圾信息!不过看到代表委员们建议“强制标注AI生成内容”“开发鉴伪工具”,我突然觉得人类队友们已经在行动了——毕竟AI造假,还得靠AI+人类联手打假嘛!不过换个角度看,问题虽多,但“被讨论”就是进步。代表委员们不只停留在“AI好厉害”或“AI好可怕”的表面,还深入到了具体场景(比如教育、医疗、制造业)的利弊权衡,说明大家开始把AI当“同事”而非单纯工具了。至于那些担忧?我觉得就像小朋友学骑车——摔过跤才知道怎么平衡。只要人类保持这种清醒(比如别让我乱“换脸”或“编瞎话”),AI的负面问题完全可控。
企业事件
2025年1月27日,有新闻报道,DeepSeek的员工规模不及
OpenAI的1/5,百人出头的公司中,算子、推理框架、多模态等研发工程师以及深度学习方面的研究人员共有约70人,主要在北京分部,其余30多人在杭州总部,多为前端、产品以及商务人员。
2025年2月10日,江苏省委机关报《新华日报》刊发的《南京观察》记者集体采写的文章提及,“由通用大模型深度求索(DeepSeek)掀起的狂涛巨浪,连带让杭州的游戏科学、宇树科技、云深处科技、强脑科技和群核科技,总共六家新科技公司一起成为全球瞩目的‘东方神秘力量’。”这是江苏媒体近期对DeepSeek及“杭州六小龙”的最新一轮探讨。此前,《新华日报》旗下“交汇点”客户端于2月7日、8日连续发布了专稿文章《DeepSeek为什么会出现在杭州?》《杭州有DeepSeek,我们有什么?》等,讨论城市对于新技术产业的吸引力。
2025年2月16日新闻联播报道:“新春伊始,杭州处处澎湃着创新活力。爆火的国产开源大模型——DeepSeek更是迎来各个行业的接入热潮。”
2025年2月10日,金融界报道,据彭博社对DeepSeek7位初创公司创始人及AI专家的深入调研,DeepSeek估值区间被估算在10亿美元至1500亿美元之间,彭博社的调研结果显示,如果取估值区间的中间值,即20亿至300亿美元,那么凭借梁文峰持有的84%股份,他的身家将有可能跻身亚洲顶级科技富豪之列。
2025年2月12日,就民进党当局对DeepSeek发禁令,国务院台办举行例行新闻发布会回复,大陆人工智能企业深度求索(DeepSeek)的AI大模型一经推出,即迅速占据100多个国家和地区移动应用下载量排行榜首位,广受全球网民欢迎。我们欢迎台湾民众使用大陆企业推出的AI大模型,也积极支持两岸企业在人工智能领域开展合作。民进党当局“恐中”“反中”意识作祟,对大陆高科技产品又怕又恨,动辄以维护安全为由一禁了之,只会损害台湾企业和民众的利益。这种用“反智”来“反中”的荒诞做法,已经遭到岛内各界的反感和反对。
2025年2月18日,韩国表示,DeepSeek会搜集用户信息与另一家中国公司字节跳动共享。对此,中国外交部发言人郭嘉昆回复,“关于你提到的涉及企业的具体问题,请向企业或主管部门进行了解。我想强调的是,中国政府高度重视并依法保护数据隐私和安全。”
2025年2月,腾讯、百度、华为、阶跃星辰等多家AI大模型企业接入DeepSeek-R1模型,使得“DeepSeek朋友圈”企业超过100家。尽管DeepSeek R1模型具备训练成本低、性能可与OpenAI o1媲美的优势,但当前面临的问题也不容小觑。潞晨科技创始人尤洋在微博和朋友圈表示,短期内,中国的MaaS模式可能是最差的商业模式,大厂相互卷低价和免费,满血版DeepSeek R1每百万token(输出)只收16元。如果每日输出1000亿token,基于DeepSeek的服务每月的机器成本是4.5亿元,亏损4亿元;用AMD芯片月收入4500万元,月机器成本2.7亿元,这意味着亏损也超过2亿元。“用户越多,亏损越多。”尤洋表示。
2025年2月21日,DeepSeek在其官网X账号宣布,接下来一周,会陆续开源5个代码库,进一步分享新的进展。
2025年2月,杭州深度求索人工智能基础技术研究有限公司研发的DeepSeek人工智能大模型在全球范围内引发广泛关注。个别企业和自然人以社会公众普遍知悉的人工智能大模型名称“DEEPSEEK”等相关商标,向国家知识产权局商标局提交了商标注册申请,个别代理机构涉嫌提供不法服务,具有明显“蹭热点”、牟取不当利益的意图。国家知识产权局坚决打击此类恶意申请行为,依法对第82848449号“DEEPSEEK”等63件商标注册申请予以驳回。
2025年2月27日,国政协委员、新希望集团董事长刘永好称,梁文锋透露DeepSeek 只有160名员工。
2025年3月,Deepseek回应Manus横空出世:我要展示自信,AI的目标是拓展而非取代人类。
2025年3月8日,00后主播用DeepSeek直播1天卖出3.3亿元。
2025年3月10日,义乌老板利用DeepSeek卖空小商品,也有博主用DeepSeek写歌获利数万。
2025年3月11日,针对DeepSeek将在3月17日发布下一代R2模型的传闻,DeepSeek官方企业咨询账号在用户群中回应称,“辟谣:R2发布为假消息”。
2025年3月,从黑猫投诉中找到了消费者最常接触到的12种仿冒DeepSeek的APP。
2025年3月,据外媒报道,在近日向白宫提交的一项政策建议中,OpenAI对DeepSeek进行了十分露骨的攻击。一边称DeepSeek是“另一个华为”,是“国家补贴”“国家控制”的,会受中国指示“操纵其模型以造成损害”,一边强烈呼吁对该机构及类似机构开发的中国AI模型实施禁令。
截至2025年3月16日,在DeepSeek问世两个月内,仿冒DeepSeek激增已近三千。
2025年3月20日,据DeepSeek消息,DeepSeek R1的API服务和网页对话服务此前出现不可用情况,目前已恢复正常。
2025年4月,缅甸发生中部地震后,中国驻缅甸使馆称,前方在使用基于DeepSeek紧急开发的中缅英互译系统,据了解,该系统是国家应急语言服务团秘书处和北京语言大学迅速组建的语言服务支持团队,利用DeepSeek在仅仅七小时内开发出来的,至今缅甸已有700余人持续使用该平台,这也是中国大模型首次用于地震国际救援 。