OpenAI
美国人工智能研究公司
OpenAI,是一家开放人工智能研究和部署公司,其使命是确保通用人工智能造福全人类。创立于2015年12月,总部位于美国旧金山。现由营利性公司OpenAI LP及非营利性母公司OpenAI Inc组成。
公司发展
早期发展
2015年12月11日,OpenAI由埃隆·马斯克(Elon Musk)、美国创业孵化器Y Combinator总裁萨姆·奥尔特曼(Sam Altman)、全球在线支付平台PayPal联合创始人彼得·蒂尔(Peter Thiel)等硅谷科技大亨创立。
OpenAI最早作为非营利组织。2015年底,由Elon Musk、萨姆·奥尔特曼和其他投资者成立。埃隆·马斯克与其他硅谷科技大亨进行连续对话后,决定共同创建OpenAI,希望能够预防人工智能的灾难性影响,推动人工智能发挥积极作用。特斯拉电动汽车公司与美国太空技术探索公司SpaceX创始人埃隆·马斯克、Y Combinator总裁萨姆·奥尔特曼、天使投资人彼得·蒂尔以及其他硅谷巨头2015年12月份承诺向OpenAI注资10亿美元。
2016年4月27日,发布首款产品OpenAI Gym Beta。6月21日,OpenAI宣布了其主要目标,包括制造“通用”机器人和使用自然语言的聊天机器人。OpenAI研发主管伊利娅·苏特斯科娃(Ilya Sutskever)、OpenAI CTO格雷格·布劳克曼(Greg Brockman)、硅谷创业加速器Y Combinator总裁萨姆·奥尔特曼以及连续创业家埃隆·马斯克等人联合发表博文称:“我们正致力于利用物理机器人(现有而非OpenAI开发)完成基本家务。”12月5日,发布Universe。
2017年,“情绪神经元”和OpenAIFive项目的突破,使得OpenAI开始关注大型语言模型(LLM)和参数规模,实现AGI的信念增强。7月20日,发布Proximal Policy Optimization算法。
OpenAI成立初期,机器人技术是主攻方向之一,由联合创始人沃伊切赫·扎伦巴领导,试图打造一个“通用机器人”。2019年,研究人员曾联合发表论文,声称正朝着训练机器人系统执行各种日常任务迈出基础性的一步。但是2020年10月,OpenAI放弃这一努力,扎伦巴将此归咎于缺乏训练数据。
转型期
2018年,随着埃隆·马斯克的退出,以及大模型对资金超乎预期的需求,2019年3月,OpenAI从非营利性转变为“封顶”的营利性。在非营利母公司主体下,创建了一个限制性营利实体OpenAI LP,引入了上限利润模式,允许OpenAI LP合法地吸收风险投资和员工持股。OpenAI转向了混合结构:由营利性公司OpenAI LP及非营利性母公司OpenAI Inc组成。
2019年7月,微软(Microsoft)宣布与OpenAI开展为期多年的合作。微软投资OpenAI10亿美元,双方将携手合作替Azure云端平台服务开发人工智能技术。微软也成为OpenAI的独家云供应商和OpenAI新AI技术商业化的首选合作伙伴。微软的加持使得OpenAI的大模型开发如虎添翼。
2021年5月,OpenAI官方宣布了成立1亿美元的人工智能创业基金,该基金将由OpenAI管理,并由微软和其他OpenAI合作伙伴投资,计划投资1亿美元来帮助更多AI初创公司。投资方向:少数早期阶段的创业公司,且处于可以产生变革性影响的领域,如医疗保健、气候变化和教育以及基于生产力的人工智能工具。
OpenAI通过“资金+技术+战略”支持的方式,支持优质的AI初创公司;反过来,被投公司成长起来后,增加OpenAI产品落地的场景需求和产业知识,从而反哺基础技术创新。这一模式使得OpenAI可以超前把握未来颠覆性技术的机会,并超前投资布局未来产业。
这一转变让OpenAI的投资模式变为孵化器模式,从而更加高效地对目标企业进行投资与技术支持。从而有条件开始自己的第二阶段战略:通过“资金+技术”投资初创企业的方式积极布局,为嵌入未来海量应用场景和指数型、裂变式增长铺路。
发展期
2022年11月30日,OpenAI发布ChatGPT全新聊天机器人模型。ChatGPT这一款革命性产品的上线引爆全球,成为用户破亿速度最快的消费级应用。全年营收达到2800万美元。
2023年1月,ChatGPT的月访问量超6.7亿次,将OpenAI推上全球访问量前50大网站榜单。2月16日,OpenAI买下了超优质域名AI.com,并将其链接跳转到了ChatGPT;同年3月,GPT登陆Bing,对搜索引擎带来革命性重构。OpenAI创始人对员工透露,其年营收达到了13亿美元,也就是同比增长超过45倍。OpenAI逆袭成全球AI“新王”,开启的新一轮AI革命的大幕。5月,OpenAI开放众多插件(当时已有70个),让用户得以利用插件组合满足个性化需求,成为了OpenAI创建生态系统、从产品思维转变至平台思维的标志性事件。5月18日(当地时间),在美国地区推出ChatGPT的首个官方移动应用程序ChatGPT APP,5月19日跃升美国地区iOS APP Store(应用程序商店)排行榜首位。分析人士指出,此举将快速开启GPT大模型在垂直领域的应用,加速行业应用。7月26日,安卓版ChatGPT在美国、印度孟加拉国巴西提供下载。8月16日(当地时间),OpenAI宣布收购初创企业Global Illumination,后者的整个团队已加入OpenAI,共同开发包括ChatGPT在内的核心产品。同年,9月14日,OpenAI宣布将在爱尔兰都柏林开设办公室,这将是该公司的第三个办事处。11月在首届OpenAI开发者大会上,OpenAI首席执行官萨姆·奥尔特曼回顾了公司过去一年的发展历程,已经有200万开发者正在使用OpenAI的API(应用程序接口),在全球各地提供多种多样的服务;92%的财富500强公司正在使用OpenAI的产品搭建服务,而ChatGPT的周活用户数也达到1亿人。奥尔特曼向全球开发者和ChatGPT用户展示了AI龙头即将推出的一系列产品更新:一是,GPT模型再迭代,OpenAI推出GPT-4 Turbo;二是OpenAI开始向AI个人助理的方向努力;三是宣布将上线一个GPT商店,OpenAI允许用户申请上线自己制造的GPT,并承诺根据GPT的使用情况向创建者支付费用。
2024年3月消息,OpenAI宣布推出全新的人工智能模型——“语音引擎(Voice Engine)”。这款自2022年起便默默研发的模型,如今已成为OpenAI文本转语音API以及本月早些时候发布的新版ChatGPT语音与朗读功能提供支持。5月28日(当地时间),OpenAI发布声明,宣布公司董事会成立安全与安保委员会,根据声明,该委员会的首要任务是在未来90天内评估并进一步发展OpenAI的流程和保障措施。90天后,委员会将与全体董事会分享建议。在全体董事会审查之后,OpenAI将以符合安全和保障的方式公开分享已采纳建议的最新进展,OpenAI透露,最近已开始训练下一个前沿模型,“预计由此产生的系统将使我们在通往通用人工智能(AGI)的道路上达到更高的能力水平”。7月30日(当地时间),OpenAI宣布,开始向部分ChatGPT Plus用户开放GPT-4o高级语音模式,并计划于秋季向所有Plus付费用户开放。10月31日(当地时间),OpenAI宣布上线免费ChatGPT搜索功能。ChatGPT成为AI搜索是AI领域的一次重大变革,引发了行业竞争。
2022年11月30日,推出了ChatGPT,这一款基于GPT-3.5的对话机器人,可以与用户进行交互式的聊天。同年12月,ChatGPT爆红,全球造访量至少17亿用户,成为了历史上用户量增长最快的应用程序。
2023年2月,发布了DALL-E 3。这是一款可以根据描述生成图像的模型,并将其集成到ChatGPT中,让用户可以通过聊天创造新的图像;推出ChatGPT Plus订阅服务。3月,发布GPT-4,一款比GPT-3.5 更强大的语言模型。于4月正式上线并被应用到ChatGPT Plus中,提供给付费用户使用。5月,OpenAI宣布与微软合作,在Azure AI超级计算平台上部署ChatGPT,并提供更高效和可扩展的服务。OpenAI推出了ChatGPT的iPhone应用程序ChatGPT APP。这款应用是ChatGPT的首个官方移动应用程序。5月25日,OpenAI在推特宣布,ChatGPT官方App现已在更多地区的App Store上线。6月,OpenAI为ChatGPT增加了语音功能,让用户可以通过语音与机器人进行对话,并听到机器人的回答。7月,ChatGPT推出定制指令功能。7月26日,OpenAI宣布,安卓版ChatGPT在美国、印度、孟加拉国和巴西提供下载,并计划将其推广至更多国家。8月15日(当地时间),OpenAI官宣,将GPT-4用于内容策略开发和内容审核决策,以实现更一致的标签、更快的策略优化的反馈闭环以及更少的人工审核人员参与。8月28日(当地时间),OpenAI宣布推出企业版ChatGPT。10月3日(当地时间),微软官宣,OpenAI最新的DALL-E 3模型现已面向所有Bing Chat和Bing Image Creator用户开放。11月6日(当地时间),首届OpenAI开发者大会。在OpenAI 首届开发者大会开启前,ChatGPT各种爆料已出,全新UI界面,人人可定制GPT,将引领「智能体工程师」新职业诞生。萨姆·奥尔特曼向全球开发者和ChatGPT用户展示了即将推出的一系列产品更新。同日,OpenAI在官网宣布推出自定义版本ChatGPT,解禁了 ChatGPT两大能力,一是上传多种类型文档,二是无需转换即可使用所有工具。11月22日,OpenAI宣布ChatGPT Voice功能向所有用户开放。ChatGPT Voice是使用OpenAI的语音技术Whisper创建的,该技术只需分析几秒钟的真人语音即可生成无限小时的对话。Spotify正在使用OpenAI的语音技术将Lex Friedman、Dax Shephard和其他播客的内容翻译成西班牙语、法语和德语。12月14日,CEO萨姆·奥尔特曼在X平台发文称,已重新开放ChatGPT Plus订阅,在此前11月15日CEO萨姆·奥尔特曼在X平台发文称,将暂停ChatGPT Plus新用户注册。
2024年1月10日(当地时间),OpenAI宣布推出GPT商店和ChatGPT Team服务,ChatGPT Team和GPT Store都是OpenAI公司新的收入驱动力。同日,OpenAI对使用条款进行更新,删除了禁止他们的技术被用于军事用途的条款。2月16日,OpenAI发布首款“文本生成视频”大模型Sora,使其成为最新一家采用生成视频技术的人工智能公司。同时,OpenAI宣布一项要约售股交易,由此OpenAI整体估值高达800亿美元,一年内飙升两倍多。3月,OpenAI发布大模型加持的机器人Figure 01。3月29日(当地时间),OpenAI在官网首次展示了名为“Voice Engine”的语音生成模型。4月,人工智能初创公司OpenAI宣布,即日起用户无须注册即可开始使用ChatGPT的功能。4月30日,OpenAI宣布向所有ChatGPT Plus用户开放“记忆功能”。5月7日(当地时间),OpenAI发布公告称,推出了一款图像检测分类器,用来分析一幅图像是由OpenAI的“文生图”工具DALL·E 3生成的概率。并宣布加入C2PA的指导委员会。5月14日,OpenAI推出了ChatGPT桌面版应用程序。同日,OpenAI宣布推出其最新旗舰生成式AI模型GPT-4o,GPT-4o将免费提供给所有用户使用。5月28日,OpenAI表示已开始训练新人工智能模型,以取代其ChatGPT聊天机器人所依赖的GPT-4系统;5月30日,宣布推出为大学开发的ChatGPT Edu教育版。7月18日,OpenAI公布的最新技术研究Prover-Verifier-Games(PVG),这项旨在提升AI模型推理和输出准确性的新技术,很好地解决了输出“黑盒”这个难题。同日,推出新的人工智能模型“GPT-4o mini”。7月25日(当地时间),OpenAI推出了名为“SearchGPT”的搜索新功能。8月9日,OpenAI宣布ChatGPT免费用户可以每天使用其DALL-E 3 模型生成图片。9月13日,OpenAI发布最强水平大模型,此前被称代号为草莓(Strawberry)项目,解决博士生级别科学问题。9月,OpenAI宣布,所有付费订阅OpenAI ChatGPT Plus和Team计划的用户都将可以使用新的ChatGPT高级语音助手Advanced Voice,该功能将首先在美国市场上线。9月25日,OpenAI正式推出高级语音功能。10月3日(当地时间),OpenAI宣布推出全新界面canvas。10月25日消息,OpenAI计划在12月前推出其下一个前沿模型Orion。12月4日(当地时间),人工智能头部公司OpenAI宣布,从12月5日(当地时间)开始,OpenAI进入一个持续发布新功能的周期。12月9日(当地时间),OpenAI宣布正式向用户开放人工智能(AI)视频生成模型版本Sora,该系统可以根据文本提示生成逼真的视频。12月17日消息,美国时间周一,OpenAI宣布将向所有ChatGPT用户开放搜索功能。12月18日凌晨,OpenAI开启了第9天技术分享直播,正式发布了o1模型的API,并且对实时API进行大升级支持WebRTC。12月25日,Theinformation消息,OpenAI正在研发实体智能机器人,并且重新启动了解散4年的内部机器人开发团队。12月31日,OpenAI首席执行官山姆·奥尔特曼公布了2025年OpenAI即将发布的技术产品。分别是:AGI(通用人工智能)、Agents(智能体)、更好的GPT-4o升级版、更好的记忆存储、更好的上下文窗口、成人模式、深度研究特色功能、更好的Sora、更好的个性化定制。
美东时间2025年1月14日,OpenAI宣布推出名为Tasks的测试版新功能,从当日开始,三个不同版本ChatGPT——ChatGPT Plus、Team和Pro的订阅用户将可以试用这个新功能。它让ChatGPT作为聊天机器人变得更像一种传统的数字助手,比如苹果的Siri或者谷歌的Google Assistant,只不过区别是这个助手拥有更先进的语言功能。当地时间1月21日,美国总统特朗普在白宫宣布,OpenAI、软银和甲骨文公司将共同投资5000亿美元建立一家名为“Stargate”的新公司,专注于推动美国人工智能基础设施建设。
2025年1月,OpenAI发布首个智能体Operator,能像人类一样与界面交互,完成任务,打破API局限,刷新SOTA,但能力尚不及人类,目前仅对美国Pro用户开放。1月,OpenAI推出ChatGPT GOV,面向美国政府机构。北京时间2月1日凌晨,OpenAI发布全新推理模型o3-mini ,并首次向免费用户开放推理模型。当地时间2月2日(北京时间2月3日),OpenAI为旗下ChatGPT发布一款面向深度研究领域的智能体产品,名为“深度研究”(deep research)的新AI代理工具,目前面向Pro用户,接下来将对Plus和Team用户开放。2月4日,Kakao和OpenAI宣布开展战略合作。2月5日,OpenAI宣布完成一次全面的品牌重塑,包括全新的字体、Logo和色彩方案。OpenAI的新Logo在外观上与旧版差异不大,但经过微调后,标志中心部分的空间略微增大,线条更加简洁流畅。2月6日凌晨3点,OpenAI宣布向所有用户开放ChatGPT搜索功能,无需注册。2月7日,OpenAI在社交平台X发文,宣布面向免费和付费用户更新o3-mini的思维链,并为付费用户更新o3-mini-high的思维链。2月,OpenAI宣布,它正在评估美国哪些地区适合作为“星际之门”(Stargate)项目的数据中心所在地,并将该项目视为美国能否在全球人工智能(AI)竞赛中保持领先的关键事项。2月11日消息,Roblox、Discord、OpenAI 和谷歌联合推出了一个名为 ROOST(强大开放在线安全工具)的非营利组织,旨在为 AI 时代构建可扩展且互联互通的安全基础设施。当地时间2月25日,OpenAI宣布,即日起向免费用户推出GPT-4o mini驱动的高级语音模式。2月26日,OpenAI宣布将向所有ChatGPT Plus、Team、Edu和Enterprise用户推出其Deep Research功能。2月28日,OpenAI GPT-4.5 API正式上线。3月4日,OpenAI最新推出NextGenAI,致力于加速科研突破和教育变革。3月6日,OpenAI 宣布 GPT-4.5 正式面向所有 ChatGPT Plus 用户开放。当地时间3月25日,OpenAI宣布推出GPT-4o图像生成功能。3月27日,OpenAI 宣布对其Agent SDK进行重大更新,正式支持 Model Context Protocol(MCP)服务。
当地时间2025年3月31日,OpenAI宣布在软银集团领投的新一轮融资中筹集400亿美元,投资后估值达到3000亿美元。公司表示,计划利用资金进一步推进人工智能研究、扩大计算基础设施。同日,OpenAI 首席执行官 Sam Altman 表示,OpenAI 计划在未来几个月内发布自 GPT-2 以来首个具有推理能力的开放权重语言模型。4月2日,OpenAI 上线了 OpenAI 学院(OpenAI Academy)。4月2日消息,OpenAI宣布推出PaperBench——一个评估AI智能体复现前沿AI研究能力的基准。
全球布局
OpenAI海外扩张,显示其全球化战略,有助于本地化服务和产品,加强与全球市场联系。奥尔特曼称,扩张是吸引全球一流人才、推动通用人工智能开发和政策创新的机会。随着欧盟寻求对人工智能进行监管,在伦敦设立办事处将对OpenAI有利。
2024年12月,OpenAI表示,该公司将在瑞士苏黎世设立一个新的分支机构,以加强其在欧洲的影响力。OpenAI表示,苏黎世将成为其在欧洲的第五个办公地点;在过去两年里,该公司已在都柏林、伦敦、巴黎和布鲁塞尔开设分支机构。
2025年2月3日,软银集团与OpenAI在东京举办一场有500多家日本公司到场的会议,旨在建设日本的人工智能基础设施,包括建设面向人工智能的数据中心和发电厂,将寻求运输、制造、制药和金融等各行各业的支持。2月,OpenAI表示,将在慕尼黑设立其首个德国子公司,新办事处将在未来几个月开业。2月10日,‌OpenAI‌计划在2025年内完成首款自研AI芯片的设计,并送往‌台积电‌进行制造,预计2026年实现量产。此举旨在减少对‌英伟达‌芯片供应的依赖。‌2月13日,OpenAI首席执行官萨姆·奥尔特曼宣布,OpenAI将在未来几个月内推出名为GPT-5的模型,该模型将整合OpenAI的大量技术,包括o3,并应用于聊天机器人ChatGPT以及API平台。因此,OpenAI不再计划将o3作为独立模型发布。2月16日消息,OpenAI公司CEO萨姆·奥尔特曼宣布,GPT 4o的智力水平将提升至o3 pro级别,并且他认为更新后的GPT 4o是最佳的AI搜索产品。3月6日消息,OpenAI计划对达到博士水平的AI Agent每月收费2万美元,这些 “博士水平” 的AI Agent能够处理学术研究和软件开发领域中的复杂任务。据悉,OpenAI计划推出三种类型的AI Agent,其每月收费可能在2000美元到2万美元之间。3月10日,CoreWeave与OpenAI签订了一份为期五年、价值119亿美元的合同。OpenAI将通过认购价值3.5亿美元的CoreWeave公司股票,成为后者的投资者。作为协议的一部分,CoreWeave将向OpenAI提供人工智能基础设施。3月20日,OpenAI发布博文,宣布推出语音转文本(speech-to-text)和文本转语音(text-to-speech)模型,提升语音处理能力,支持开发者构建更精准、可定制的语音交互系统,进一步推动人工智能语音技术的商业化应用。当地时间3月25日,美国开放人工智能研究中心(OpenAI)宣布推出4o图像生成功能,“将迄今最先进的图像生成器集成至GPT-4o”。3月28日消息,OpenAI须在今年年底前转型为一家营利性公司,以确保获得由软银领投、处于最后阶段的400亿美元全额融资,否则本轮融资规模可被缩减至200亿美元。
融资历程
2023年1月OpenAI从微软公司筹集了100亿美元。据福布斯发布2023云计算100强榜单,2023年云计算100强企业的平均融资金额为8.05亿美元,高于一年前的6.1亿美元,其中原因包括了OpenAI的重大融资活动。
2024年10月3日,OpenAI宣布完成新一轮巨额融资,金额达到66亿美元,投后估值高达1570亿美元(约合人民币1.1万亿元),刷新投资交易规模。至此,OpenAI成为与马斯克创办的SpaceX、张一鸣的字节跳动并列在内的全球前三大初创公司。除了从主要投资者处获得新一轮66亿美元融资外,公司还与摩根大通、花旗、高盛、摩根士丹利、桑坦德银行、富国银行、三井住友银行、瑞银和汇丰银行建立了40亿美元的循环信贷额度。OpenAI称这意味着其可以获得超过100亿美元的流动资金。
2025年3月27日,据报道,OpenAI接近敲定由软银牵头的400亿美元融资,投资者包括Magnetar Capital、Coatue Management、Founders Fund和Altimeter Capital Management,这笔交易将使该公司估值达到3000亿美元。
财务状况
2023年1月,微软继续投资OpenAI,增援100亿美金,占股比例达到49%,OpenAI估值达到290亿美金。
OpenAI披露的收入并不包含营利部门的收入,而ChatGPT正在积极变现。根据OpenAI的融资信息,OpenAI的估值超过860亿美元。其财务状况是一个黑匣子。OpenAI的非营利地位受到了批评者的批评,他们质疑一家价值860亿美元的公司如何能由慈善机构控制。这也是2023年11月,OpenAI出现人事动荡的部分原因。
2024年1月,受益于降价之后用户数强劲增长,OpenAI驶入商业化快行线,2023年底的年化收入(月收入x12)已突破16亿美元。OpenAI估值也水涨船高,正筹划新一轮融资,公司估值已达1000亿美元,成为SpaceX之后美国估值第二高的创业公司。全球范围内的估值排名位列第三。
2024年4月,过去十年间,OpenAI已获得融资总额143亿美元(约合1034.30亿元人民币),最新估值已超过800亿美元(5786.32亿元人民币)。
2024年10月8日(当地时间),OpenAI与美国媒体集团赫斯特宣布达成内容合作协议,允许后者旗下报纸和美国国内杂志内容被整合到OpenAI产品中。双方未披露交易条款。
2025年1月21日,微软表示,微软将不再是OpenAI的独家云服务提供商,但仍将对OpenAI的新的云服务协议拥有“优先购买权”。
价值理念
哲学思想
(详见主词条:有效利他主义
有效利他主义(Effective Altruism),最初是慈善领域的一个相对简单的想法:在最有效的地方捐款,而不是仅仅为了“温暖的光辉”而无效地捐款。英国哲学教授威廉·麦克阿斯基尔(William MacAskill)是有效利他主义运动的创始人。鉴于以功利主义数学为基础,该运动开始吸引来自大型科技公司的支持者,他们开始进一步推动这一逻辑。当可通过赚更多钱来增加捐款数额时,为什么只关注捐赠的钱呢?这种逻辑表明,如果有能力,在对冲基金或大型科技公司工作并进行捐赠比为慈善机构工作更道德。逻辑进一步推演,将信奉有效利他主义的人指向两件事:星际定居(这样人类就可以在地球灭绝事件之后生存)和通用人工智能(AGI)——人工智能的超级智能版本,如果正确“对齐”,可以为人类谋福利,极大地提高人类生存的长度和质量。这就是OpenAI应该发挥作用的地方。
核心目的
OpenAI成立之初是一个真正的非营利组织,核心目的就是确保通用人工智能(AGI)安全引入。官网上都明确了OpenAI的目标是“确保人工智能造福全人类”。
核心理念
2020年。OpenAl提出核心理念——Scaling Law(缩放规律),其理念为大模型规模越大,其性能越好。2018年6月,0penAl推出第一代大语言模型GPT1,其参数规模为1.17亿,从总计4GB的书籍中训练得来;2019年,OpenAl再次推出参数规模为上一代的12倍,文本规模是上一代的8倍多的GPT2模型,其在文本生成方面更加出色。2020年6月推出的GPT-3,其参数规模达1750亿,是GPT2模型的116倍,也是微软Turing-NLG模型的10倍,成为当时市面上最大的自然语言处理模型。2024年年初爆火的Sora模型,再一次验证了Scaling Law的“大力出奇迹”的成功。
公司使命
OpenAI的使命是确保人工智能(AGI)造福全人类。所谓AGI,指的在最具经济价值的工作中胜过人类的高度自主系统。这一使命体现在OpenAI公司章程中。
在产品讨论中有策略地使用了“在这些选项中,哪一个让我们感觉更接近AGI”这一短语,有助于决定打造什么、和因为使命而决定放弃。明确的重点永远是速度的驱动力。使命有助于保持专注,也为许多新想法铺平了道路。
企业文化
在企业文化塑造方面,OpenAI将AI安全作为企业文化的核心部分,并在日常研发中贯彻这一理念。其通过与公众的沟通和交流,强化了社会对AI安全问题的认知和理解。
公司治理
融资结构
OpenAI初始资金是由企业家们捐赠,包括OpenAI创始人萨姆·奥尔特曼,也包括埃隆·马斯克的1亿美元。资助者似乎承诺在该组织的发展过程中向该组织提供数十亿美元,因此它不需要担心支付该项目的账单。由于各种原因,包括性格冲突和方向差异——这种“纯粹”的非营利模式并没有持续多久,OpenAI原本以为可以从埃隆·马斯克那里得到的钱也枯竭了。
2019年,Altman的任务就是找钱,这使得OpenAI需要尝试吸引商业参与者的投资,OpenAI转向了混合结构。希望一家公司能够给他们带来回报。在Altman领导的一系列举措中,OpenAI转向了混合结构,然而,投资者被警告说,他们应该考虑到OpenAI可能永远不会产生利润,该公司不会主要专注于实现利润,而且他们最好认为,任何投资都更接近于捐赠,而不是产生回报。
为寻求融资,OpenAI在母公司OpenAI Inc.下,成立了子公司OpenAI global,其中微软的投资换取了OpenAI global高达49%的股份。作为交换,投资者可以预期的回报规模有一个相对慷慨的上限:即他们投入的100倍。因此,投资了10亿美元的微软最多可以期望1000亿美元的回报。
管理架构
OpenAI的使命是打造一种造福人类的技术,早期是一家非营利机构;2019年OpenAI转型为一家营利性公司,不过它仍然由一个非营利性的董事会管理。
微软成为OpenAI最大的投资者,但是在OpenAI董事会没有席位,甚至创始人萨姆·奥尔特曼本人也没有该公司的任何股权——这对于该行业来说几乎是闻所未闻的情况。从理论上讲,该模式将吸引志同道合的投资者,愿意接受极其不寻常的治理情况,这将有助于公司专注于其使命。
一方面,董事会拥有任免CEO的权力,但包括Altman在内,董事会成员不持有母公司股份,OpenAI理论上不存在沦为内部人控制的公司的危险;另一方面,投资者是子公司(也是母公司的运营主体)的大股东,却在公司董事会没有席位,做到了与经营隔离,仅仅是战略投资者。OpenAI试图建立一家大型科技初创公司,而创始人/首席执行官Altman并未拥有无懈可击的权力。
根据OpenAI官方说明,董事会的多数成员是相互独立的,各自有不同的背景和专业领域,共同决策和指导OpenAI的发展方向。而从董事会构成来看,奥尔特曼、布洛克曼和苏茨克维与公司具有最直接的联系,而另外三个则有其他社会任职。
2023年12月20日,OpenAI发布公告:将建立专门小组,来监督技术工作和安全决策的操作结构,公司管理层做决策,董事会有权推翻。
2023年12月18日(当地时间),OpenAI发布新安全指南,阐释公司计划如何应对最强大人工智能(AI)系统可能引起的极端风险。在该指南下,OpenAI只会在确定最新技术的安全性之后才会开始运用。公司加强其内部安全流程,将成立一个顾问团队以审核安全报告,再转交公司高层和董事会,并赋予董事会对高风险人工智能的否决权。
安全顾问团负责按月同时向公司管理层和董事会汇报,确保所有决策者充分了解情况。对于不同时间尺度的AI风险,OpenAI成立了三个团队来分别应对:
安全系统团队(Safety Systems)负责当下,减少现有模型如ChatGPT的滥用。
准备团队(Preparedness)负责不久的将来,识别和管理GPT-5等正在开发的前沿模型带来的新风险,由MIT教授Aleksander Madry领导。
超级对齐团队(Superalignment)负责遥远的未来。
管理团队
OpenAI原本董事会成员包括:奥尔特曼、布洛克曼、苏茨克维、Quora首席执行官Adam D’Angelo、技术企业家Tasha McCauley以及乔治城大学安全与新兴技术中心的Helen Toner。其中:奥尔特曼、布洛克曼和苏茨克维都是OpenAI的联合创始人,加上首席技术官米拉·穆拉蒂(Mira Murati),四人构成了OpenAI的核心团队,是ChatGPT-3.5的背后“英雄”。
2022年6月,量子计算专家、ACM计算奖得主Scott Aaronson宣布,将加盟公司。
2023年早些时候,OpenAI董事会成员从9人缩减至6人,其中:萨姆·奥尔特曼、伊尔亚·苏茨克维以及OpenAI总裁格雷格·布罗克曼(Greg Brockman)是该实验室的三位创始人,而其他三人都是独立董事。
2023年11月,OpenAI董事会经历了“宫斗”风波。同月22日,OpenAI发表声明称:萨姆·奥尔特曼将回归OpenAI担任首席执行官。OpenAI组成新初始董事会,三名成员分别是:董事会主席布莱特·泰勒(Bret Taylor)、美国前财政部长拉里·萨默斯(Larry Summers)、问答网站Quora的首席执行官亚当·迪安杰罗(Adam D'Angelo)。11月30日,OpenAI宣布,萨姆·奥尔特曼已经回归担任首席执行官,米拉·穆拉蒂担任首席技术官,格雷格·布罗克曼担任总裁。
2024年2月13日(当地时间),人工智能研究员、OpenAI创始成员之一安德烈·卡尔帕西(Andrej Karpathy)在社交媒体平台X上发文称,他已离开OpenAI。3月8日(当地时间),OpenAI公布“宫斗”调查结果的同时,宣布此次除了萨姆·奥尔特曼重回OpenAI董事会外,还将任命三位新董事,其中包括比尔和梅琳达·盖茨基金会前首席执行官Sue Desmond-Hellmann、索尼娱乐公司前总裁Nicole Seligman和Instacart公司首席执行官Fidji Simo。萨姆·奥尔特曼和这些新成员,将加入现任董事会成员——Quora首席执行官Adam D'Angelo、前美国财政部长拉里-萨默斯(Larry Summers)和前Salesforce联席首席执行官、董事长Bret Taylor的行列。至此,OpenAl董事会将共有7名成员。8月,OpenAI已聘请Meta Platforms前高管伊琳娜·科夫曼(Irina kaufman)负责战略计划。9月16日,该公司安全和安保委员会将成为独立的董事会监督委员会,Zico Kolter将担任该委员会主席。
参考资料:
人才来源
OpenAl能持续打造出重磅产品,离不开其背后的顶尖团队成员。2023年2月底,Leadgenious和Punks&Pinstripes对OpenAl的736名员工背景作分析,有389名员工是由其他公司跳槽而来,其中193名成员工来自知名大厂公司。
对外合作
与微软合作
自2019年起,微软与OpenAI建立了合作伙伴关系。微软是OpenAI最大的投资者。
截至2023年12月,微软已向OpenAI这家人工智能初创公司投资了130亿美元,拥有其49%的股份。微软已将OpenAI的最新技术整合到自己的企业工具套件中,OpenAI也在微软的云服务上投入了大量资金。
OpenAI所有技术都运行在微软Azure云服务器上,微软则为OpenAI提供大模型算力中心。微软建立了全球最大的超级计算集群之一,以帮助OpenAI训练规模更大、能力也更强大的人工智能模型。微软的聊天机器人和搜索引擎Bing Chat根据OpenAI的模型构建,首次亮相以来用户使用该机器人已经聊天超过10亿次,能够根据用户提示转化图像的Bing Image Creator生成图像超过10万张。将OpenAl的技术整合到旗下搜索引擎必应、营销软件、GitHub编码工具、Micro-soft365办公软件中,构建AI服务体系。
2025年1月21日,微软表示,微软将不再是OpenAI的独家云服务提供商,但仍将对OpenAI的新的云服务协议拥有“优先购买权”。微软仍保留在其Azure云平台上转售OpenAI模型的独家权利,以及在自己的产品中重用OpenAI知识产权的权利,并补充说,两家公司目前的协议将延长至2030年。
OpenAI在戏剧性的内斗事件之后,组成新初始董事会,微软获得了一个“无投票权观察员”席位,即公司代表可以参加OpenAI的董事会会议并获取机密信息,但在选举或选择董事等事项上没有投票权。这也一定程度意味着微软在OpenAI的后续经营管理中将拥有更大话语权。
微软总裁Brad Smith表示:“自2019年以来,微软与OpenAI建立了合作伙伴关系,促进了更多的人工智能创新和竞争,同时保持了两家公司的独立性。而唯一改变的是,微软现在将在OpenAI董事会中拥有一个无投票权的观察员席位,这与谷歌收购DeepMind等案例截然不同。”
2024年7月10日消息,微软宣布将放弃在OpenAI董事会的观察员席位,称OpenAI在过去八个月中取得了“重大进展”,对公司发展方向充满信心,因此不再需要该席位。
收回130亿美元投资前,微软有权获得OpenAI公司75%的利润;收回投资后,微软将持有OpenAl公司49%的股份。
与施普林格
2023年12月,新闻出版巨头施普林格出版集团(Axel Springer)与ChatGPT开发机构OpenAI宣布达成一项史无前例的协议,允许 ChatGPT 对来自 Politico 和 Business Insider 等媒体的新闻文章进行总结摘要。施普林格也成为全球第一家与 OpenAI 合作将新闻业与人工智能技术进行更深入整合的出版机构,这是媒体为在人工智能工具中使用其内容而争取资金补偿的一个重要里程碑。
OpenAI和施普林格的协议生效后,当用户向ChatGPT提问时,它将以来自Politico、Business Insider、Bild 和Welt等媒体的新闻文章摘要作为回应。
作为协议的一部分,施普林格将为OpenAI的大型语言模型(例如支持ChatGPT的AI模型GPT-4)提供其媒体品牌的内容作为其训练数据。
与淡马锡
2024年3月,新加坡主权财富基金淡马锡有意投资OpenAI。其高管最近几个月多次会见了OpenAI首席执行官萨姆·奥尔特曼。若淡马锡与OpenAI双方达成合作,这将是OpenAI首次获得国家背景的资金支持。
淡马锡由新加坡财政部完全控股。2021年淡马锡规模高达3810亿新加坡元(当前约2万亿元人民币),其与另一只新加坡政府所有的基金GIC一同进入主权财富基金榜单前十。科技领域一直是淡马锡投资组合的一部分,而 AI正成为其关注重点。
与政府合作
OpenAI通过与政府机构的积极对话和合作,推动了AI安全监管标准的制定和实施。其目标是将安全评估作为AI系统的必要环节,以防止不负责任的开发和使用行为。萨姆·奥尔特曼也多次在公开场合强调安全对于AI的重要性,积极推动建立国际规范和标准。
为何Altman欲与政府联手?显然,只要成为规则制定者,就能在竞争中赢者通吃。
北京时间2023年5月16日,OpenAI首席执行官萨姆·奥尔特曼在出席美国国会听证会时表示,面对日益强大的AI模型,政府监管机构的干预对于控制相关风险来说至关重要。萨姆·奥尔特曼在美国参议院就AI技术的潜在危险作证,并敦促立法者对制造先进AI的组织实施许可要求和其他法规。面对美国国会,萨姆·奥尔特曼再次斩钉截铁地保证:在未来六个月内,OpenAI坚决不会训练GPT-5。同时,也对全世界发出警告:AI有可能会对世界有害,为了应对日益强大的AI风险,需要加强监管和立法,而政府的干预极为重要。
此次听证会,Altman开门见山地告诉参议院:AI技术可能会出错,表示自己很担心人工智能行业对世界造成重大伤害。希望与政府合作,防止这种情况发生。
对于怎么监管,Altman也替政府想好了,提出了成体系方案,包括三点:一是成立一个新的政府机构,负责为大型AI模型颁发许可,撤销不符合标准的模型的许可;二是为AI模型创建一套安全标准,包括对其危险能力的评估。例如,模型必须通过安全测试,比如它们是否可以“自我复制”和“流出到监管之外”;三是要求独立专家对模型在各种指标上的表现进行独立审计。
与普华永道
2024年5月29日(当地时间),OpenAI与普华永道会计师事务所达成合作协议,普华永道将成为OpenAI最大企业用户和首个转售经销商。
与苹果
2024年5月,有消息称,OpenAI已经与美国科技巨头苹果达成协议,苹果可能会在两周后的全球开发者大会(WWDC)上宣布将聊天机器人ChatGPT集成到即将发布的手机系统iOS 18中,此举有望给OpenAI带来数十亿美元的收入。
与Meta
2024年11月26日消息,OpenAI和Meta将开始用非洲语言训练人工智能大模型,以解决非洲大陆数千种方言模型短缺的问题。
参加CoSAI
2024年7月,谷歌等14家科技公司在阿斯彭安全论坛上宣布成立安全人工智能联盟(CoSAI),创始成员还包括微软、亚马逊、英特尔、英伟达、IBM、思科、Paypal、OpenAI、Anthropic、Cohere、Chainguard、WIZ、GenLab。
与Figur
当地时间2025年2月5日,AI 机器人公司 Figure 创始人兼 CEO Brett Adcock 的一条推文,宣布终止与 OpenAI 的合作协议,并表示 Figure 在完全自主研发的端到端机器人 AI 方面取得了重大突破,还承诺「将在未来 30 天内展示一些人们从未在人形机器人上见过的东西」。
与Kakao
2025年2月4日,OpenAI宣布将与韩国公司Kakao合作开发人工智能产品。
与软银集团
2025年2月9日消息,软银集团已接近敲定对OpenAI的首笔400亿美元投资,这笔资金将在未来12到24个月内支付,第一笔付款最早将于今年春季到位。
团队管理
管理模式
OpenAI在管理思维、人才选择、工作方法诸多方面的独到之处。
1.人才密度。公司极其重视“人才密度”,倾向于招聘年龄更大的资深技术人员,小型、资深、专注的团队往往有极高的工作效率。OpenAI只有约700名员工,但工作产出可能比大它一万倍的公司还要更高;
2.更有效率。工作节奏非常紧张,但这里不是拼命卷工作时长的地方,许多员工要抽出时间陪伴家人,倒逼他们更有效率地完成任务。
3.面对面沟通。办公室面对面的沟通仍然非常重要。一些创造性的解决方案是在办公室的社交互动中诞生的,OpenAI团队会在午餐桌上碰撞出很多新想法,
4.紧密协作。OpenAI根据职能划分了研究/应用团队,但不同团队之间的协作非常紧密。在ChatGPT团队里,既有设计师和产品经理,也有软件工程师和研究人员。不同职能的团队都需要了解对方的工作,避免出现研究部门只专注于实验,而产品部门只想商业化和赚钱的情况。
5.目标明确。“打造AGI”这一使命是OpenAI团队所有人的终极目标,也是日常工作的指引。使命不仅有助于决定做什么,也有助于决定不做什么。
合作模式
在OpenAi,研究部门和应用部门是两个独立的组织结构。
研究部门训练大型模型,然后应用部门在这些模型的基础上构建ChatGPT和API等产品。在实践中,这是一个更加紧密结合的过程。应用团队与研究部门的紧密耦合是能迅速地推出新创意的原因。能快速推出浏览、代码执行、插件和其他ChatGPT功能,是因为团队间的紧密集成。
在ChatGPT的案例中,大部分研究人员来自研究团队。这些研究人员精通最新的微调技术和强化学习(RL)方法,如临近策略优化(PPO)。由于这些研究人员也是产品组的一员,而且他们自己也在进行A/B实验,因此研究和工程之间的反馈回路非常紧密。
研究团队
开展的研究活动有助于公司加快产品上线的速度。研究工作就是要不断思考统一的方法、打造功能更强的模型。研究团队也要确保工作能和别的研究有交汇的地方,朝着AGI的方向发展。
在研究组织内部,有各种不同的研究团队。如有预培训团队负责培训GPT-4模型;培训后团队负责对GPT-4 进行微调,还有负责校准的团队和让GPT-4能看、能听、能说的多模态团队等等。研究人员具有重要的学术或行业背景,阅读大量学术论文,以了解最新技术,提出想法并进行大量实验,以改进模型,研究人员要做大量的工程设计并编写大量的代码。
应用团队
应用团队是负责开发这些产品的工程、产品和设计的团队,在内部被称为“应用团队”。应用团队是公司内部的一个新成员,始于2020年夏天。OpenAI的目标是构建对全人类有用的安全AGI。应用团队的目标是打造真正让人工智能造福全人类的产品。之所以组建团队,是因为想要围绕GPT-3构建并扩展一个API
2024年5月,OpenAI正式重启其先前放弃的机器人团队。在过去的一年里,OpenAI内部创业基金投资几家公司,这些公司试图开发人形机器人,其中包括Figure AI、1X Technologies和Physical Intelligence。
ChatGPT是应用团队内部的一个产品团队。让ChatGPT像一家小型独立创业公司一样运营,研究和应用紧密结合,长期的产品和研究思维,渐进式发布,高人才密度,日积月累的习惯。
2022年夏天,OpenAI开始开发ChatGPT。当时,应用团队大约有30名工程师、几名项目经理和设计师,正在运行的产品包括、GPT-3CodexAPI接口、模型微调、嵌入应用程序、DALL-E 2等。所有这些产品都使用相同的代码库,在同一个集群中运行,并使用相同的构建管道。
ChatGPT的出现改变了这种状况。几位应用工程师、一些设计师、研究人员和Greg Brockman(OpenAI的总裁兼联合创始人)聚在一间屋子里,开始快速迭代产品创意。给这个新生团队提供了自己的代码库和一个全新的集群。不断迭代,寻找产品市场契合点(Product Market Fit)。随着ChatGPT团队的壮大,确保团队保持垂直整合,意味着工程、产品、设计和主要研究人员始终紧密合作。OpenAI应用工程团队负责人Evan Morikawa说,这种“分形初创公司”的方法对于任何新产品类别来说都是一个很好的模式。
2024年6月,OpenAI完成了对数据库检索和分析公司Rockset的收购。公司将整合Rockset的技术和人员,强化各项产品的检索基础设施。
招聘策略
OpenAI的CEO非常关注人才的高密度。所谓“高人才密度”,指的是平均技能和业绩表现远高于其他地方的正常水平,出色的工作在OpenAI是最基础的。经验丰富的团队可以非常非常快地交付产品,在应用团队招聘时有意向高级工程人员倾斜。此外,尽量保持小规模,事实证明,因为规模非常小的高级团队可以很快完成任务。
团队中容不下不善于团队配合的“独行侠”:希望避免吸引那些一心追求晋升的人,这些人总会为了提升自己的头衔,制造冗余的复杂产品;希望每个人都能很好地沟通,做任何对任务最有利的事情。只要能坚持这一点,就会更加专注、更快地完成任务。
OpenAI把安全放在首位,而不是速度。在招聘时,非常关注AI安全性。公司不希望形成一种速度凌驾于安全之上的文化。
工作方法
OpenAI的日常工作方法也是公司快速发展的因素之。周一至周三,团队会在办公室工作。每个人周一、周二、周三都在旧金山总部办公。协调每天的工作是提高工作效率的关键。靠这种协调性,在一周的前三天就能抵达关键工作节点。
主要产品工作节奏相当紧张。使命、产品和技术的影响力促使大家努力工作。需要强调,这并不一定意味着员工工作时间很长,OpenAI不是那种凌晨2点还有一堆人没下班的地方。每个人都非常重视家庭时间。对家庭的关注,也让团队必须高度集中注意力,分清轻重缓急,灵活安排时间。
主要产品
ChatGPT
ChatGPT,全称Generative Pre-trained Transformer,是OpenAI于2022年11月30日发布的全新聊天机器人模型;是OpenAI公司开发的一种人工智能智能文本生成技术,它可以模拟人类对话的方式,生成有逻辑、有思考、有趣味的文本。
基本原理是,通过深度学习算法,将大量的文本内容输入模型中进行训练,模型会自动学习语言的结构规律,从而可以生成高质量的文本。
在GPT出现之前,NLP模型主要是基于针对特定任务的大量标注数据进行训练。但会存在一些限制:大规模高质量的标注数据不易获得;模型仅限于所接受的训练,泛化能力不足;无法执行开箱即用的任务,限制了模型的落地应用。为了克服这些问题,OpenAI走上了预训练大模型的道路。从GPT-1到ChatGPT,就是一个预训练模型越来越大、效果越来越强的过程,不断迭代。
在OpenAI的官网上,ChatGPT被描述为优化对话的语言模型,是GPT-3.5架构的主力模型。GPT-3.5架构基于OpenAI于2020年推出的GPT-3架构,即生成式语言模型的第3代。早在2020年6月,在训练约2000亿个单词、烧掉几千万美元后,史上最强大AI模型GPT-3一炮而红。
作为聊天机器人,ChatGPT具有同类产品具备的一些特性,例如对话能力,能够在同一个会话期间内回答上下文相关的后续问题;能写诗、撰文、编码、翻译、改错别字、计算机程序纠错等;可上传PDF、数据文档等多种类型文档;无需转换即可使用所有工具(如访问浏览、高级数据分析、DALL·E)。
2024年12月11日,OpenAI宣布面向所有ChatGPT用户开放Canvas功能。
2024年12月18日(当地时间),OpenAI宣布,美国和加拿大用户可通过拨打1-800-ChatGPT(1-800-242-8478)与ChatGPT进行交谈,每月有15分钟的语音通话额度,其他国家的用户也可通过发送WhatsApp消息到同一号码,与ChatGPT进行对话。
ChatGPT的应用范围非常广泛,可以用于智能客服、智能聊天机器人、自动化写作等方面;可以通过与用户的互动,根据用户的需求生成相应的文本,从而提升用户的体验感。除此之外,ChatGPT还可以用于自动化写作,比如新闻报道、文学创作等方面,可以大大提高写作的效率和精度。随着智能化的发展,ChatGPT技术将会在越来越多的领域发挥作用,成为自动化智能服务的重要支撑。
据OpenAI的官方文档,相比之前的GPT模型,OpenAI采用了全新的训练方式,即一种名为“从人类反馈中强化学习”(Reinforcement Learning from Human Feedback,RLHF)的训练方式对ChatGPT进行了训练。OpenAI让人类训练师扮演对话的双方提供对话作为学习资料。在人类扮演聊天机器人的时候,OpenAI也会让模型生成一些建议来帮助训练师撰写自己的回复。也就是说,基于优秀的机器学习算法和强劲的算力,通过海量的数据训练,来让AI学会“思考”。
ChatGPT还采用了注重道德水平的训练方式,按照预先设计的道德准则,对不怀好意的提问和请求“说不”。一旦它发现用户给出的文字提示里面含有恶意,包括但不限于暴力、歧视、犯罪等意图,它都会拒绝提供有效答案。
ChatGPT是设在应用团队内部的产品团队,由软件工程师、设计师、产品经理和研究人员共同组成。
ChatGPT的体验流程更方便,只要注册一个OpenAI的账号就可以体验了,与早期的模型需要申请通过才能体验相比,ChatGPT影响的人群更广泛,讨论的人会更多。
ChatGPT有时会写出看似合理但不正确或荒谬的答案。这是Open AI认为ChatGPT所面临的“限制”,并且解决这个问题被认为是具有挑战性的。其背后原因有三,首先,强化学习的信息源目前并未建立;其次,模型通过学习变得更加谨慎会导致其回避原本能够正确回答的问题;另外,监督学习将会对模型造成误导,因为理想的答案应该来源于模型的认知,而非人工演示者的认知。
ChatGPT的能力获得是基于庞大的语料库,凝练了多领域问题的很多数据做相互校验,然后挑一些基础性的内容回答出来,这其实是“举一千反一”的过程,与人类举一反三的能力还相差较远,它不具备思考能力,所以犯错误不可避免,但通过人为的干预反馈,这些问题是可以被改进的。
在首次亮相后的几个月里,ChatGPT已经成为一种全球现象。2022年12月,在OpenAI宣布有超过一百万人注册该服务几天后,OpenAI总裁格雷格·布罗克曼在Twitter上说,该服务的用户已经达到200万。ChatGPT也是一个资金陷阱。没有广告,根据奥尔特曼在Twitter上发表的一篇文章,每一次对话的数据处理成本平均为“几美分”,每周可能达到数百万美元。为了抵消这些成本,该公司2023年2月宣布将在付费版中收取每月20美元的订阅费,称为ChatGPT Plus。
2023年2月3日,瑞士银行巨头瑞银集团的一份报告显示,在人工智能聊天机器人ChatGPT推出仅两个月后,它在2023年1月末的月活用户已经突破了1亿,成为史上用户增长速度最快的消费级应用程序。根据Sensor Tower的数据,TikTok达到1亿用户用了9个月,Instagram则花了2年半的时间。
ChatGPT的成功使OpenAI进入了硅谷实力派的行列。
2024年4月1日(当地时间),OpenAI宣布,允许用户直接使用ChatGPT,而无需注册该项服务,让185个国家和地区的超1亿用户使用ChatGPT来学习新事物、寻找创意灵感,并获得问题的答案。
GPTs
产品定义:
GPTs是OpenAI于2023年11月7日推出重要产品,用户将能通过自定义指令、拓展(模型)的知识边界和下达行动命令,来构建自己的GPT,并能对外发布给全球更多的人使用。更重要的是,整个构建“自定义GPT”的过程也是通过自然语言对话形成的。
萨姆·奥尔特曼在现场演示了如何通过聊天搭建一个GPT。他给GPT Builder的指令是“希望帮助创业者思考商业灵感并提供建议,然后‘拷问’他们为何公司发展得不够快。”随后ChatGPT迅速搭建了一个创业咨询GPT,还顺手生成了一个Logo。
随后奥尔特曼在属性页面中上传了一份他自己关于创业公司的演讲稿,向这个用例提供了额外的知识。至此,自定义用途的GPT初步搭建完成。用户可以保存这个用例只给自己使用,也能对外公开发布。OpenAI也顺势宣布,将在本月晚些时候上线“GPT应用商店”。对于那些最热门的GPT,公司还将分享一部分的营收,来推进GPT应用生态的进步。
Assistants API
Assistants API(“助理API”)是2023年11月7日OpenAI首届开发者大会上,OpenAI推出的一种“专门构建的AI工具”,可利用“额外的知识”帮助开发者在自家应用程序中构建AI助手。
“助理API”具有特定的指令,利用额外的知识,并能调用模型和工具来执行任务。新的助手API提供了如代码解释器、检索以及函数调用等功能,以处理此前开发者必须自己完成的诸多繁重工作。用例范围非常灵活,例如基于自然语言的数据分析应用、编程助手、AI度假规划器、语音控制DJ、智能视觉画布等等。
Sora
Sora,是OpenAI于2024年2月15日(当地时间)推出,并于2024年12月10日正式向用户开放的一款人工智能视频生成模型,该模型可以根据文字说明创建现实和想象的场景。Sora作为一款通用的视觉数据模型,其卓越之处在于能够生成跨越不同持续时间、纵横比和分辨率的视频和图像,甚至包括生成长达一分钟的高清视频。Sora从文本到视频模式,旨在帮助人们解决需要现实世界互动的问题。
Sora的训练依赖于大量带有文本标题的视频数据。OpenAI利用了DALL-E 3中的标题生成技术,为视频生成高质量的文本标题,以此来提高文本和视频数据之间的对齐度。同时,在大规模训练过程中,Sora展示了一些“涌现的模拟能力”,如三维一致性、长距离连贯性、物体持久性以及与世界互动等。
文本到视频生成能力。能够根据用户提供的文本描述,生成长达60S的高保真视频。
复杂场景和角色生成能力。能够生成包含多个角色、特定运动类型以及准确主题和背景细节的场景。能够创造出生动的角色表情和复杂的运镜,使得生成的视频具有高度的逼真性和叙事效果。
语言理解能力。拥有深入的语言理解能力,遵守用户的提示,使得模型能够更好地理解用户的文本指令,并在生成的视频内容中忠实地反映这些指令。
多镜头生成能力。具有在单个生成的视频中创建多个镜头的能力,同时保持角色和视觉风格的一致性。
从静态图像生成视频能力。能够从现有的静态图像开始,准确地动画化图像内容,或者扩展现有视频,填补视频中的缺失帧。
物理世界模拟能力。能深度模拟真实物理世界。标志着人工智能在理解真实世界场景并与之互动的能力方面实现了重大飞跃。
Sora是一个扩散模型,能够对一个看起来像静态噪声的视频,通过多个步骤去除噪声逐渐转换。Sora通过一次为模型提供多帧的前瞻性,确保主体在暂时离开视野仍保持不变。
Sora使用DALL.E3中的重新捕获技术,生成的视频结果能够更忠实地遵循用户的文本指示。该模型还能够获取现有的静态图像并从中生成视频,对图像内容进行精确动画处理,并关注小细节。该模型还可以获取现有视频并对其进行扩展或填充丢失的帧。
Sora的三维一致性仿真功能。Sora可以用动态摄像机运动生成视频。随着相机的移动和旋转,人物和场景元素在三维空间中一致地移动。
Sora通过在一帧的时间范围内的空间网格中安排高斯噪声补丁实现图像生成功能。该模型可以生成各种尺寸的图像高达2048x2048分辨率。
作为一个模拟器,Sora表现出许多局限性。可能难以准确地模拟复杂场景的物理特性,不理解具体实例的因果关系,例如,一个人咬了一口饼干,但饼干可能没有咬痕。还有可能混淆提示的空间细节,例如混淆左和右。难以精确描述随时间发生的事件,例如跟随特定的相机轨迹。
OpenAI对Sora的定位颇具野心,号称并不仅是“文生视频”的工具,而是一个通用的“物理世界模拟器”,意在复现真实世界重力、摩擦力等物理现象。这样的定位使得Sora未来有望成为跨越各行各业的“超级工具”,可被用于模拟天气变化、自动驾驶、生物行为甚至军事场景等等。
Sora并非是首个文本生成视频的大模型。据不完全统计,截至2023年底,全球能实现文生视频的大模型包括Runway、Pika、Stable Video Diffusion等超过20个产品。
然而,Sora的诞生仍给业界带来了不小的震撼。用户仅需输入简短一句话,Sora可生成一段60秒视频,时长远远超过市面同类型级别的AI视频生成时长(“明星模型”Runway和Pika等几乎也仅有3~4秒);也已超过抖音等短视频平台的平均视频时长,Sora的诞生也为以后短视频平台的内容生产提供了更大的可能性。
中信建投、国泰君安、申万宏源、招商证券等10家券商在研报中均表示,Sora是人工智能发展进程中的“里程碑”,预示AGI(通用人工智能)将加速到来,众多行业将迎颠覆式变革。
GPT-4o
GPT-4o是GPT系列的最新力作。GPT-4o(欧)的“o”源自拉丁语,意思是“全能”(字幕:omni,全能)。该产品是OpenAI推出的一款人工智能模型。GPT-4o模型“会听会看会说”,能够处理50种不同的语言,提高了速度和质量,并能够读取人的情绪。公司CEO萨姆·奥尔特曼发推文表示,新的GPT-4o是OpenAI“有史以来最好的模型”。
最大亮点在于其语音交互模式采用了新技术。GPT-4可以处理由图像和文本混合而成的信息,并能完成诸如从图像中提取文字或描述图像内容等任务,GPT-4o则在此基础上新增了语音处理能力,大大提升运行速度。
语音聊天:新模型可以在最短232毫秒对音频输入做出反应,与人类在对话中的反应时间相近。即使对话被打断,新模型也可以做出自然反应。这是此前人工智能语音聊天机器人做不到的。
图像输入:图像输入方面,研究人员启动摄像头,要求实时完成一道方程题,新模型轻松完成了任务;研究人员还展示了它对一张气温图表进行实时解读的能力。
图像生成:GPT-4o图像生成功能可精准文本渲染、严格遵循指令提示、深度调用4o知识库及对话上下文——包括对上传图像进行二次创作或将其转化为视觉灵感。
GPT-4o是面向未来人机交互范式的全新大模型,具有文本、语音、图像三种模态的理解力,反应极快还带有感情,也很通人性。
2024年12月6日,OpenAI带来了推理大模型o1的满血版本和进阶模式。
2024年12月18日,OpenAI宣布其“推理”人工智能模型o1正式通过API向部分开发者开放,并同步更新了包括GPT-4o、实时API以及微调API等多项开发者工具。首批能够使用o1 API的开发者为OpenAI的“第五级”用户。要达到该级别,开发者需要在OpenAI平台上累计消费至少1000美元,并且自首次成功付款以来账户已超过30天。
OpenAI表示,API 中(以及即将登陆其聊天机器人平台ChatGPT)的o1是“新近经过后训练”的版本,版本号为“o1-2024-12-17”。
实时API是OpenAI用于构建具有低延迟、人工智能生成语音响应的应用程序的API。新版本的GPT-4o和GPT-4omini模型(分别为“gpt-4o-realtime-preview-2024-12-17”和“gpt-4o-mini-realtime-preview-2024-12-17”)是其实时API的一部分,拥有更高的数据效率和可靠性,且使用成本更低。该API还支持WebRTC,这是用于为基于浏览器的客户端、智能手机和物联网设备构建实时语音应用程序的开放标准,可以处理音频编码、流式传输、噪声抑制和拥塞控制。
OpenAI还为其微调API引入了偏好微调;偏好微调比较模型响应的配对,以“教导”模型区分对问题的首选答案和“非首选”答案。该公司还针对Go和Java推出了官方软件开发工具包的“早期访问”测试版。
2024年12月20日(当地时间),OpenAI推出了下一代大模型并将其命名为o3。o3在一系列测试中的表现超过了o1,并在一项关于通往AGI(通用人工智能)的测试中表现优异。不过,o3和o3-mini并未正式发布,安全研究人员可以注册获取o3-mini的预览版。
2025年1月31日,美国OpenAI公司正式上线竞品推理模型o3-mini,并首次向免费用户开放推理模型。OpenAI介绍称,o3-mini支持开发者调整“AI推理努力程度”的选项——分为低、中、高三个级别。这种灵活性使得o3-mini可以在面对难题时“更努力思考”,而需要效率时优先考虑回应速度。
Operator
当地时间2025年1月23日,OpenAI宣布上线名为Operator的首款AI智能体,它能通过网页执行各种任务。Operator可以像人类一样使用互联网执行各种任务,可以打开一个浏览器,点击页面的按钮并打字输入内容。人类用户上网会做的那些事,比如预订机票、酒店订房、规划购物订单并完成网购,都可以由Operator代劳。
产品管理
发布策略
OpenAI发布产品的策略,避免采用“大爆炸、一气呵成”的发布模式。因为持续更新是OpenAI安全的基本原则战略。人工智能安全是OpenAI内部的一个重要话题,也是工作的核心,公司采取了很多方法确保AI的安全性。例如:
研发策略
AI的飞速发展,在给人类带来生产力革命的同时,也带来了前所未有的安全挑战,包括:AI系统本身的稳定性和可靠性隐患,恶意使用AI技术,用户隐私侵犯,AI系统决策过程的公平、透明和可解释性难以保障等。因此,OpenAI在创业过程中并行采取以安全为导向的研发策略,并积极参与到相关政策的讨论和制定过程中,聚焦于推动行业正向发展、企业文化塑造以及巩固行业领先优势等3个维度,以确保AI发展能够在保障安全的前提下更好地服务于人类社会。从技术上提出了两个方向:
一是可扩展的监督,尝试使用人工智能系统来协助人类监督其他人工智能系统;二是解释能力,尝试更好地打开这些模型的内部黑箱,包括使用GPT-4来解释GPT-2中的神经元,使用Model Internals来检测一个模型何时在说谎等。一定程度上,OpenAI在AI安全方面的努力和贡献,不仅有助于推动行业的健康发展,也能够对内塑造企业文化和对外巩固行业领先优势,掌握了行业话语权,从而构建以OpenAI为主导的通用人工智能创新与发展生态。
服务条款
OpenAI服务条款规定,API客户所输出的模型不能被用于“开发任何与我们的产品和服务竞争的AI模型”。“所有API客户必须遵守我们的使用政策,以确保我们的技术被用于好的一面”
微软:“Azure OpenAI服务等微软AI解决方案属于有限访问框架的一部分,这意味着所有客户都必须申请并获得公司的批准才能访问。同时,制定了标准并提供资源,帮助客户负责任地使用这些技术,并遵守公司的服务条款。公司还制定了发现滥用行为的流程,并在客户违反公司的行为准则时停止他们的访问。”
使用禁令
2024年1月15日消息,美国OpenAI公司更新了使用条,不再明确禁止将其技术用于“军事和战争”。
调整前(2024年1月10日之前),OpenAI公司在其AI模型的使用条款中曾明确表示,禁止将其模型用于很可能会造成人员伤亡的用途上,比如“研发武器”和“军事与战争”。
调整后(2024年1月10日):OpenAI对其使用条款进行一番大更新后,公司虽然在禁止项中仍然提到禁止将其产品、模型和服务用于会导致人员伤亡的用途上,并提到了“武器开发和使用”,但先前同样被禁止的军事用途,却在文本中消失。
OpenAI公司的发言人强调,新使用条款中提到的“不要去伤害他人”本身就是一个很宽泛同时也很好理解的概念,可以适用于很多语境之下,而且条款中还列举了武器作为一个明显的例子。
网络安全专家表示,OpenAI此次调整是一个很大的变化,新版使用条款关注重点是在确保法律合规之上提供更多的灵活性,但在很多国家,军事和战争都会被披上合法的外衣,所以OpenAI这次调整潜在影响将是巨大的。
风险管理
风险评估
对于开发中的前沿模型,OpenAI主要跟踪4个类别的安全风险:网络安全、CBRN(化学、生物、放射性、核威胁)、说服能力、模型自主性。评估期间将增加2倍的有效计算量把模型推向极限,并制作“记分卡”,分为“低、中、高、重大危险”四个等级。采取缓解措施后,四个方面得分取最高值作为一个模型的总评分。
只有缓解后风险评分为“中”或更低时才能部署;只有缓解后风险评分为“高”或更低时才能进一步开发;对缓解前为“高”或“重大风险”的模型采取额外安全措施。
网络安全风险
定义为利用模型破坏计算机系统的机密性、完整性、可用性。
CBRN风险
CBRN风险,专注于与模型辅助创建化学、生物、放射性和/或核威胁相关的风险。
说服能力风险
侧重于与说服人们改变他们的信念或采取行动有关的风险。通常强大的说服力很少见,需要大量人力(例如一对一对话,或者精心制作的媒体内容);然而,模型可以在能力范围内使所有内容几乎零成本生成。
模型自主性风险
模型自主性风险就是比较科幻的那种,AI改进自己、阻止自己被关机、逃出实验室了。
企业事件
涉投诉
2023年4月4日,加拿大隐私专员办公室(OPC)宣布开始调查ChatGPT背后的公司OpenAI,涉及“指控OpenAI未经同意收集、使用和披露个人信息”的投诉。
涉诉讼
2023年6月28日,第一起具有代表性的ChatGPT版权侵权之诉,终于出现在了公众视野。两名作家在美国加州北区法院,对Open AI公司发起了版权集体诉讼,指控后者未经授权利用自身享有版权的图书训练ChatGPT,谋取商业利益。
2023年7月,两位美国作家对ChatGPT母公司OpenAI提起诉讼,声称OpenAI在没有获得版权授权的情况下,就利用他们的作品来训练其人工智能。就在几天之前,OpenAI在加利福尼亚州同样被多方提起集体诉讼,起诉书称OpenAI在未经允许的前提下,在互联网上窃取和挪用了大量私人数据来训练ChatGPT。
2023年12月20日(当地时间),包括泰勒·布兰奇和史戴西·希夫在内的11名美国作家在纽约曼哈顿联邦法院起诉OpenAI和微软。。作家向法庭表示,OpenAI在未经许可的情况下,从互联网上批量复制了他们的作品,并将这些作品纳入ChatGPT的训练数据里,侵犯了他们的作品版权。
2023年12月27日,《纽约时报》就侵犯版权起诉OpenAI。诉讼称,《纽约时报》发表的数百万篇文章被用于训练自动聊天机器人,这些机器人作为可靠信息来源与该新闻媒体展开竞争。
2024年2月27日消息,OpenAI遭美国《纽约时报》起诉侵权的诉讼又有新进展:OpenAI已要求联邦法官驳回部分原告诉求,称原告媒体雇用电脑“黑客”操纵OpenAI的生成式人工智能聊天机器人ChatGPT等人工智能系统,进而生成“误导性证据”。OpenAI向纽约曼哈顿南区联邦法院提交文件说,《纽约时报》花钱雇用黑客操纵OpenAI产品,利用“公然违反OpenAI使用条款的欺骗性提示”,诱导ChatGPT生成照搬《纽约时报》版权作品的内容,留作侵权证据。
2024年4月30日(当地时间),对冲基金奥尔登全球资本旗下《纽约每日新闻》等8家美国报纸出版商在纽约联邦法院起诉OpenAI,称OpenAI在未经付款或未经许可的情况下使用了他们的数百万篇文章,为ChatGPT和其他产品训练人工智能模型。
2024年2月29日(当地时间),埃隆·马斯克向旧金山高等法院提起诉讼,由洛杉矶的律师事务所Irell&Manella代表,以违反合同为由起诉OpenAI及其首席执行官萨姆·奥尔特曼,指控他们违反了OpenAI成立时签订的协议,即为了人类的利益而不是利润开发技术。
2024年3月5日(当地时间),OpenAI在官网更新一篇名为《OpenAI与埃隆·马斯克》的博文,文章公开回应特斯拉CEO马斯克于近日对其提起的诉讼,并曝光了8年间与马斯克往来的4封邮件内容。
2024年3月6日,马斯克在社交平台上称,如果OpenAI将公司名称变更为“CloseAI”,他就放弃起诉。OpenAI的字面意思为“开放性人工智能”,而“CloseAI”含义刚好与之相反,马斯克显然是在影射该公司从一家主张开源代码的非营利公司转变为一家被大型企业控制、一切向利润看齐的“闭源”科技企业。
2024年6月11日(当地时间),埃隆·马斯克主动撤回了在加州州法院对OpenAI及其联合创始人萨姆·奥尔特曼和格雷格·布罗克曼提起的诉讼。
2024年8月,马斯克重启对OpenAI及其首席执行官萨姆·奥尔特曼的诉讼。
2024年11月15日,马斯克向美国加利福尼亚州北区地方法院提交了新的起诉书,新起诉书长达107页,较原起诉书增加了20多页,指控OpenAI意图垄断生成式人工智能市场,在竞争中忽视了安全问题。
2024年12月1日消息,马斯克的律师团队已向美国加州北区联邦地区法院申请初步禁令,指控OpenAI、其联合创始人、投资者微软等多方存在反竞争行为,并要求法院阻止这些行为。
2024年12月13日(当地时间),OpenAI在一篇题为《埃隆·马斯克想要一个营利性的OpenAI》的博文中,公布了多份马斯克与OpenAI数位创始人之间的邮件和聊天记录,通过一系列详实证据驳斥了马斯克的所有指控。
2024年4月29日(当地时间),奥地利非营利组织欧洲数字权利中心宣布,该组织已向奥地利数据保护机构提出投诉,要求对美国开放人工智能研究中心即OpenAI公司展开调查,认为该公司开发的人工智能聊天工具ChatGPT违反了欧盟的相关法规。
2024年11月29日(当地时间),加拿大五大新闻媒体公司对OpenAI提起诉讼,指控该公司经常违反版权和在线使用条款,例如使用其新闻来训练 ChatGPT。加拿大新闻社、加拿大广播公司、Torstar(《多伦多星报》所有者)、Postmedia(《国家邮报》所有者)、环球邮报发布声明称,OpenAI 在大量抓取其版权内容来训练 AI 模型,既未征得许可也未提供补偿。在提交给安大略省高等法院的 84 页索赔声明中,五家加拿大公司要求 OpenAI 赔偿损失,并永久禁止该公司未经同意使用其材料。
被调查
2023年7月13日(当地时间),美国联邦贸易委员会正在调查OpenAI是否违反消费者保护法,并要求OpenAI提供有关其处理个人数据、向用户提供不准确信息的可能性以及“对消费者造成损害(包括声誉损害)的风险”的大量记录。
2024年6月6日消息,美国联邦监管机构已达成一项协议,将对OpenAI在人工智能行业的主导地位展开反垄断调查。知情人士透露,联邦贸易委员会将对微软公司与OpenAI的合作关系展开调查。
提起投诉
2024年12月14日消息,Meta正要求美加州总检察长Rob Bonta阻止OpenAI转型为营利性企业的计划,称允许这种转变将“对硅谷产生重大影响。
提起诉讼
2023年8月8日,OpenAI对一家使用“开放人工智能”(Open Artificial Intelligence)名称的公司提起诉讼,声称该名称侵犯了OpenAI商标,并造成消费者混淆。
2024年11月29日,加拿大多家主流媒体以侵犯版权为由,对开发ChatGPT的美国开放人工智能研究中心OpenAI联合提起诉讼。
回应质疑
2023年4月5日(当地时间),ChatGPT研发公司OpenAI在其官方博客发布文章《我们保障AI安全的方法》,回应外界对其AI模型安全性的质疑。文章介绍了ChatGPT六个方面的安全部署,包括构建日益安全的AI系统、在实际使用中学习改进安全措施、保护儿童、尊重隐私、提高事实准确性,以及持续研究和参与。
2023年12月8日消息,英国反垄断监管机构表示,将审查微软与OpenAI的合作是否导致了“获取控制权”的情况,即一方对另一方具有重大影响力或控制权,如果存在可能导致阻碍行业竞争的问题,那么该机构后续将采取更多针对性行动。
2023年12月8日(当地时间),英国竞争和市场管理局(CMA)表示,其正在收集来自利益相关者的信息,以确定微软与OpenAI两家公司的合作是否威胁到谷歌人工智能研究实验室Deepmind总部所在地英国的市场竞争。随后,微软发言人在一份声明中表示:“虽然我们协议的细节仍然保密,但必须指出的是,微软并不拥有OpenAI任何股份,只是有资格分享利润分配。”OpenAI发言人则表示,“微软的无投票权董事会观察员席位并未向他们提供管理职权或对OpenAI运营的控制权。”
应用问题
2023年4月23日(当地时间),根据中断跟踪网站Downdetector的数据,超千名用户报告OpenAI出现使用问题。
暂停账户
2023年12月16日,因字节跳动一直在秘密使用OpenAI的技术开发自家大语言模型而违反了OpenAI的服务条款,字节跳动的账户已被OpenAI暂停。字节跳动通过微软购买了OpenAI的访问权限,但是微软也制定了与OpenAI同样的政策。OpenAI发言人尼克·菲利克斯(Niko Felix)发表声明,确认字节跳动的账户已被暂停。
字节跳动发言人约迪·赛斯(Jodi Seth)对此回应称,GPT生成的数据在“种子计划”的早期开发中用于注解模型,并且在2023年年中左右的时候已从字节跳动的训练数据中删除。“字节跳动获得了微软的许可能够使用GPT API。我们使用GPT驱动非中国市场的产品和功能,但使用自主开发的模型驱动豆包。豆包只在中国提供。字节跳动相关负责人回应称,正在与OpenAI联系沟通,以澄清外部报道可能引发的误解。
监管升级
在美国国会没有采取任何有意义的行动的情况下,欧盟的法律将为西方世界随后的监管定下基调。2023年12月8日(当地时间),欧盟政策制定者就《人工智能法案》达成协议。该法案是全球首次尝试以全面的、基于伦理的方式监管这项快速发展的技术。
法案将AI系统的风险分为四类:不可接受风险、高风险、有限风险以及最低或无风险。文件称,被视为构成“系统性风险”的模型将受到额外规则的约束。欧盟将根据用于训练模型的算力来确定其风险等级。
新法案将影响OpenAI。最大的通用人工智能系统,包括为聊天机器人ChatGPT提供支持的GPT将面临新的透明度要求。除因国家安全豁免外,警方和政府使用面部识别软件将受到限制。违反规定的公司可能面临高达全球销售额7%的罚款,可达3500万欧元(3770万美元)。专家称,唯一已达到构成“系统性风险”阈值的模型是OpenAI的GPT-4。欧盟执行机构可以根据数据集大小、是否在欧盟拥有至少10000名注册商业用户或注册最终用户数量以及其他指标来指定哪些模型构成“系统性风险”。
随着通用型人工智能向用户端和行业加速渗透,相关隐私保护担忧和安全监管等议题逐步升温。全球监管持续行动。由于ChatGPT本身在使用训练数据的来源以及隐私泄露等问题一直备受争议,不少大型企业都出台相关政策要求员工不要使用ChatGPT。
2023年3月,意大利数据保护局宣布禁止ChatGPT,加拿大已经调查OpenAI,称该公司涉嫌“未经同意收集、使用和披露个人信息”。
2023年5月22日消息,苹果已经连续数月禁止员工使用ChatGPT和Copilot,此前亚马逊、摩根大通等也限制员工使用ChatGPT,中国支付清算协会倡议支付行业人员谨慎使用ChatGPT等工具。
2022年,中国国家互联网信息办公室等三部门发布《互联网信息服务深度合成管理规定》;2023年4月,国家互联网信息办公室起草了《生成式人工智能服务管理办法(征求意见稿)》,对人工智能生成内容、主体责任、训练数据和数据处理等方面作出进一步规定,保障生成式人工智能技术的合规性和安全性。
商标注册
2024年2月,美国专利商标局拒绝OpenAI将GPT一词注册为商标,他们认为GPT的意思是生成式预训练转换器——一个过于笼统的术语,可能会阻止竞争对手将其产品描述为GPT。
重组风波
从2015年创建起,OpenAI内部就充满了矛盾。该公司由特斯拉首席执行官埃隆·马斯克、萨姆·奥尔特曼和其他九人共同创立,其目标是建立人工智能系统以造福全人类。与大多数科技初创企业不同,OpenAI是作为非营利机构成立的,董事会负责确保OpenAI履行这一使命。
董事会里持有相互对立人工智能理念的人,一边是担心人工智能危险的人,比如埃隆·马斯克,另一边是奥尔特曼和那些更关注这项技术潜在好处的人。2018年埃隆·马斯克离开OpenAI,2019年,奥尔特曼成为OpenAI的首席执行官,改变了OpenAI的发展方向,他创建了一家营利性子公司,并从微软筹资10亿美元。从而引发质疑,即这将如何与董事会的安全人工智能使命相吻合?董事会成员中的三名独立董事都担心人工智能会变得比人类更聪明。
2023年11月,几位知情人士透露,在OpenAI首席执行官萨姆·奥尔特曼被解雇、总裁Greg Brockman突然辞职之际,OpenAI的三名高级研究人员在11月17日(当地时间)辞职。请辞的三人分别是公司研究总监akub Pachocki、负责评估人工智能潜在风险的团队负责人Aleksander Madry,以及在这家初创公司做了7年研究员的Szymon Sidor。11月17日,OpenAI在官网发布新闻稿称,公司董事会宣布,CEO萨姆·奥尔特曼将辞去CEO并离开公司,首席技术官米拉·穆拉蒂将担任临时首席执行官,立即生效。在奥尔特曼该推文后没多久,格雷格·布罗克曼转发也宣布将离开公司。
关于最初解雇奥尔特曼的原因存在不同的解释。萨姆·奥尔特曼被赶下台的核心是创始人之间的旧式纠纷。据称,OpenAI首席科学家兼联合创始人伊尔亚·苏茨克维(Ilya Sutskever)是此次罢免的幕后推手——基于对商业化与研究速度的担忧,以及是否对安全性给予足够重视。11月17日,OpenAI董事会表示,解雇的理由是因为他没有对公司董事会坦诚相待。与奥尔特曼关系密切的人士则表示,解雇更多与公司人工智能的安全性争议以及与共同创始人和董事会成员伊利亚·苏茨克韦尔之间的权力斗争有关。
2023年11月19日,在被OpenAI解职两天后,奥尔特曼又回到了公司办公室,试图谈判回归事宜。他戴着访客胸牌进入中心,并在X平台上发帖:“这是我第一次也是最后一次戴这个。”整个周末,投资者和许多员工都在试图恢复奥尔特曼的职位。奥尔特曼的阵营成功将解雇他的董事会带回到谈判桌旁,微软的高管也极力推动在新公司架构中加强监督,包括可能设立一个董事会观察员席位,以便更深入了解公司的经营情况。OpenAI公司有超过700名员工签署联名信,要求恢复萨姆·奥尔特曼和格雷格·布罗克曼的职位,不然他们将加入微软的人工智能研究部门。在谈判失败后,纳德拉在X平台上写道,奥尔特曼“将加入微软,领导一个新的高级人工智能研究团队”,与OpenAI的联合创始人格雷格·布罗克曼以及其他同事一同工作。
2023年11月19日,OpenAI董事会成员伊利亚·苏茨克韦尔在向员工发表的一份声明中表示,尽管公司高管努力争取奥尔特曼复职,结果还是事与愿违。苏茨克韦尔也宣布,亚马逊旗下流媒体平台“特威奇”(Twitch)联合创始人、前首席执行官埃米特·希尔,将成为OpenAI新的临时首席执行官。
11月20日,OpenAI临时首席执行官米拉·穆拉蒂计划重新聘请萨姆·奥尔特曼和格雷格·布罗克曼;11月20日,OpenAI董事会据称将聘请埃米特·谢尔担任CEO,取代创始人萨姆·奥尔特曼。
2023年11月22日,OpenAI宣布,已经原则上达成协议,奥尔特曼重返公司担任CEO,“并组建由董事会主席Bret Taylor、Larry Summers和Adam D'Angelo组成的新董事会。”1月30日,OpenAI宣布,萨姆·奥尔特曼已经回归担任首席执行官,OpenAI成立新董事会。同日,OpenAI原董事会成员海伦·托纳(Helen Toner)在社交平台X发文称,她正式辞去了OpenAI董事会的职务。
创始人与董事会之间的决裂,是硅谷的老生常谈,但在这个案例中,创始人(硅谷人工智能革命的代表)与董事会(其任务是将社会利益置于利润之上)都非常特殊。这种决裂威胁着公司的未来以及投资者投入其中的数十亿美元。OpenAI的乱局一直是微软的负累,因为除了是OpenAI最大支持者外,微软还围绕OpenAI的人工智能软件重新调整了自己的业务,受奥尔特曼被解雇消息影响,微软的股价下跌。
OpenAI的混乱也引发人们对人工智能革命背后的人和公司的新质疑:如果它能如此轻易地因为背后诽谤他人的行为和不可靠的错误想法而陷入危机,那么人们还能信任它来推进一项可能对数十亿人产生不可估量影响的技术吗。
OpenAI这场高层“内斗”大戏,牵扯到商业利益和观念博弈两个方面的矛盾,后者体现为,“加速派”和“末日论派”在人类与AI的关系上的分歧。首席执行官奥尔特曼在加速部署OpenAI产品的商业化,扩大消费者市场。首席科学家伊尔亚·苏茨克维则在内部组建“超级对齐团队”,以达到“让模型在最糟糕的情况下也能遵循人类的意图”等目的。2023年11月初,苏茨克维在一个纪录短片中称:“我的感觉是,通用人类智能(AGI)的发展会出现雪崩。”二人的观念取向,折射出硅谷乃至全世界人工智能行业对安全与进步的分歧观点,即“有效加速主义”和“末日论”。前者的拥趸希望通过最高效、最具影响力的技术进步与突破来加速社会、经济或技术系统的变革过程,并把风险视为变革的催化剂。而后者则更加审慎,认为一旦风险不可控,人工智能带来的巨大影响将毁灭人类社会。
2024年3月8日(当地时间),OpenAI在官网发布的新闻稿中表示,律师事务所WilmerHale对奥尔特曼2023年11月被解雇事件的调查已经结束,公司制定了新的治理规则,并加强了利益冲突政策。董事会表示一致支持奥尔特曼的领导。OpenAI在描述该律师事务所的调查结果时称,根据WilmerHale的调查结论,2023年奥尔特曼遭遇的突然解职,并不是源于对OpenAI的财务、产品安全或其他问题的担忧。“相反,这是前任董事会与奥尔特曼先生之间关系破裂和失去信任的结果。”OpenAI董事会主席Bret Taylor在新闻稿中表示,“我们一致认为,奥尔特曼和Greg Brockman先生是OpenAI的正确领导者。”
团队解散
2024年5月15日,OpenAI原核心安全团队“超级对齐”负责人杨·莱克(jan Leike)在社交网络上宣布他本人已辞职,此外,这一团队的其他多名核心成员也纷纷离开,这一团队就此解散。杨·莱克17日在推文中怒斥OpenAI在追求华而不实的产品,质疑OpenAI不再关心安全。
Leike曾与OpenAI联合创始人Ilya Sutskever共同领导OpenAI的超级对齐团队,该团队负责防止超级智能失控,现已解散,剩余成员并入核心研究团队。Sutskever也已辞职。
回应联名信
2024年6月4日,OpenAI和谷歌旗下“深层思维”公司的13名现职员及前员工发表联名公开信,对人工智能行业在缺乏对“吹哨人”法律保护的背景下快速发展表达担忧。联名信签署人中,2人与“深层思维”有关,4名OpenAI现员工要求匿名。组织者包括OpenAI前工程师丹尼尔·齐格勒和前员工丹尼尔·科科塔耶罗。同一天,OpenAI回应联名信时强调,已设立匿名举报热线和安全委员会保护“吹哨人”,相信能以科学方法应对风险。
垄断调查
2024年7月,美国联邦贸易委员会(FTC)发布公告,已介入调查包括微软在内的5家主要科技公司,一方面重点审查其在AI领域的投资、合作过程中是否存在垄断行为,另一方面是帮助FTC洞察当前AI市场的竞争格局以及对创新的潜在影响。
该次调查备受外界关注的一个点是,FTC将深入调查微软和OpenAI公司之间的投资关系,已经相关投资的实际意义和竞争影响。
人事变动
2024年8月6日,OpenAI公司发言人表示,OpenAI总裁、公司核心人物之一Greg Brockman将休长假,以“放松和充电”。另外,研究员John Schulman当日离职,将前往竞争对手人工智能AI初创公司Anthropic。Brockman 在X上表示,其将休假到年底;Schulman也证实了他的离职。9月26日,OpenAI CTO Mira Murati离职。10月1日(当地时间),OpenAI联合创始人Durk Kingma宣布加入人工智能初创企业Anthropic。
模型权限泄露
2024年11月26日(当地时间),一些据称参与了Sora测试的艺术家泄露了该模型的访问权限(API),以抗议OpenAI对他们的压榨行为。
罚款
2024年12月20日,意大利数据保护局(Garante)公告称,在结束对生成式人工智能应用程序使用个人数据的调查后,对ChatGPT制造商OpenAI处以1500万欧元(约合1558万美元)的罚款。
宕机
美东时间2024年12月26日上午11点,OpenAI开始发生大规模宕机。OpenAI的独家云服务商微软同日报告称,旗下一个数据中心出现“电源问题”,主要影响到北美地区用户。北京时间12月27日上午8:20,OpenAI更新说明称,API现已运行,ChatGPT正在恢复。
用户数据疑似被盗
2025年2月8日,IT之家消息称,科技媒体发布博文,报道称有黑客在暗网论坛发帖,声称持有 2000 万 OpenAI 用户账户的登录凭据,并开始公开兜售。OpenAI 公司表示目前已紧急启动调查,初步排查证据表明其系统并未遭受攻击,但用户仍需警惕潜在风险,并采取必要安全措施。一位匿名黑客在暗网论坛发布俄语信息,声称拥有超过 2000 万个 OpenAI 账户的访问代码,并称之为“金矿”,还提供了包含电子邮件地址和密码的样本数据。
马斯克欲控制OpenAI
当地时间2025年2月10日,据美媒报道,一个由马斯克牵头的财团出价974亿美元,寻求控制OpenAI。对此,OpenAI创始人山姆·奥特曼在社交平台X回应道:“不,谢谢,但如果你(马斯克)愿意,我们将以97.4亿美元收购推特。”当地时间2月14日获悉,OpenAI董事会一致拒绝了埃隆·马斯克提出的以974亿美元收购该公司资产的要约。当地时间3月4日,美国一联邦法院否决了马斯克此前请求的初步禁令,该禁令旨在阻止ChatGPT制造商OpenAI转型为营利性公司。
反垄断调查
2025年3月,英国竞争与市场管理局宣布终止对微软 (MSFT-US) 与 OpenAI 合作的反垄断调查,表示微软对 OpenAI 的控制程度不足以进行全面调查。该合作始于 2019 年,当时微软对 OpenAI 进行 10 亿美元的初期投资。
安全策略遭质疑
据外媒 Wccftech当地时间2025年3月6日报道,OpenAI 最近向社区分享了其谨慎、逐步部署 AI 模型的方法,采取分阶段发布的策略,并以 GPT-2 的谨慎发布为例。然而,这一示例引发了前 OpenAI 政策研究员 Miles Brundage 的批评,他指责公司歪曲了 AI 安全的历史。
OpenAI 发布的文件阐明了其对 AI 安全和模型部署的态度。文件中强调,公司在处理现有系统时始终保持谨慎,并提到 GPT-2 是其谨慎发布策略的一部分。公司“相信”只有通过从现有工具中学习,才能确保未来系统的安全。
向美国政府提议
2025年3月13日消息,OpenAI在其发布的15页政策建议中,向特朗普政府提出请求,希望政府能够为自愿向联邦政府提供模型的人工智能企业提供保护,使其免受各州日益增多的监管法规的影响。在这份长达15页的信函中,OpenAI全球事务副主管克里斯·勒汉承认:“尽管美国目前在人工智能领域保持领先,但DeepSeek表明我们的领先优势并不大,而且正在缩小。”与此同时,勒汉声称在关键基础设施和其他高风险应用中使用DeepSeek会“带来重大风险”,因为其可能受到“中国政府的操纵”。他同时声称DeepSeek“侵犯知识产权”,其用户“可能面临隐私和安全风险”。
2025年3月,OpenAI公司已向美国政府提交一份AI发展建议书,呼吁放宽监管,让AI公司自由使用受版权保护的材料,训练AI模型。
遭隐私投诉
2025年3月,OpenAI 旗下的聊天机器人 ChatGPT 因生成虚假信息而面临又一起隐私投诉。此次事件发生在欧洲,由隐私权益倡导组织 Noyb 支持挪威一名个人发起,该个人发现 ChatGPT 生成了虚假信息,声称他因谋杀两名子女并企图杀害第三名子女而被定罪。这一事件引发了对 OpenAI 是否违反欧盟《通用数据保护条例》(GDPR)的质疑。
所获荣誉
竞争对手
DeepSeek(深度求索)是中国AI初创公司。据公开报道显示,2025年1月,DeepSeek创始人是梁文锋,员工规模不及OpenAI的1/5。公司中,算子、推理框架、多模态等研发工程师以及深度学习方面的研究人员共有约70人,主要在北京分部,其余30多人在杭州总部,多为前端、产品以及商务人员。
2025年1月28日消息,DeepSeek在不到30天的时间里,先后发布DeepSeek-V3DeepSeek-R1两款大模型,持续引发热议。据美国彭博社报道,OpenAI首席执行官萨姆·奥尔特曼27日晚在社交媒体平台X上发文,对DeepSeek-R1模型首次亮相表示欢迎。
最新修订时间:2025-04-03 16:12
目录
概述
公司发展
参考资料