小爱语音是
小米旗下人工智能助手,由小爱语音 (原小爱同学 APP)、小爱视觉、小爱翻译、小爱通话等系列智能产品组成。
发展进程
2017年9月6日,小爱同学随着
小米电视4A的发布亮相。
2017年7月,小米AI音箱发布。
2017年11月,小爱同学(语音助手)发布至
MIUI开发版。
2018年3月,
小米MIX 2S发布,小爱同学首次进入到小米手机。
2018年5月,贵阳
中国国际大数据产业博览会上,小爱同学获得了“2018领先
科技成果奖·黑科技”和“2018领先科技成果奖·新产品”两项奖项。
截至2018年7月底,小爱同学月活跃设备已经超过了3000万,每月唤醒超过10亿次,累计唤醒超过50亿次。
2018年10月,
小米MIX 3发布,小爱同学在手机上有了一个专属的按键。
2019年11月,小爱同学3.0正式发布,是支持连续对话的手机语音助手。
2019年12月,
小米10发布,小爱同学发布“定制声音”“定制唤醒词”两大功能。
2020年11月,小爱同学5.0正式发布,升级为
智能生活助手。
2021年,小爱同学AI字幕宣布加入日语、韩语翻译,AI字幕采用小米自研同声传译技术,提供更快、更稳、更准的字幕阅读体验。
2021年8月,小米2021年Q2
财报发布,小爱同学
月活用户突破1亿。
2022年5月,小米小爱同学“小爱朗读”功能即将上线,现已开放内测申请。
2022年9月,小米MIUI 推送小爱同学更新,正式将小爱同学更名为小爱语音。
2022年9月28日,小米开发的小爱同学宣布上线“趣味东北音色”,包含男声“刚子”和女声“大玲”两款,用户可在小爱同学的声音商店选择使用。2022年9月,小米开发的小爱同学官方宣布上线朗读屏幕功能。
2022年11月16日,
高通举行了 2022
骁龙峰会,在此次峰会上,小米表示基于骁龙芯片的 AI 性能,小米预计在 2023年推出离线小爱同学。
2022年11月21日,小米小爱同学官方宣布,全新官方音色星河、木棉正式上线,用户可通过对手机上的小爱说“打开音色设置页”进行设置。
2022年12月27日消息,小米小爱语音现已发布 6.1.2.2715 版本,多项功能迎来更新。
2022年11月28日,小爱同学官方微博预热,取快递、点外卖、订机票等,将于2022年12月1日,
小米13系列发布会,小爱同学全新升级,敬请期待。
2023年3月24日,小爱同学月活用户达1.15亿。
2023年4月6日,小米小爱语音 App(64 位)V6.4.6 发布,方言对话能力新增四川话。
2023年7月10日,小米公司旗下小爱同学官博宣布上线“敲木鱼”功能,称是“更适合打工人体质的放松神器”。用户只需要对小爱同学说“敲木鱼”,即可启用该功能,点击“电子木鱼”图案即可敲击。
2023年8月,小爱同学实时字幕离线版上线,支持在线会议、外语视频多场景,无需联网也能实时生成双语字幕。
2024年5月15日,
火山引擎与小米等宣布成立智能终端大模型联盟,“小爱同学”已接入火山引擎的大模型服务。
2024年6月13日,小爱同学与火山引擎达成合作,双方基于豆包大模型为用户带来更智能的 AI 交互体验。
2024年7月22日,小米澎湃OS官微宣布小爱翻译实时字幕新增日韩语翻译,无字幕视频、直播会议实时转录翻译。面对面同声传译支持12种语言互译,包括中文、英语、日语、韩语、俄语、葡萄牙语、西班牙语、意大利语、法语、德语、印尼语、印地语。
2024年10月29日,小米官宣小爱同学更名为超级小爱,同时 logo 也全面更新,官方称:“我们的小爱同学,从在你我的设备里,变成活在你我的生活里。”
核心功能
1.内置设备:截止2020年12月,小爱同学已覆盖了200余款设备
l 手机端:小爱同学App-小米手机、小爱同学App-
红米手机、小爱同学App-安卓非小米、小爱同学App-
iOS...
l 音箱端:
Redmi小爱触屏音箱Pro、小米小爱触屏音箱Pro8、
Redmi小爱音箱Play、
小米AI音箱、小米小爱音箱Play、小米小爱音箱Art、小米小爱音箱
HD、小米小爱音箱Pro...
l 电视端:
小米电视4及4系列、
小米电视5、
小米电视5Pro、
Redmi远场语音电视、壁画电视、小米全面屏电视、
小米全面屏电视Pro、Redmi电视、小米电视
OLED、小米
8K电视、小米电视盒子...
l IoT:
小米手表、小米手表color、Redmi 手表、
小米手环、小寻
儿童手表、小寻学习手表、米兔儿童学习手表、
小米平板、
米家智能闹钟、小米小爱鼠标、小爱老师、Redmibook、米家
激光投影仪、
Amazfit手表、华米手表、Zepp手表、
威马汽车、一汽
奔腾、70迈智能行车助手、
长虹TV、雷石KTV、唱吧
语音小助手、小米Air 2 Pro耳机、
Redmi AirDots 3耳机、ZMI PurPods Pro耳机、小米小爱随身音箱、
峰米投影仪、机器岛点读笔、米兔故事机、多亲平安Q、多亲手机、小白
智能摄像机、
贝医生儿童牙刷、小丹机器人...
2.可
控制设备:截止2020年12月,小爱同学已支持控制70个品类,2400+设备
智能插座、
空气净化器、
电饭煲、
智能开关、扫地机器人、灯
温湿度传感器、
空气检测仪、空调、电视、窗帘、冰箱、饮水机、机顶盒、
新风机、
加湿器、净水器、
电风扇、
晾衣架、
电暖气、
香薰机、
按摩椅、
油烟机、
除湿机、热水器、洗衣机、摄像头、
电热毯、
洗碗机、
微波炉、
走步机、
投影仪、网络盒子... ...
3.功能:小爱同学拥有超过1400个功能,涵盖影音视听,知识教育,休闲娱乐等多个方面
4、来电语音控制
2022年6月2日,支持语音打开来电语音控制 ,来电时直接说“
接听电话”、“
挂断电话” 就可以接听和挂断电话。
参考资料
主要技术
计算机声学
小米
声学技术致力于智能声学
技术研发,以物理声学、心理听觉、
信号处理、
深度学习为理论基础,开展阵列增强、通话降噪、智能感知、音频声场、
声学测量等技术领域的研究工作,全面支持小米集团各个
业务线的声学算法需求,其中通话降噪、
麦克风阵列、协同唤醒、组合
立体声、全屋播放、
扬声器均衡等已在多款小爱同学产品上线。
计算机语音
小米
语音技术为小米提供
语音识别、语音唤醒、
声纹识别、口语评测,口语语种识别,语音
情绪识别语音合成、歌曲合成、AI编曲与作曲等
语音理解与
生成技术。语音合成技术将
新音色落地小爱同学,并上线第二代
端到端TTS技术,情感更丰富,音质更清晰。
小米语音技术以端到端
语音处理见长,端到端技术消除传统技术模块串联带来的假设偏差和错误传播等理论极限,提升语音理解与生成的性能。这些技术被实施于小爱同学
云端服务和离线应用中,应用在小爱同学涵盖的小米手机,音箱,电视,手表等IoT设备的语音
交互产品中。
NLP
小米NLP(Natural Language Processing)技术致力于为
小米公司提供NLP基础、内容理解、
人机对话、
机器翻译等技术。从
词法分析、
句法分析、文档分析和
语义分析等技术领域,为搜索、推荐、广告、人机对话等业务提供基础
自然语言处理技术支持。
其中,基于主流的Transformer模型框架,小米自研开发小米翻译系统,已支持中、英、日、韩、德、俄、印地,印尼、粤、法、西等主流语种间翻译。同时围绕小米
用户需求,自研了抗噪的语音翻译,多语种端上离线翻译,
同声传译等前沿机器翻译能力。已广泛应用于小米产品中,包括手机中的小爱同学
语音助手、浏览器、扫一扫和传送门等应用,内置小爱同学的多种
智能硬件,小爱老师
学习机,以及
小米网国际客服等国际化业务。
知识图谱
小米
知识图谱技术,旨在构建全方位的
知识网络,通过知识理解,助力合作伙伴产品更智能。依托
海量数据,综合运用
知识抽取、实体归一、知识计算与推理、概念图谱等技术。让使用者用智能的方式建模
真实世界,理解和满足用户需求。
小米知识图谱拥有完整的
构建体系和健全的开放
内容生态,生态领域覆盖了人物、星座、景点、视频、音乐、汽车、房产等通用的
领域知识和商品、游戏、应用app等行业领域知识。广泛
应用服务在智能问答、小爱同学的多个领域场景上,对
用户满意度提升及业务
转化能力提升起到了关键作用。在知识开放上与OpenKG倾力合作,已支撑以中文为核心的开放领域知识图谱OpenBase的建设。
机器学习
小米机器学习技术致力于解决机器学习领域的通用问题,打造机器学习基础设施,提升
算法工程师的生产力。
机器学习框架包括
服务器端和设备端两个方面的工作。服务器端框架主要解决机器学习的训练和推理问题,小米开发了自研的大规模参数服务器,能够支持大规模稀疏模型的训练和推理,大大提升了广告,推荐等业务的模型训练和推理效率。移动端框架方面,开发了自研的深度学习推理框架MACE,成为业界第一个开源的支持
异构计算的深度学习
推理引擎,支撑了小米的内部业务。同时,MACE推出了针对IoT设备的
微控制器引擎,为
AIoT的发展提供了
技术支撑。
发展历史
小爱同学3.0
2019年11月19日,在MIDC2019
小米开发者大会上,小爱同学3.0正式亮相发布。
小爱同学5.0
2020年11月,小爱同学迎来5.0版本:升级全场景智能协同、对话式主动智能、定制化情感声音、
多模态融合交互、智慧学习好助手。
小爱同学5.0有别于传统
移动互联网 APP 或
信息流被动猜测用户的形式,对话式主动智能
产品形态是小爱同学以自己的方式和节奏与
用户互动沟通,像人一样发起问题来增进对用户的了解。主动对话本身就是高级智能的体现,它意味着人工智能不仅仅存在于与用户互动的短暂过程中,而是在更长的时间内不断的进行思考和计算,需要像人一样,拥有 “记忆”。
在记忆的存储方面,小爱同学云端大脑会为用户建立多维度的个人画像,实现全设备个人信息
互联互通。小爱同学的所有功能,会对内共享这些关于用户的 “记忆”,每次交互结合个人画像进行计算,产生出面向用户个人的个性化结果。
小爱同学5.0拥有智能的多模态融合交互,可以通过声音、
肢体语言、
信息载体(文字、图片、音频、视频)、环境等多种方式与
智能设备进行交流。打破了传统 PC 式的
键盘输入和
智能手机的点触式交互,定义了下一代智能产品和人的专属
交互模式。
小爱语音V6.4.6
小爱方言对话能力新增四川话。另外,优化了若干已知问题。小爱的方言识别功能还支持东北话、河南话、陕西话(西安)。
相关事件
2024年3月28日晚间,雷军在小米SU7发布会上,多次喊出“小爱同学”,结果导致全国观众的小米音箱同时应答,最终把小爱同学喊崩了。