EasyData是
百度大脑推出的智能数据服务平台,为具有AI开发需求的企业及个人开发者提供一站式数据处理服务。EasyData支持图片、文本、音频、视频等多种类型数据的处理,以及
机器学习数据的存储。针对AI开发过程中的数据采集、数据标注、数据清洗等环节提供了软硬一体的自动化数据采集方案、智能标注、定制化清洗等领先能力。同时EasyData已与
EasyDL零门槛AI开发平台和BML全功能AI开发平台的数据管理模块打通,可以将EasyData处理的数据应用于EasyDL、BML的模型训练。
产品介绍
EasyData是
百度大脑推出的智能数据服务平台,为具有AI开发需求的企业及个人开发者提供一站式数据处理服务。EasyData支持图片、文本、音频、视频等多种类型数据的处理,以及
机器学习数据的存储。针对AI开发过程中的数据采集、数据标注、数据清洗等环节提供了软硬一体的自动化数据采集方案、智能标注、定制化清洗等领先能力。同时EasyData已与
EasyDL零门槛AI开发平台和BML全功能AI开发平台的数据管理模块打通,可以将EasyData处理的数据应用于EasyDL、BML的模型训练。
产品优势
数据采集
EasyData支持“摄像头采集图片数据”和“云服务数据回流采集图片数据”两种采集方式。
1.摄像头采集图片数据
提供本地采集软件,支持客户通过手动截图、视频抽帧(支持设置自定义抽帧规则)等灵活采集方式将图片即时同步到EasyData进行后续管理。
2. 云服务数据回流采集图片数据。AI模型需要持续迭代来优化效果,客户可通过调用EasyDL云服务接口来查看实际业务数据与识别结果,并根据识别结果的准确度来反向高效的挖掘难例,获取对模型效果提升更有助力的高质量数据。
数据清洗
客户在EasyData中可对数据集中的图片进行去模糊、去近似、旋转、镜像等多种通用清洗服务,同时支持对图片进行过滤无人脸图片、过滤无人体图片等高级清洗,以进一步提升数据质量,提升下一步数据标注工作的效率。
1.图片去模糊
过滤清晰度较低的图片,保证数据质量
2.图片去重
过滤大量重复的图片,提高关键图片处理效率
3.图片批量裁剪
批量裁剪图片中的无关元素,提升数据质量
4.图片旋转
校正采集图片的角度,方便进行下一步的处理
5.过滤无人脸图片
从清洗前数据集版本中过滤掉无人脸图片,快速构建模型训练的有效数据
6.过滤无人体图片
从清洗前数据集版本中过滤掉无人体图片,快速构建模型训练的有效数据
数据标注
EasyData提供了丰富的标注模板,并具备智能标注功能,通过为数据自动打标签,最高可降低客户90%的数据标注人力成本。同时支持多人标注功能,客户可发起团队协作任务进行分发、标注、验收等工作,以提高数据标注效率。
1.丰富的标注模板
支持图像分类、物体检测、图像分割、文本分类、短文本相似度、文本实体抽取、情感倾向分析、音频分类、视频分类等丰富易用的标注工具。
2.智能标注
提供人机交互协作智能标注能力,系统可自动识别标注难例,只需人工标注少量难例数据后,系统将自动完成剩余数据的标注工作,最高可降低90%的标注人力成本。
3.多人标注
管理员可通过发送任务链接至标注员邮箱,标注员可灵活选择邮箱登录、平台登录等不同的轻量级协作方式快速完成标注任务,任务完成后支持管理员进行任务验收。
4.百度众测及数据服务商标注支持
EasyData已全面对接百度众测及百度AI市场中的优质数据服务商,可通过EasyData平台向百度众测提交详细的数据标注需求。
发展历程
2020年5月,EasyData正式上线,支持摄像头采集和云服务回流两种采集方式,支持智能标注和多种数据清洗方式。
2020年7月,新增支持情感倾向分析标注模板,支持是否有无人脸/人体的清洗方式。
2020年9月,新增文本实体抽取标注模板和多人标注功能。
2020年11月,新增文本数据清洗功能。