智能图文信息处理研究室隶属于
清华大学电子工程系图象图形研究所,从事智能图文信息处理。
智能图文信息处理研究室隶属于清华大学电子工程系图象图形研究所,也是清华信息科学与技术国家实验室的一部分。研究室主体位于信息科学技术大楼(FIT)1区502室,具有良好的工作环境。研究室主任丁晓青教授、王生进教授、刘长松副教授、方驰副研究员、彭良瑞讲师、文迪助研以及二十余名博士生、十多名硕士生构成了朝气蓬勃的学术研究梯队。
研究室承担了多项国家自然科学基金项目及863项目,自上世纪80年代开始,从事智能图文信息处理,特别是文字和图像的识别理解研究,致力于赋予计算机视觉感知功能。在汉字及多文种文字识别、多模式生物特征身份认证方面取得了多项具有国际领先水平的研究成果,形成Th-OCR系列文字识别软件和TH-ID生物特征(人脸、笔迹等)认证软件产品,成功地进行了产业化推广,广泛应用于国内外市场,与微软、诺基亚、西门子、三星、IBM、惠普等多家国际知名公司开展了技术授权和研究合作。目前的研究工作主要包括多文种(汉、日、韩、英、藏、维吾尔、哈萨克、柯尔克孜、阿拉伯、蒙古文等)文档识别,CameraOCR,联机及脱机手写文字识别,表格识别,生物特征认证、视频监测与分析等。
清华大学智能图文信息处理研究室于1984年开始了文字识别研究领域的探索。1989年开创我国第一套“多字体多字号印刷汉字识别系统”,以THOCR品牌推向产品化,获得1991年国家教委科学技术进步一等奖和1992年国家科技进步三等奖。1994年完成我国首套中英文混排印刷文本识别系统“THOCR-94高性能汉字英文混排印刷文本识别系统”,获95年北京市科技进步二等奖,同时被评为94年全国十大电子科技成果。1997年研发成功的“THOCR-97综合集成汉字识别 系统”,集印刷汉字识别、联机手写汉字识别、脱机手汉字识别和表格识别于一体,涵盖全部汉字识别,获99年国家科技进步二等奖和98年国家教委科技进步一等奖。
为了解决大规模的文档自动数字化的急迫需求,1999年“基于识别的原文重现电子出版物制作系统”研制成功。该系统完全自动化地实现了从版面分析、文档识别、版面重构在内的全信息数字化系统,为我国文档大 规模数字化创造条件,获北京市科技进步二等奖。为参与文字识别的国际竞争,2000年研制成功“高性能中日韩东方文字文档识别系统”,以其国际领先的汉字、日文和韩文的识别性能,在微软Microsoft office 2003的中日韩识别项目招标国际竞标中一举夺标,THOCR系统走向了世界。2003年“高性能东方文字(汉日韩)文档全信息数字化系统”获国家科技进步二等奖。
在对汉字和其它文字识别研究取得了国际领先研究成果的基础上,于2000年开始了对安全关键的生物特征身份认证的研究工作,研制成功了整体性能居国际领先水平的TH-ID多模生物特征(人脸笔迹签字虹膜)身份识别认证系统。其中,TH-FaceID人脸识别系统在2004年国际模式识别会议举办的FAT2004人脸认证竞赛中以全部测试指标第一而获得“全面性能最优成就奖”;在2004年的863人脸识别评测中各项指标均获第一。