Autonomy 是基于语义计算 (MBC) 这一快速发展领域公认的领导者。1996 年成立的 Autonomy 是建立在经
剑桥大学研究而产生的独特技术组合之上。公司的迅速发展使得其
市值达到了 22 亿美元,并且在全球各地都设有办事机构。
简介
作为一家为企业提供高端搜索引擎
软件的英国科技公司,创立于1996年的Autonomy在经历了世纪之交的
互联网泡沫后涅槃重生,不仅杀入
硅谷,收购了三家美国公司,并且在
金融危机中成为英国为数不多逆市成长的科技公司之一。Autonomy智能化的搜索引擎软件未来或可挑战谷歌在这一领域的霸主地位。
Autonomy:重要信息尽在掌握
Autonomy 被包括 Gartner Group、Forrester Research 和 Delphi 在内的分析家公认为业界领先的企业,他们称 Autonomy 是有史以来发展速度最快的上市公司。与第二名相比,Autonomy 的收入是其两倍之多。
北京时间2011年10月四日,惠普正式宣布,该公司已经完成了 104 亿美元收购英国软件公司 Autonomy 的交易。
这是一场难以理解的收购,除了
李艾科本人外,包括惠普内部与外部的所有人都认为Autonomy并不值这个价格。此前林奇曾试图将公司以60亿美元卖给甲骨文,但被拒绝。
好莱坞式的离奇剧情再次发生在
惠普身上。如果说,过去几年间惠普的
董事会政变、
窃听门和桃色丑闻等事件只是公司政治内斗,那么这一次,惠普不得不付出高达88亿美元的巨大商业代价。
初听上去,这是个不可思议、令人错愕的故事。
惠普去年夏天宣布以111亿美元收购英国软件公司Autonomy,试图在企业应用软件市场追赶
IBM等竞争对手。这项由前惠普CEO
李艾科推动的收购,当时被
硅谷批评代价太过昂贵,也遭到公司
CFO的强烈反对,但最终仍然被董事会通过。
当时的董事会——和当前基本一致——都信赖了审计机构
德勤对Autonomy的财务审核报告。作为
尽职调查的一部分,惠普当时还聘请了
毕马威(KPMG)对德勤的报告进行了审计,巴克莱银行等
投行中介机构也参与了这项收购交易。
无论是德勤还是毕马威,都没有能够发现任何问题。直到2012年4月Autonomy创始人
迈克·林奇(Mike Lynch) 被辞退后,一位Autonomy领导团队的资深成员主动“爆料”,惠普通过调查才发现,Autonomy公司存在一系列可疑的会计和商业行为,导致惠普收购这家公司时的估值存在严重偏差。
由此带来的后果残酷。惠普昨日晚间宣布,在2012财年第四财季财报中记录一笔非现金
商誉减值费用,该笔与Autonomy公司相关的费用价值88亿美元。而其中大部分的——超过50亿美元,与严重的会计不当行为、虚假陈述和情况披露失误有关。
这也意味着,仅仅一年时间,惠普收购Autonomy的100多亿美元已经损失八成。
尽管惠普尚未将Autonomy的行为直接定义为商业诈骗,但其具体指控已明白无误的指出了这些行为的性质。这些针对Autonomy的指控包括:
——把亏损出售的低利润硬件伪造为高利润软件销售额;
——把以上产品销售造成的损失再伪造为市场推广费用;
——隐瞒通过分销商
渠道销售的
软件使用许可,这些分销商把Autonomy软件和硬件或服务打包出售。这些营收全部伪造成软件销售额;
——未正确记录软件服务营收。根据会计准则,软件服务,特别是以月费形式收取的,只有在用户支付后才能入账。惠普称Autonomy在记账时把这部分收入当作软件使用许可费提前计入营收。
最新的进展是,惠普已经将其调查结果报告美国证监会(SEC)和英国欺诈重案办公室,公司CEO惠特曼表示,公司将考虑针对几个当事人采取法律行动。
计算技术
基本简介
这些年来,
非结构化信息的使用范围发生了大幅度的增长,这些信息的形式包括文档、电子邮件、
电话录音以及多媒体内容。企业中如今有超过 85% 的信息都是非结构化信息,这些“人性化”的信息对于计算机而言非常难于理解和使用。而基于语义的计算能够解决这一问题。
基于语义计算技术使计算机能够理解各段信息之间的联系,进而执行复杂的分析操作,而这一切都是自动且实时进行的。
技术特点
基于语义计算技术与包括关键词搜索在内的传统方法有何不同?
基于语义计算技术的能力远远超出了诸如关键词搜索这些只能进行数据查找与检索的传统方法。举例而言,关键词搜索引擎不能理解信息的含义,因此这些产品只能用于找出带某个字词的文档。然而由于无法理解含义,所以那些使用了不同字词但主题却相同(即有相关性)的文档将被忽略。而那些主题与用户期望搜索的内容完全不同的文档却经常被返回,从而使得用户必须修改查询方式来适应这种搜索引擎。
除此之外,基于语义的计算还能提供关键词搜索引擎无法提供的许多功能,例如自动形成超链接以及
聚类。举例而言,自动形成超链接可以向用户提供众多在语境上与原有的文档相互联系的文档、服务和产品,这就要求计算机能够完全理解原有文档的含义。与此类似,要使计算机能够自动收集、分析并
组织信息,就必须赋予其提取语义的能力。只有拥有基于语义计算技术的系统才能做到这一点。
应用方面
基于语义计算技术为现代企业带来了一系列新的战略性应用。其中包括:高级
企业搜索:
基于语义计算技术不仅能找出其他技术(包括关键词搜索以及关系数据库)无法发现,占企业信息总量 85% 的内容,同时还能理解它们的含义。因此,用户能够查看之前甚至认为并不存在的相关信息,从而以实时的方式对其进行操作。
知识管理: 基于语义计算技术使企业能够自动地通过语境理解客户与员工感兴趣的方面,他们的行为,以及与各种类型的信息之间进行的交流。这样,企业就能够通过利用其员工所拥有的重要知识、经验以及专业技能来形成协作。
电子搜索:
基于语义计算技术还使得企业能够从上万亿字节的
电子邮件、文档、
电子表格以及其他
非结构化信息中提取出有意义的内容。借助该功能,调查人员就能在了解
企业环境之余发现可能存在的不法行为及其发展情况。
用户分布
超过 16000 家政府机构以及
蓝筹公司使用了 Autonomy 产品中强大的模式匹配算法,并通过它们提取出了
非结构化信息中的含义。例如,在隶属于
美国国土安全部的机构中,有 21 家使用了基于语义计算技术来监视涉嫌恐怖活动的团体,从而提供了一个全面的恐怖分子监视名单,并且实现了在出现可能的恐怖活动时以实时的方式通知
有关部门。
福特汽车公司则将基于语义计算技术用于转换其研究知识库中的文本、音频以及视频文件,以便获取有意义的参考资料供其超过 15 万名的员工查看。借助这些资料,员工们就能够更快地了解企业上马的新项目。而对于在超过 60 个国家拥有办事处的 Zurich Financial Services 而言,基于语义计算技术带来的优势在于找出来自 500 多个来源的信息中重要的内容,并将其提供至风险管理经理以便找出可能的威胁与机遇。
其他使用了基于语义计算技术并从中受益的企业包括:BAE Systems、
波音、福特、
戴姆勒-克莱斯勒、壳牌、AOL、BBC、
路透社、Hutchison 3G、
爱立信、
T-Mobile、飞利浦、
可口可乐、卡夫食品、雀巢、Lloyds TSB、
葛兰素史克、KPMG、
花旗集团、
荷兰银行、德意志银行、
野村证券以及
美国证券交易委员会。
概念车
产生之初
2002年1月初在
底特律举行的
北美国际车展上,有一款奇特的跑车引起全世界汽车界的高度注意,它就是万众瞩目的Autonomy。
通用汽车公司首席执行官瓦格勒形容它是“有关汽车设计、制造和使用一场革命的开头。”Autonomy的中文意思是“自治”,也有人翻译成“自主魔力”。“魔力”实际上是单词后半部分“nomy”的谐音,不需要单独翻译。况且就“nomy”的发音,同音字也有许多,为什么独选“魔力”?足见Autonomy很不一般。
车身设计
Autonomy是以氢为原料的
燃料电池车,有超前的流线形车身,滑板一样的平坦底盘,加上4个轮子,车身加底盘,这就是Autonomy的构成,也正是这种构成,形成了与现有汽车的最大不同之处。
Autonomy的所有车内系统都集中在底盘中,底盘上有操纵系统的标准接口,还有车身机械锁定装置与系统外联装置,这是一种通用的固定模式。但车身(车厢)部分形状可以
随心所欲,可以选择象展会的Autonomy模样的车身,也可以选择其它模样的车身,将车身放在底盘上,通过机械锁定装置与系统外联装置,即刻合成了一辆汽车。这样,将来客户只要拥有一个底盘,就可以根据自己的爱好和需求租用各种类型的车身,随意地变换使用。这也许就是Autonomy的魔力所在。记得两年前
北京国际车展时,
德尔福系统公司介绍了座舱、接口盘制动、车门、前端等模块,模块总成技术一改过去汽车装配的方法,将可以组合在一起的汽车零件组装在一块,形成一个模块总成,然后运到总装厂装配上车,象砌积木那样将汽车做出来。同样,消费者可以象砌积木那样更换某一个模块。今天的Autonomy则依据这种思维,做得更加彻底,索性将底盘做成一个模式,就象
电脑主板一样,插口统一,喜欢装什么配件就装什么配件,喜欢装什么车身就装什么车身。
另外一个引人注目的地方,Autonomy采用了一种称为线传操控技术“
X-by-Wire,使用这种技术使得汽车的操纵系统、
制动系统及其它
辅助系统能够通过电子方式而不是传统的机械方式进行控制。也就是说,象方向机柱、踏板连杆、
变速杆连杆等刚性传动件将会消失,用导线、继电器、电磁阀等元件组成的传动系统代替刚性传动件。在这样的变化下,驾驶者既可坐在左侧或右侧,也可坐在中间,甚至坐在任意位置操纵汽车。由于采用线传操控技术,Autonomy的所有操纵系统都可以集中在底盘,底盘与车身之间只是接口连接,将车厢内驾车者的操纵信息传送至底盘内的操纵系统。据了解,这种线传操控技术不是一种不成熟的新技术,它已经做为一种技术商品应用到一些新型汽车上了,例如新型宝马7系列采用线传操控系统,用于变速箱和油门,使其操控更为精确。而Autonomy上的线传操控技术则是由
瑞典SKF公司生产的。
技术参数
车长:4465毫米
车宽:1880毫米
车高:1247毫米
轴距:3099毫米
Autonomy是非凡的
概念车,它的结构开拓了人们的视野,令设计者的思想冲破了传统汽车概念的约束,完全从一个新的起点开始。从
燃料电池、网络汽车到Autonomy,未来的汽车形式陆续展现在我们的面前。
底盘结构
标注1(系统外联装置)
标注2(车身机械锁定装置,共4个)
标注3(插口)
搜索技术
现有搜索技术很难满足类似这样的搜索需求,如“最便宜的笔记本电脑是什么”、“中国队能否赢得世界杯”、“本月最热门的IT新闻事件有哪些”等等。
上述搜索需求暴露了现有搜索技术的软肋:建立在关键词
全文检索理论基础上的搜索技术,在许多方面并不能满足人们的一些“模糊需求”,而这些“模糊需求”的数量则远远大于“精确需求”。
Autonomy正是为给这个软肋补钙而生。Autonomy既是一种搜索新理论的代名词,又是一个公司的名称,同时还是一个产品的名字。
终结者。
可以负责任地说,2013年元旦之后的一个传言将与2012年年中的一条消息一样,将引起
Google、
雅虎、
微软等搜索巨头们的严重警惕。
Autonomy的“样板工程”Blinkx
2004年7月,一个位于
美国旧金山的创业公司推出了一种新型搜索工具Blinkx,该工具可以提供类似“模糊搜索”或“
语义搜索”的功能。也就是说,系统经过“学习”积累了一定“
经验”后,可以满足用户类似“最便宜的笔记本电脑
是什么”这样的搜索需求。
有媒体把这种搜索方式称为“占卜式”搜索,也有人将其称为“智能搜索”,提供
Blinkx搜索工具的公司也叫Blinkx。
Blinkx不仅可以搜索文本内容,还可以搜索电影电视等多媒体内容,不仅可以搜索互联网内容,还可以搜索本机和局域网上的内容。Blinkx同时还可以搜索不同的文本格式内容,如Text、Word、Excel、PPT、PDF以及各种数据库中的数据格式。
Blinkx 公司同时发布了提供这种新型搜索功能的两个服务工具,一个是门户网站,一个是在该网站上可以下载的客户端软件,该软件大小约7MB。尽管这两个工具当前仅支持
英德两种语言,而且都只是测试版,但它提供的震撼性功能已经开始让传统搜索巨头们为之瞩目。
与传统搜索网站不同的是,在Blinkx的搜索框中键入用户指令,比如“CDMA”,出现的结果可能被系统自动分为10类,可能其中9类与用户的查询期望距离较大,用户就可以将接近的那个结果作为查询条件,进行第二次查询,完成“
进阶式”查询,通过这种方式逐步接近目标,最后达到用户期望查询的结果。
如果安装了
Blinkx的客户端软件,一个小的菜单窗口就会出现在Windows Word、Outlook等几乎所有文档处理窗口的右上方。用户在这些窗口中处理文档时,系统会自动分析这个文档,然后自动从本机或网络上抓取相关文章或链接,以供用户参考。不仅如此,它还可以及时提供与文章内容相关的新闻、
产品信息、视频内容等
分类信息。简单地说,用户完全可以拿一篇文章来作为“查询关键词”,Blinkx通过对这篇文章进行分析,会给出与这篇文章内容最接近的
网络链接或本机文档。这无疑给需要处理大量数据的个人和企业提供了巨大便利。
美中不足的是,
Blinkx当前在中国境内没有设立服务器,所以浏览网页的速度会受到较大影响。如今,Blinkx还处于测试阶段,它从网上抓取的数据还不够多,其数据库中装载的信息还不够完善,更新频度也不够快,所以,用户可能找到结果(文档)常常比较陈旧。
2005 年元旦刚过,又有消息传来:Blinkx将进入
中国市场,其中文测试版已经“竣工”。据英国Autonomy公司在国内的代理商卓越动力软件(北京)有限公司称,当前已经在国内某数据中心建立了一个试验平台,大约有30多台服务器正在运行着Blinkx的
后台系统。
Autonomy公司是 Blinkx公司的股东之一,后者的核心技术也来自前者,因为这种密切关系,
Blinkx被认为是Autonomy的“样板工程”。此前, Autonomy一直像
汽车发动机一样隐藏在幕后。Blinkx发布之前,Autonomy在公众中并没有太大名气;Blinkx发布之后, Autonomy仅有的名气也很快被Blinkx所超越。
Autonomy虽然在公众中的知名度不太大,但在商业应用领域中却名声煊赫,并在政府、国防、新闻、金融、电信、教育等领域拥有大量中坚客户。而且,Autonomy还是一个“历史悠久”的IT公司,同时在美国和英国上市,拥有超过1.47亿美元的现金。
正如Autonomy产品所体现出的人文设计思想一样,Autonomy公司也诞生在人文气息十分浓厚的
英国剑桥大学。
Autonomy的创始人是
剑桥大学的迈克·林克(Mike Lynch)教授。1991年,林克教授创立了Autonomy的前身Nurodynamic公司,后者是林克从一个乐队老板融资3000多美元创建的,该公司主要致力于剑桥大学模式识别研究成果的产业化工作。
到1996 年时,林克教授已经积累了足够多的客户资源。于是,他向
风险投资商借贷了1500万美元,创立了Autonomy。同年,Autonomy推出了世界上第一套智能个性化信息系统,同时发布了它的拳头产品DRE(Dynamic Reasoning Engine,动态推理引擎)和Portal产品系列。
Autonomy产品的核心算法是两种数学理论的独特结合:
贝叶斯概率理论和
香农信息论。
18 世纪,英国牧师
托马斯·贝叶斯曾经试图利用概率论证明上帝的存在,但他未能如愿,不过,他所创立的
贝叶斯定律却奠定了现代概率论的基础。两个多世纪以后,这个定律成了Autonomy发家致富的敲门砖。不少数学家认为,贝叶斯定律描述的逻辑是一种跟人类思维模式最接近的数学逻辑,它通过一个概念出现频率的多少和与其他概念之间的关系来决定其成分的重要性。
香农信息论则提供一种方法来提取一篇文章诸多概念之中最有意义的部分。香农信息论最基本的理论是:一个词重复频率越高,其内容越不具有概括性,反之,一个词重复频率越低,其内容越丰富。
Autonomy 中含有一个动态推理引擎(Dynamic Reasoning Engine,DRE),它是一个扩展性很强的、
多线程的核心引擎。信息的概念分析、内容提取、概念模式识别、
相关度计算等关键工作都由动态推理引擎来完成。它是一个跨平台的引擎,可以在多种硬件和
操作系统环境下优化运行,支持从Intel PC使用的Windows NT到多处理器小型机运行的
UNIX等系统环境。它可以与各种不同信息源相连,如互联网、数据库、内部网和本机数据库、文件系统等。当用户发出搜索指令后,它可以通过概念分析、模式识别、相关度计算等方法,从不同的数据源中找到与用户要求最匹配的信息。
从“搜索(search)”到“发现(discover)”
Autonomy在保留了传统搜索方法的基础上,还发展了新的方法。
如今,人类研究的信息搜索技术有四个方向:关键字搜索,模式识别,语义分析,神经网络。除了关键词搜索比较成熟外,其他三项技术还处于待开发状态。模式识别的代表者就是 Autonomy,语义分析和神经网络两个技术方向当前尚无压倒性的代表者,这两个技术方向的研究难度相对较大,估计一时半会不会有突破性研究成果。所以,模式识别就成了当前比较先进的信息搜索技术。
传统搜索基本上采用“关键词”搜索方式,也就是“非0即1”的方式,它基于严格定义和分类的
布尔表达式,即“与、或、非”表达式。这样搜索的最大弊病就是:如果关键词不确定,或者有错误疏漏,用户往往得不到自己想要的搜索结果。
但在实际应用中,用户常常很难用具体而明确的关键词来描述自己想找的东西,比如上述的“最便宜的笔记本电脑”等等。甚至在有些时候,搜索出来的结果大部分与这个关键词并没有太大关系,只是结果文章中出现过这个词而已。例如,一个用户希望了解污染对
企鹅造成的影响,使用关键词搜索法,键入“企鹅”,搜索结果可能带来一些有用的信息,但同时也有大量不相关的文章,如“企鹅出版公司”、“企鹅牌巧克力”、“企鹅冰箱”等。
采用“模式识别”搜索方法,可通过判别相关识别度的高低来对数据进行检索。即它会对用户键入的检索内容进行语意上的分析,然后对海量信息进行概念匹配,找出在内容上最接近的数据提供给用户,所以可以避免传统“关键词检索”造成的漏检情况的发生。比如一篇文章里如果有“大海”这个词,这篇文章有可能和企鹅有关,但是“大海”这个词用在很多不同的地方,有可能文章讲的是别的内容。但是如果一篇文章里有“大海”、“
南极”、“黑色”、“白色”、“不会飞”、“羽毛”、“下蛋”、“石油”、“泄露”等这些词,这篇文章是在谈论污染和企鹅的概率就会很高。虽然整篇文章里没有“企鹅”这个词,但是很多
相关度较低的词出现在一起就会带来很高的相关度,并且缺少某个描述词对其产生的结果影响微乎其微。
如果说传统的“关键字”搜索方法为“search”(搜索)的话,autonomy采用的“模式识别”方法则应该称为“discover”(发现),因为它可以让用户找到一些事前他们不知道的信息。Autonomy产品中提供的“
聚类”功能正是“从搜索到发现”的最佳表现。
如果一个用户需要知道“本月最热门的IT新闻事件有哪些”,使用Autonomy的“聚类”功能就可以得到近乎完美的答案。第一步,用户先设定一些需要搜索的目标网站,根据“本月最热门的IT新闻事件有哪些”这个需求,这些目标网站自然是一些IT新闻网站;第二步,通过 Autonomy的DRE对这些网站上这个月内报道的IT新闻进行检索;第三步,对这些新闻进行分类,报道数量最多最频繁的前几件事情就是“本月最热门的 IT新闻事件有哪些”的候选者。这是没有计算机帮助时的人工作法,当前,这些步骤都由安装了Autonomy软件的计算机来完成,用户只需要“发动”一下这个系统:给“本月最热门的IT新闻事件有哪些”这个搜索需求设定一些关键参数。
当然,设置关键参数对非专业人士而言并不是一件容易的事情,一开始可能有些麻烦,不过,随着这个不断“学习”的系统的
后台数据库数据量的增加,用户需要设置的参数可能会越来越少,甚至做到直接用“本月最热门的IT新闻事件有哪些”就可以一步到位搜索到用户所需要的。当然,用户这个系统不可能像google的检索数据库一样包罗万象,只能在某些个别领域(如IT新闻、环境污染等)成为一个“专家”,这个“专家”在面对来自其他领域或行业的问题时,一开始一样是个傻瓜。
“只要存在非结构化数据,就对autonomy有需求。”Autonomy公司的代理商卓越动力认为,对于那些非结构化的数据,Autonomy提供的功能是十分有效的。而随着互联网的大规模普及,非结构化数据将越来越多,远远超过了结构化数据的数量。对于企业而言,如何处理数量如此庞大的非结构化数据,比个人的需求更加迫切。
企业对文档的处理可分为三个发展阶段。最初是文件系统,通常是树型目录结构的文件管理器。当文件大量出现后,树型目录已经无法管理一些逻辑性和结构性很强同时又关系复杂的数据,于是出现了
关系型数据库,通过
数据库管理工具对数据进行安全管理、备份管理、分类管理等,也就是把非
结构化文档结构化,变成计算机能够读懂的数据和关系。这是第二个阶段。
第三个阶段是在互联网出现后,随着大批
非结构化数据的出现,单纯将非结构化数据转化成结构化数据的工作需要耗费大量的人力和物力,同时还往往需要把结构化的数据又重新以非结构化方式输出,这样转换来转换去,导致了大量
资源浪费和成本支出。所以,如何不转换就能直接处理非结构化数据,成了迫在眉睫的问题,Autonomy的功能正好应运而生。
Autonomy通过保持数据原型,通过架设自己的平台来对数据进行管理。从而完成从信息与信息的互动,到人与信息的互动,最终达到人与人的互动。此外,Autonomy还可以建立文字与视音频片段的对应,从而完成新闻媒体里的新闻和谈话节目的
数据管理工作。
当前,Autonomy在国外比较成功的应用案例集中在媒体、政府机构、金融和信息产业等需要集中处理大量
非结构化数据的领域。
2003 年3月,Autonomy进入中国市场,当前主要集中在电信和
政府市场。在企业内部,Autonomy是追求建立符合企业内部数据管理需求的平台,可将放在不同位置的不同类型的数据进行有效梳理。“搜索”不是autonomy的最终目的,抽取最需要的信息进行“
信息集成”,搭建
知识管理平台才是 Autonomy的应用方向。
Autonomy代理商卓越动力认为,政府机构和一些需要对信息进行监控的机构是该系统在中国的
潜在市场。
Autonomy曾经在美国本土安全局、
美国国防部、
美国航天局、英国警察署和美国陆军有过成功应用。因为对于网络上出现的大量的
有害信息,Autonomy可以做到事前发现,从而帮助政府机构采取及时地反应。
随着互联网的多元化,大量网上违法信息都不以关键词形式出现。例如,政府
有关部门要打击网上非法买卖
违禁药物,使用“
摇头丸”、“兴奋剂”等关键词搜索出来的内容多数是关于药物危害、打击犯罪等方面的正面文章,而出现“兴奋”、“购买”、“单价”等关键词的文章,则与非法买卖违禁药物的
相关度最高。通过这种非关键词搜索的“模式识别”搜索,政府监控部门可以有效打击日益猖獗的网上犯罪。
资料
Autonomy的工作原理
Autonomy的核心是建立在独特的信息论和概率论的基础之上的
模式识别技术,它可以保证对任何形式的信息:文本文件或基于语音、视频、非结构化或结构化的实际内容的基本理解。
如今网络
应用软件主要为
三层结构:用户界面层、应用软件层和数据层。这样的结构所存在的问题是,不同的应用软件不能实现信息共享。信息源与信息源之间有不可跨越的屏障,来自不同信息源的信息有不同的格式。Autonomy创建了一个新的信息层:智能信息操作层
IDOL,自动把各个信息源和各种
文件格式统一在一个智能的信息操作系统之下,这个智能信息操作系统可以提供多种信息操作的功能,比如信息的实施自动链接,信息
自动分类,内容概括,信息
聚类等。
Autonomy在系统内创建一个新层,即智能数据操作层(intelligent data operating layer, IDOL),从而使企业系统“以数据为中心”。该操作平台后端与各种数据源相连,可以根据任何语言和格式进行内容搜索,不论内容存放在哪里,自动实时地将总结以及与其类似信息的链接呈现出来。由于autonomy的技术是建立在概率性建模之上,因此不依赖任何语言进行分析,无需维护任何繁琐的词表, IDOL将此看成是意义的抽象符号,它通过词出现时的上下文环境而不是通过严格的语法定义来形成对该
词的理解,从而识别进入到autonomy架构中的任何数据的语言特性。
另外,autonomy还具有分类和
聚类功能。IDOL自动根据非结构化文本中的概念对信息进行分类,可以保证根据内容对所有数据进行最准确的分类。而
自动聚类可以收集大量的文档数据或用户档案信息,并且自动识别出信息内的主要类别,让IDOL自动的持续一致的计算新的信息应该属于哪个类别。
相关资讯
2012年1月20日,惠普2012年以110亿美元收购的Autonomy存在
会计欺诈,将进行88亿美元的资产减记。
2022年1月,英国科技创业者迈克·林奇将被引渡到美国,面临与惠普收购Autonomy有关的刑事指控。