极天信息:基于知识图谱的知识泛化让AI学会“举一反三”
比尔·盖茨曾说“自然语言处理是人工智能皇冠上的明珠”。在上周刚结束的“2019CCF-GAIR全球人工智能与机器人峰会”上,微软亚洲研究院副院长周明博士指出“人在理解的时候有常识、有背景,所以能够理解;可电脑没有常识、没有背景,只是根据字面来处理,因此它理解的都是一样的。这就是自然语言处理的难处。”确实,人类的“智能”是在适应和理解复杂多变的物理和社会环境的过程中进化而来, 并非只适用于解决具有明确规则的任务或游戏。而当前,如何让机器能够像人一样思考,能够理解、解释并进行推理决策,即获得人类所独有的认知能力,是人工智能当前面临的重大挑战。而知识图谱则为认知智能的发展提供了全新的视角和机遇。
语言理解的难度:词完全一样,意义截然相反
人类智能具有快速学习和灵活迁移的特点,在应对复杂多变的外部环境时较人工智能系统表现出不可比拟的优势。该优势主要源于人类具备良好的知识表征。对良好的知识表征——知识图谱的深入研究不仅可以提升认知智能,同时也有助于实现当前人工智能系统从“大数据、小任务”到“小数据、大任务”的转变。使人工智能系统像人一样具备小样本学习的能力。
那么在实际应用中,知识图谱是如何辅助AI实现这一过程的呢?其核心就在于利用知识图谱进行知识泛化。泛化(generalization)这一概念最早出现在巴甫洛夫的《大脑半球的功能讲义》(1926),用来表示条件反射的普遍化性质。在心理学中,泛化是学习理论中的一个基本原则,语义条件反应的泛化是仅见于人类的一种泛化现象,它极大地增进了人类学习的效果。而知识泛化就是利用知识图谱,将一个实体具体表达泛化为多样性表达,将一个实体泛化为一类实体。简单来说就是,通过知识泛化让AI具有“举一反三”的能力。
以极天信息多年实战经验为例。基于政务知识图谱、依托G1Brain类脑平台,极天信息为某政务服务中心打造了新一代政务智能咨询服务机器人,能够模拟政务专家,全渠道、7*24小时,以多轮交互的方式,就户政、社保、出入境、纳税、创业就业等各类问题给市民提供智能化的专业政务咨询,将进一步提升区级政务服务智能化水平。比如“港澳台人员如何办理养老金手续?”这个问题,普通民众一眼就知道“港澳台”包括了“香港、澳门、台湾”,但是如何才能让计算机也能够立马明白其中可能包含的各种同义词、所属关系,能够“举一反三”呢?这就需要利用知识图谱对其进行知识泛化。问句主体为“港澳台人员”,知识泛化之后主体可以包含“台湾人员/台湾同胞/台湾市民”“香港人员/香港市民”或者“澳门人/澳门市民”;而问句中的动作为“办理”,可以泛化为同义词“申请、办、申办、领取、领”等等,经过包含关系与同义词关系的知识泛化后预计可以得到上百条相似问题。这样就保证了无论咨询人员如何提问,AI都能够快速而准确地识别意图,真正“理解”咨询人员的需求,从而获取到最直接的答案。从这样一个简单例子即可知,通知知识泛化可有效提升政务咨询体验。
极天信息知识泛化
极天信息政务知识图谱
十多年来,极天信息持续专注自然语言理解(NLP)、语义网(Ontology)和知识图谱相关技术的创新研究,研发了极天信息知识图谱SemNet,包括通用知识图谱和电信、移动、诗词、政务、电力、法律、银行等多个领域知识图谱,并拥有一整套成熟的知识图谱构建体系,可以扩展应用至各个行业领域。
此外,极天信息集合多项核心技术打造了具有语义理解、推理、抽象和自学习能力的“极天类脑”G1Brain,致力于将“数据转变为知识,知识转变为服务”,用先进的人工智能技术与行业结合,提供AI+行业的解决方案,提升商业运转效率,让商业与服务更智能。基于G1Brain,极天信息在运营商、出版、政务、电力、法律、教育、金融等领域与专家服务、智能分析、知识服务等场景,推动了大量商业实践的成功。