知乐空间

人工智能7大关键技术(人工智能关键技术)

人工智能关键技术(人工智能七大关键技术)

导读:企业使用AI的一个复杂因素是,这个主题包含了很多不同的底层技术。这些技术中的大多数可以执行许多替代功能。技术和功能的结合非常复杂。表1-1列出了七项关键技术,包括对每项技术的简要描述以及它们可以实现的一些典型功能或应用。

表1-1人工智能关键技术

本文将在该表中更深入地描述每项技术及其功能。我还将讨论每种技术在商业人工智能世界中有多普遍。我的工作是做商学院的教授(我和很多不同的公司合作过),但我也是德勤战略和分析实践部门的高级顾问,该部门整合了人工智能的咨询工作。

下面是对每种技术及其功能的深入描述。

作者:托马斯·h·达文波特

来源:华章科技

01~03统计机器学习、神经网络和深度学习

机器学习是一种自动将模型与数据进行匹配,并通过训练模型来“学习”数据的技术。机器学习是人工智能最常见的形式之一。

在德勤2017年对其公司已经在探索AI的250名经理进行的“理解认知”调查中,58%的受访公司在业务中采用了机器学习。它是很多人工智能方法的核心技术,有很多版本。内部和外部数据(尤其是这些外部数据)的爆炸式增长,使得他们通过机器学习来充分理解这些数据变得可行和必要。

神经网络是一种更复杂的机器学习形式,出现于20世纪60年代,用于分类应用,例如确定信贷交易是否欺诈。它是根据投入、产出、变权或投入产出关系的“特性”来分析问题的。它类似于神经元处理信号的方式,但将其与大脑相提并论则有些牵强。

最复杂的机器学习形式将涉及深度学习,或通过许多级别的特征和变量预测结果的神经网络模型。由于当前计算机体系结构的处理速度更快,这种模型有能力处理成千上万个特征。

与早期形式的统计分析不同,深度学习模型中的每个特征通常对人类观察者来说意义不大。因此,该模型很难使用或解释。在德勤的调查中,只有34%的人在使用深度学习技术。

深度学习模型使用一种称为反向传播的技术来预测或分类模型的输出。AI技术推动了该领域的许多最新发展,从围棋比赛中击败人类专家,到对互联网图像进行分类,这是使用反向传播的深度学习。供职于多伦多大学和谷歌的Geoffrey Hint经常被称为深度学习之父,部分原因是他早期对反向传播的研究。

机器学习采用了数百种可能的算法,其中大多数都很深奥。它们包括从梯度增强(一种建立模型以解决以前模型错误的方法,从而增强预测或分类能力)到随机森林(一种作为一组决策树模型的模型)。

越来越多的软件工具(包括DataRobot、SAS和Google的AutoML)支持机器学习模型的自动构建。这些模型可以尝试许多不同的算法来找出最成功的算法。一旦通过训练数据找到了用于预测或分类的最佳模型,就可以部署该模型,并且可以预测或分类新数据(有时称为评分过程)。

除了使用的算法,机器学习的另一个关键是如何学习模型。监督学习模型(目前为止商业中最常用的类型)使用一组标有输出的训练数据进行学习。

例如,试图预测银行欺诈的机器学习模型需要在明确构成欺诈案件的系统上进行训练。这并不容易做到,因为欺诈的实际频率可能只有十万分之一(有时称为不平衡分类问题)。

监督学习与评分模型中部署的传统分析方法非常相似,如回归分析。在回归分析中,目标是创建一个模型,该模型使用一组与输出相关的输入变量,其值是已知的,以预测已知的结果。一旦开发出模型,就可以通过相同输入变量的已知值来预测未知结果。

比如,根据患者的年龄、身体活动水平、热量消耗、体重指数,我们可以在中开发回归模型来预测患糖尿病的可能性。

我们为有或没有糖尿病的患者建立模型(通常使用所有可用的数据来建立回归模型)。一旦找到合适的预测回归模型,就可以根据一组新的数据(输入变量达到一定水平时患者患糖尿病的可能性)来预测未知的结果。以下活动(在回归分析和机器学习中)称为评分。

回归过程与监督机器学习相同,除了:

在机器学习中,用于开发(训练)模型的数据称为训练数据,它可以是为训练目的保留的数据的子集。

在机器学习中,通常使用另一个数据子集来验证训练模型,而这个子集的预测结果是已知的。

在回归中,不一定要用模型来预测未知的结果,相反,在机器学习中会假设结果。

可以在机器学习中使用许多不同的算法类型来代替简单的回归分析。

开发无监督的模型通常更困难,这种模型从无标记的数据中检测模式,并预测未知的结果。

强化学习是第三种变体,这意味着机器学习系统设定了一个目标,朝着目标的每一步都会得到某种形式的回报。在玩游戏的时候很有用,但是也需要大量的数据(很多时候数据太多对这个方法不起作用)。

需要指出的是,有监督的机器学习模型通常不会保持学习。他们从一组训练数据中学习,然后继续使用相同的模型,除非使用一组新的训练数据来训练新的模型。

机器学习模型是基于统计的,要和常规分析对比,明确其价值增量。它们往往比基于人类假设和回归分析的传统“手动”分析模型更准确,但它们也更复杂,更难以解释。与传统的统计分析相比,自动化机器学习模型更容易创建,并且可以揭示更多的数据细节。

考虑到学习所需的数据量,深度学习模型在图像和语音识别等任务中表现出色(远远优于之前针对这些任务的自动化方法,在某些领域接近或超过了人类的能力)。

04自然语言处理

自20世纪50年代以来,理解人类语言一直是人工智能研究人员的目标。这个领域被称为自然语言处理(NLP),包括语音识别、文本分析、翻译、生成应用程序和其他与语言相关的目标。

在“理解认知”的调查中,53%的公司在使用NLP。自然语言处理有两种基本方法:统计自然语言处理和语义自然语言处理。统计NLP基于机器学习,性能比语义NLP更快。它需要一个庞大的“语料库”或者语言系统来学习。

比如在翻译中,需要大量的翻译文本,通过统计分析可以发现,西班牙语和葡萄牙语中的amor与英语中的love一词在统计上高度相关。虽然靠蛮力,但通常是非常有效的方法。

语义自然语言处理是近十年来唯一的现实选择。如果能有效地用单词、语法、概念之间的关系来训练系统,效率会相当高。

语言训练和知识工程(通常指为特定领域创建的知识图谱)可能会消耗大量的人力和时间。但是,它需要开发知识主题或单词和短语之间的关系模型。尽管创建语义NLP模型很困难,但一些智能代理系统已经在使用这种方法。

NLP系统的性能应该从两个方面来衡量。一个是看它能听懂多少百分比的口语。随着深度学习技术的发展,这个指标在不断提高,经常超过95%。

另一种衡量NLP的方法是看它能回答多少不同类型的问题或者能解决多少问题。这通常需要语义NLP,但由于这方面没有重大的技术突破,无论是问答系统还是问题解决系统都要基于特定的上下文,必须经过训练。

IBM Watson在回答《危险边缘》的问题方面做得很好,但它无法回答《命运之轮》(一个综艺节目)的问题,除非经过训练(通常是以劳动密集型的方式)。也许未来深度学习会被应用到问题解决中,但现在还没有。

05基于规则的专家系统

80年代AI的主导技术是基于“if-then”规则集的专家系统,当时在商业领域得到了广泛应用。现在人们往往认为它没有那么先进,但2017年德勤的“理解认知”调查显示,49%引入AI的美国公司使用了这项技术。

该系统要求人类专家和知识工程师在特定知识领域建立一系列规则。例如,它们通常用于保险承保和银行信贷承保(但也用于一些深奥的领域,如富爵咖啡的咖啡烘焙或金宝汤罐头的汤料配制)。

专家系统在一定程度上运行良好,易于理解。但是,当规则的数量很大(通常超过几百个)并且规则开始相互冲突时,它们经常会崩溃。而如果知识领域发生了变化,改变规则会很困难,也很耗时。

基于规则的系统自其早期全盛时期以来并没有得到很大的改进,但广泛使用它们的行业,如保险和银行,仍然希望有新一代基于规则的技术。研究人员和制造商已经开始讨论“自适应规则引擎”,它会根据新的数据或规则引擎与机器学习的结合不断修改规则,但尚未得到广泛应用。

06物理机器人

随着全球每年安装超过20万台工业机器人,物理机器人广为人知。在美国的“理解认知”调查中,32%的公司在一定程度上使用了物理机器人。他们在工厂和仓库中执行诸如提升、重新定位、焊接或组装产品的任务。历史上,这些机器人总是在细致的计算机程序的控制下执行特定的任务。

但是现在的机器人越来越能和人类合作,也越来越容易训练,只需要按照预定的任务移动机器人的各个部分。随着其他人工智能能力被嵌入他们的“大脑”(实际上是他们的操作系统),他们也变得更加智能。随着时间的推移,我们在AI其他领域看到的改进很可能会集成到物理机器人中。

07机器人过程自动化

机器人过程自动化(RPA)技术就像人类用户在执行结构化数字任务(即涉及信息系统的任务)时根据脚本或规则工作。关于RPA是不是AI/认知技术的集合有争论,因为它不是很智能。但是因为RPA系统非常普及,自动化,越来越智能,所以我把它当成AI世界的一部分。

有人称之为“数字劳动力”,与其他形式的AI相比,它们廉价、易于编程、透明。如果你会操作鼠标,懂流程图和一些if-then业务规则,那么你就能理解甚至开发RPA。这些系统也比其他方法更容易配置和实现(例如,用编程语言开发自己的程序)。

RPA其实并不涉及机器人,它只是服务器上的一个计算机程序。它依赖于工作流、业务规则和信息系统集成的“表示层”的结合,作为系统的半智能用户工作。

有人将RPA与电子表格中的宏进行比较,但我不认为这是一个公平的比较。RPA可以执行更复杂的任务。其他人将其与业务流程管理(BPM)工具相比较,后者可能具有一些工作流功能,但通常旨在记录和分析业务流程,而不是实际自动化它们。

一些RPA系统已经具有一定程度的智能。他们可以“观察”人类同事的工作(比如回答常见的客户问题),然后模仿他们的行为。其他人将过程自动化与机器视觉相结合。与物理机器人一样,RPA系统也在慢慢变得更加智能,其他类型的AI技术也用于指导它们的行为。

我已经分别描述了这些技术,但实际上它们越来越多地结合和集成。然而,目前对于一个商业决策者来说,知道什么样的技术可以完成什么样的任务是非常重要的。

Global Inc首席信息官Krishna Nathan指出,他在2018年的一个关键优先事项是“帮助我的利益相关者了解人工智能能做什么和不能做什么,以便我们能够以正确的方式使用它”。也许在未来,这些技术将混合在一起,这样的理解将不再必要,甚至不可行。

作者简介:托马斯·达文波特(Thomas H.Davenport),美国巴布森学院(Babson College)杰出的信息技术与管理教授,获哈佛大学哲学博士学位,先后在哈佛商学院、芝加哥大学和波士顿大学任教。他曾任埃森哲战略变革研究所所长,研究领域广泛,包括信息和知识管理、再造工程以及信息技术在商业中的应用。

本文摘自《数字时代的企业AI优势:IT巨头的商业实践》,由出版社授权发布。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件至 ZLME@xxxxxxxx@hotmail.com 举报,一经查实,立刻删除。

留言与评论(共有 0 条评论)
验证码: