人工智能和拉姆斯菲尔德测试

Shomit Ghose用
2018年10月10日
有技术背景的女机器人
有技术背景的女机器人

但也有未知的未知——那些我们不知道自己不知道的。”- - -美国国防部长唐纳德·拉姆斯菲尔德2002年2月12日

人工智能战略相当于你的脾脏:每个人都有一个,但不是每个人都很清楚它会完成什么。有大胆的计划可以肯定的是,在人工智能的世界里到处都在进行,但它的现实距离通用人工智能(AGI)的愿景仍很遥远——即,机器显示出与人类自然智能相当的智能。

欢迎,机器人霸主?

投资者尤其需要清醒和现实地看待当今机器学习驱动的人工智能领域的成就,而不是那些只会浪费时间和金钱的承诺。机器学习中的成功模型具有一系列共同的特征,这些特征应该为我们评估投资机会提供信息:

  1. 商业模式是第一位的。机器学习项目不能仅仅因为它们是很酷的想法,或者因为有大量可以利用的训练数据而开始。如果没有一个有意义的业务问题和一个有效的人工智能驱动的解决方案,机器学习项目注定会因为简单的经济原因而失败。
  2. 有了业务模型之后,接下来要做的就是用大量(大量!)可用数据识别问题,特别是当问题维度变得越来越复杂时。机器学习是由统计模式匹配驱动的,它重视具有大量训练数据和大量操作数据的问题。专有数据源是最好的,并且数据需要处于足够“干净”的状态,以便能够很好地使用。数据还应该具有相关性:例如,基于了解患者首选洗发水品牌来尝试预测性医疗是不谨慎的。
  3. 机器学习喜欢高度稳定、封闭的环境,而在动态、开放的环境中挣扎。定义良好的封闭式系统游戏皮肤诊断仓库操作和谷歌的聊天机器人很容易适用于人工智能解决方案。园艺、踢足球或预测初创企业的成功等开放式系统是不确定的,超出了当今人工智能的范围。
    机器学习需要摄取无限大的数据,消耗无限大的计算量,才能达到最佳工作状态。在实践中,数据和计算(更不用说存储和带宽)都不是无限的。因此,机器学习最好应用于有限的、受约束领域的问题。
  4. 技术解决方案必须是可扩展的。如果数据是好的,那么更多的数据就更好。不用说,如果潜在的问题是简单的话,更多的数据只会产生边际收益)。这样,机器学习就表现出了“反商品”的行为。它并没有因为越来越多的数据量而被廉价化为商品化,而是变得越来越强大。但这意味着任何可行的机器学习解决方案都必须能够随着数据量和维数的增加而扩展。数据实时生成。决策也必须实时产生。

有很多业务映射到上述属性的问题。人工智能成功的关键是专注于这类实际问题和解决方案。成为过度炒作的受害者,并超越机器学习目前的能力是失败的秘诀。

人工智能的未来:了解丛林狼怀尔

但人工智能的未来是什么呢?我们什么时候能知道AGI是否已经实现?

想象一下华纳兄弟公司的《公路奔跑者》动画片中的一个常见场景。我们通常(而且经常)看到“路跑者”的死敌,倒霉的怀尔·e·土狼(Wile E. Coyote),无视地心引力,悬在半空中(可能还抓着铁砧),离附近的悬崖十英尺远。任何一个孩子在第一次看电影的时候都能告诉你接下来发生了什么:怀尔·e·土狼(Wile E. Coyote)将向地面俯冲,屈服于不可阻挡的地心引力。孩子也会知道这个场景是来自喜剧而不是悲剧。在类似的情况下,机器学习将无法得出这两个结论中的任何一个。

机器学习是.它需要大量数据,不适合数据不丰富的情况。它无法攻击那些不需要大量试验和错误的任务。它仍然服从于它的训练数据,无法在这个训练空间之外推广:想象一下谷歌的理发约会聊天机器人不得不自发地与你进行关于长曲棍球或烧烤的对话。此外,机器学习容易受到扰动在其数据中,导致数据黑客和错误训练。

机器学习的优势——它能够在海量数据中找到相关性和关联——也是它的弱点:它是只有能够在海量数据中找到相关性和关联。如果有足够的训练数据——一个不简单的“如果”——机器学习在输入到输出的封闭映射(计算机科学家的说法是“曲线拟合”)方面很出色。但是,不仅新情况(即很少或没有训练数据)会击败机器学习,而且纯曲线拟合也不能解决非常广泛的现实世界问题。

机器学习是一个蛮力驱动的模式匹配引擎,而不是直觉驱动的常识引擎。如今,机器学习无法解决广泛的任务,在它能够做到这一点之前——通过正确地解释怀尔·e·大狼的困境——AGI将仅仅停留在科幻小说的领域。

为了最终达到AGI,机器学习必须超越单纯的曲线拟合来理解现实世界的物理、心理/情感和因果模型,就像任何一个人类孩子可以做的那样。这个目标仍然很遥远(即使假设出现了一些新的突破)计算机体系结构技术的未来。虽然机器学习在分类问题上表现出色——远远超过人类的能力——但人类却有独特的能力,能够从广泛分散的推论中得出结论,经常从很久以前收到的数据中得出结论,甚至从隐约可见的数据中得出结论。不用说,在现实世界中,数据并不是整齐地打包和标记的,也不是海量的。

图灵测试Redux

最后,当机器能够自主地填充(吸收,理解)现实世界的抽象模型时,我们就会知道AGI的机会何时实现。当机器获得从经验和过去的证据中自主学习的能力时,这一目标就会实现。当机器在解决新问题时表现出与人类同样的灵活性时,这一目标就会实现,正是这最后一种能力将我们带到对AGI的最终测试中。

从历史上看,图灵测试一直被视为检验机器是否能像人类一样思考的严峻考验。汉斯Moravec悖论是人工智能的另一种衡量标准,就像赫克托·莱韦斯克的方法一样Winograd模式挑战。但也许现在可以采用一种新的衡量标准,即拉姆斯菲尔德测试:具体来说,机器处理“未知未知”的模糊不确定性的能力,就像人类擅长做的那样。通过拉姆斯菲尔德测试可能需要这些下一代系统部分由规则驱动,部分由数据驱动,也许——为了留住人类的利益找到工作——甚至部分是人为驱动的。

为了确保投资者(和企业家)不会成为人工智能内部大量炒作的受害者,我们需要始终清醒地了解它今天可以做什么,明天可能能做什么。人工智能的创新,包括有朝一日通过拉姆斯菲尔德测试,将创造新的商业模式,并将继续推动我们未来的创业机会。21世纪将永远被称为AI世纪。