写于 2018-11-21 07:19:06| 2019免费彩金网站| 免费送彩金
智力是一个非常困难的概念,直到最近,没有人能够成功地给出一个令人满意的正式定义大多数研究人员已经放弃了完全普遍性的智能概念,而是专注于相关但更有限的概念 - 但我认为在数学上定义智能不仅是可能的,而且对理解和开发超智能机器至关重要从此,我的研究小组甚至成功开发了可以从头开始学习吃豆人的软件让我解释 - 但首先,我们需要定义“智慧”多年来我一直在研究一般理性智力问题我的小组已经筛选了心理学,哲学和人工智能文献,并寻找个别研究人员和小组提出的定义。这些特征非常多样化,但似乎成为一个反复出现的主题,我们汇总并提炼成以下定义ition:[](http:// wwwvettaorg / documents / Machine_Super_Intelligencepdf)智能是代理人在各种环境中实现目标或取得成功的能力您可能会感到惊讶或持怀疑态度并询问这个或任何其他单个句子如何捕获智力的复杂性这个问题有两个答案:这就是我过去15年来一直在研究的问题用美国数学家Clifford A Truesdell所说的话:数学符号和关系中没有什么可以说是不可能的然而,通过单词说话是相反的,但是,假的很多可以并且用语言说不能放入方程式 - 因为它是无意义的确实,我实际上首先开发了方程式,然后我们将它们转换成英语这个科学领域被称为通用人工智能,AIXI是由此产生的超级智能代理。下面的等式形式化了智能的非正式定义,即代理的能力在各种各样的环境中成功或实现目标:解释方程式的每一部分将构成另一篇文章(或书籍!),但其背后的直觉如下:AIXI有一个计划组件和一个学习组件想象一下机器人在环境中四处走动最初它几乎没有关于世界的知识,但是从传感器中获取来自世界的信息,并构建了一个关于世界如何工作的近似模型它使用非常强大的关于如何学习模型的一般理论来做到这一点来自任意复杂情况的数据该理论植根于算法信息理论,其基本思想是搜索描述数据的最简单模型模型不完美但不断更新新的观察结果允许AIXI改进其世界模型,随着时间的推移变得越来越好这是学习组件AIXI现在使用这个模型来近似预测未来并以其决定为基础关于这些初步预测,AIXI考虑了可能的未来行为:“如果我采取这种行动,然后采取行动等,这种或那种将会发生,可能会发生这种情况,这可能是好事还是坏事如果我这样做,其他行动顺序,它可能更好或更糟“AIX”唯一的“事情就是根据所学习的模型从预期的未来动作序列中取出最好的东西,其中”好/坏/最好“指的是追求目标或成功定义的一部分:AIXI获得偶尔的奖励,这可能来自(人类)老师,内置(例如高/低电池水平好/坏,在火星上找水是好的,翻滚是坏的)或来自寻求新知识等普遍目标AIXI的目标是在其生命周期内最大化其奖励 - 这就是规划部分总而言之,每个交互周期包括观察,学习,预测,计划,决策,行动和奖励,然后是下一个如果你对exp感兴趣的话进一步说,AIXI集成了许多哲学,计算和统计原则:上述方程严格而独特地定义了一个超级智能代理,学习在任意未知环境中最佳地行动。可以证明这个代理的惊人特性 - 事实上,可以证明在某种意义上,AIXI是最智能的系统可能注意,这是一个相当粗略的数学定理的翻译和聚合成单词,但这就是本质 由于AIXI是无法计算的,它必须在实践中近似近年来,我们已经开发了各种近似值,从可证明最优到实际可行的算法目前我们处于玩具阶段:近似可以学习玩Pac-Man, TicTacToe,Kuhn Poker和其他一些游戏关键不在于AIXI能够玩这些游戏(它们并不难) - 显而易见的事实是,单个代理可以自主学习各种各样的环境AIXI没有先前的知识这些比赛;它甚至没有告诉游戏规则!它从一个空白画布开始,只是通过与这些环境交互,它可以找出正在发生的事情并学习如何表现良好这是AIXI真正令人印象深刻的特性及其与大多数其他项目的主要区别即使IBM Deep Blue播放比人类大师更好的国际象棋,它是专门设计的,不能玩Jeopardy相反,IBM Watson在Jeopardy击败人类但不能下棋 - 甚至TicTacToe或Pac-Man AIXI都不适合任何特定的应用程序如果你接口它有任何问题,它将学会表现良好,确实是最佳的当前近似值当然是非常有限的对于学习组件我们使用标准文件压缩算法(学习和压缩是密切相关的问题)对于规划组件我们使用标准蒙特Carlo(随机搜索)算法这两种组件都没有任何特定的内置领域知识(例如Pac-Man板或TicTacToe规则)当然你有将AIXI与游戏连接起来,以便它可以观察棋盘或屏幕并对其进行操作,你必须奖励它赢得TicTacToe或在Pac-Man中吃食物颗粒...但AIXI自己弄明白的其他一切本文是改编自2013年11月30日和12月1日科学,

作者:寿悃聒