110.二维双色人工智能实验
无监督学习,自动识别模式进化,是现在人工智能的焦点问题。 只有解决这个问题,才有通用智能的出现。 通用智能,首先必须有通用的概念理解基础,超越平台性和知识性。 为此,我提出元和关系理论。 任何概念体系,都由元和关系组成。 其中,元是孤立的关系,关系是联系的元。 我们称原始的元为基础元,而元和元的关系,称为衍生元。 基础元和衍生元,衍生元和衍生元,又构成下一级的衍生关系。 如此至于无穷。 这就是道生一【元】,一生二,二生三,三生万物的现实理解。 现在,我们取一个二维双色的图片结构作为基本研究对象,从中构建模式的认知和进化。 科学来源于抽象和假设,而且往往是对最基本的,最核心的属性的抽象。 比如数学的点线面,都是现实中不存在的东西,但却适合作为理解的基础。 比如物理中的质点,重心,也都是便于理解的工具。 比如火车的铁轨,汽车的公路。 我们都是先从简单去理解,然后在此基础上构建生态,从而理解复杂的世界。 二维双色是最最基本和简单的图片,适合作为我们研究的起点。 而一旦在这种情况下有了进展,也便于我们向后来者教学和传授经验,便于大家理解和认识,便于程序的开发和维护。 我们取一个方块区域,两种基本而不同的颜色,比如黑底白色。 这些图片可以生成出来,也可以从各种图片中简化抽象出来,所以是取之不尽的,样本空间非常巨大。 当然,生成的图片可能是杂乱无章的,随机断续的。而简化的图片则保留着对事物的根本认知,更加合适。 当我们有经验并能够成熟的处理二维双色的图片之后,我们可以向更加复杂的情况进发,进而解决所有的各种图片。 首先,我们做总体的分析和标准化。 我们来看图上的具体一点。 它周围最多有八个其他点,边缘的我们不考虑,为了方便和简化,我们考虑除去边缘的所有点,这也是一个矩形区域。 一个点是一个基本元,它的数据包含了横纵坐标和RGB颜色值。 一个点和周围的八个点就构成八组关系。 这些关系从颜*分,有两种可能,一是相同,二是不同。 从横纵坐标分析,有正和斜两种,是基础的线段。 而基础线段再向前走,和另外一个点组成关系,就构成了角。 从起始线段和终止线段的方向分析,有8*7共56种角。 这些是基本的数据。 根据简单的原则,我们认为在图像中出现发现一个封闭路径意味着识别一种物。物体或生物。 所以寻找封闭路径这里作为一个基本算法,从一个点出发沿同色路线最后回到这个点,这个算法是易于实现的。我们这里认为它已经实现,并作为后续分析的基础。 发现一个物,记录图片,记录物的数据,包括点的数据,角的数据,角的数量等等。 每一个物,我们都认为是某种模式的体现,所以予以保存。 当我们发现新的物的时候,就和前面的物比较,如果发现某项或多项数据相同,就认为是发现了某种模式,予以记录。 当我们记录了一定数量的模式的时候,再发现新的物,就优先和这些模式相比较。 如果比较成功,就强化该模式的权值,优先使用在后续比较中。 比如给出一个三角形,和另外一个三角形比较,发现共性是都有三个角【不包括平角】,就认为发现了一种模式,这种模式的命名可以和这种共性有关。
而当三角形的模式建立之后,再看到三角形,比较成功之后,就强化这种模式的记忆,意味这这种模式更为常见和基础。 由此,就能认识和提取各种图形模式,并梯度排列。 三角形,四边形这种最常见的,将作为最基础的模式存在,并被优先识别。 【事实上生物世界并非如此,但人造物确实比较基于这两种。】 当元的数据较多的时候,比如一个20边形,我们认为它有可能和21边形是类似的一个模式【比如猫的尾巴没有露出来】。 也就是说在数据复杂的时候,我们看的是相似性而不是相等性。 当然,事实上在数据简单的情况下,相等就包含了相似性。 比如角的数量相等,图形就自然的相似。因为相等的数据是局部的,概括的,不是完全的,所以总体看来确定的是相似。 以此类推,在多色和多维数据中,我们都可以这样前进和发展。 简单的程序将识别各种甚至人类无法认识或还未总结的模式。 而且是不需要监督的,也不需要标识,只要提供给它数据和记忆空间就可以了。 在此简单分析实验的基础之上,人们就可以更加轻松的理解事情的发展。 当然,我们的人工智能是一个黑箱,但是是可以查看的,因为他对模式的描述是确定的。 配上图可以使文章更显丰富,但由于我们选择的模式是如此基础和简单,因此单凭想象就完全可以,也就不那么麻烦了。 最后,谢谢大家的观看,希望更多人提供智慧,发扬广大。