雷锋网按:2018 全球人工智能与机器人峰会(ccf-gair)在深圳召开,峰会由中国计算机学会(ccf)主办,雷锋网、香港中文大学(深圳)承办,得到了深圳市宝安区政府的大力指导,是国内人工智能和机器人学术界、工业界及投资界三大领域的顶级交流盛会,旨在打造国内人工智能领域最具实力的跨界交流合作平台。
在大会第一天的「ai 前沿」专场,美国犹他州立大学计算机系终身教授、电子工程系兼职教授、计算机视觉与模式识别实验室主任承恒达带来了题为「studying uncertainty in artificial intelligence」的主题演讲。
承恒达教授于 1985 年获得普渡大学电子工程专业博士学位,师从国际著名专家、智能控制学科奠基人、模式识别学科创始人傅京孙(k.s. fu)教授,他的主要研究方向包括模糊逻辑、计算机视觉、模式识别、图像处理,近年来专注于模式识别基础理论和乳腺癌早期诊断技术的研究。
承教授在演讲中讲解了人工智能中的不确定性,用通俗易懂的例子阐述了这一研究对人工智能领域一系列关键问题的推动意义。
他表示,人们在经典逻辑的基础上发展出微积分、代数、经济学、生物学等一系列学科,但是经典逻辑存在许多悖论,所以需要提出新的逻辑。「经典逻辑的值是 0 和 1,但模糊逻辑不一样,它的值在 0 和 1 之间,能解决一些经典逻辑不能解决的问题。模糊逻辑在科学和工业上也已经得到了许多的应用。」
随后,他进一步讨论了模糊逻辑不能解决的问题,比如两名审稿人评审同一篇学术论文,论文接收的隶属度都是 0.8,可是前者是专家,后者是新人,这两个 0.8 对文章的接收是有不同影响的,但在模糊逻辑下这两者没有区别。把模糊逻辑作为一个子集,在其基础上,发展出新的中智逻辑,就可以进一步解决这些问题。在中智逻辑的基础上,他们对 neutro connectedness 进行研究,在这一过程中提出一系列效果极好的算法。他们目前正在与医院和体检中心合作,进行乳腺癌的早期诊断,此外,也在进行多功能道路裂纹检测的相关研究。
以下为承恒达教授的演讲全文,雷锋网做了不改变原意的编辑整理。
很多人问我为什么要研究不确定性,原因很简单。不确定性遍存于宇宙中,不同的领域有不同的不确定性,研究不确定性能够很好地解决有关问题,从而得到好的结果。
如何处理不确定性?现在有多种不同的方法,比如说对于随机性可以用概率(probability)来解决,此外还产生了其他的不确定性,因此产生了其它的各种逻辑,如模糊逻辑(fuzzy logic)、粗糙集(rough set)、可能性理论(possibility)等。
建立在经典逻辑基础之上,人们发展出微积分、代数、经济学、生物学等等,可是哥德尔证明了科学是不完备的,经典逻辑存在许多悖论,所以需要提出新的逻辑。
经典逻辑的值是 0 或 1,不是黑就是白。模糊逻辑就不一样,它的值在 0 和 1 之间。比如说你在冰雪道上开车,不可能将刹车踩死或者干脆不踩刹车,所以绝不是按 0,1 这种逻辑来做。当然,模糊逻辑的提出已经得到了许多的应用,比如科学上、工业上,像手机聚焦就是利用模糊逻辑。
模糊逻辑隶属度在 0 和 1 之间,概率也是在 0 和 1 之间。很多人说,那这样的话,概率和模糊逻辑有什么差别?前者是建立在随机性的基础上,后者是建立在精确性的基础上。
举个例子来说明模糊逻辑和概率的不同。假定你在沙漠里必须得喝水才能存活下去,但水被污染了。假定致命水平是 0.4,你需要从两个盒子里选出一瓶水来喝,那你应该从下图中的哪个盒子里选择呢?每盒各有十瓶水,假定第一盒有两瓶被污染了,概率是 0.2,第二盒十瓶水均被污染了,隶属度是 0.2。这时候你应该从第二盒中拿水喝。
如果第一盒有四瓶水被污染,概率是 0.4,而第二盒水被污染的隶属度是 0.4,在这个基础上你从哪个盒子里选呢?从第一个盒子里选还有机会活下来。
所以模糊逻辑和概率是不一样的。如果用模糊逻辑作为一个子集,又可以发展出新的中智逻辑(neutrosophic logic)。这个新的逻辑包含 i、t、f 三个集合,它们可在 0 和 1 之间取值。
如果从逻辑上看,经典逻辑是 0,1 两个孤立的点,模糊逻辑是一条线,中智逻辑可以考虑成一个球体,能解决一些模糊逻辑解决不了的问题。比如说两名审稿人评审同一篇学术论文,论文接收的隶属度都是 0.8,可是前者是专家,后者是新人,这两个 0.8 对文章的接收是有不同影响的。
可是在模糊逻辑下这两个是没有区别的。如果我们有不确定变量 i(indeterminate),就可以区分这两者。
计算机视觉中存在很多不确定性:
比如由三维到二维变化的过程中存在信息丢失;另外有些定义本身就是模糊的,比如边缘(edge),对比度(image contrast)等;有时候没有一个客观标准来衡量问题,常常采用一些主观方法,比如投票等;用一些词汇来描述差异,比如说热,很热,特别热,一点点热等,这些可以用模糊逻辑解决得很好。
同时在医学影像中,医生可能会进一步引入主观性和模糊性。
1994 年 fuzzy connectedness(模糊连接度)被提出,大家知道它在空间理论上有很多应用,在这个理论提出之后,最近我们又提出 neutro connectedness(中智连接度),建立在新的中智逻辑基础上。我们基于 svm 提出了新的 nsvm。大家都知道 k-means 是经典逻辑很有力的工具,后来在此基础上有研究人员提出 fuzzy c-means ,我们又提出 l-means 工具。
这是我们在发展 neutro connectedness 的过程中提出来的一些方法,包括一些运算和运算符,同时我们定义了两点之中的 neutro connectedness,公式细节就不多讲了。
我们还从点到点,从点到集合定义了 connectedness。connectedness 可以用在图像处理或者一些其他应用上。我们进一步提出 neutro-connectness cut,下图是算法的详细过程。
我们也做了实验,下面是实验的数据集以及评估标准等。
下图最上面是原始图像和目标图,如果原始图像离目标图像比较远,可以看到,用以前算法的结果比较差,但我们这个算法能得到比较精确的结果。
下图是另外一个例子,我们的算法用非常少的种子点就可以解决分割问题,当然,种子点越多,结果会越精确。
我们还用图像处理的一些方法来诊断乳腺癌。乳腺癌发病率比较高,在美国,八个妇女中就有一个会得乳腺癌,而且发病率还在增加,但是死亡率却在下降,这是因为美国政府投入了大量的研究经费,来研究乳腺癌的早期诊断。
在中国乳腺癌的发病率和死亡率都在增加,所以早期诊断就成为一个很重要的因素。我们开始研究是用 x 光,但因为 x 光具有放射性,后来我们就转到用超声,超声本身没有放射性,很方便,而且价格低廉,适合普查。除了 x 光,ct 也有一定的放射性,而且 ct 和 mri 更贵一些,也不适合普查。
但超声图象噪声很大(因为固有噪声),另外质量比较差,同时现在超声科的医生数量大大少于需求。非常有必要建立一个计算机辅助诊断系统,能够检测乳腺癌,帮助医生。我们实际上对这一系统进行了 20 多年的研究。
利用算法可以精确地分辨肿瘤,目前这个系统可以得到比较高的精度,另外也能够帮助医生改进诊断率,提高诊断精度。
因为现在超声科医生很少,可以利用这一系统训练医学院的学生,将学生检测的结果和系统检测的结果进行比较就可以促进学生学习。而且系统能够提供很好的服务,这对于低资源地区和国家极有意义。如果有了这个系统,相当于超声机自带一个经验丰富的医生。在这里我们也用了一些方法来解决不确定性。最近我们正在把系统放在医院和体检中心,和他们做一些合作。
另外,我们做了多功能的道路裂纹检测车,可以全自动检测路面的裂纹。现在,一些单位或机关会先采集图像,再回去手工检测,我们的系统完全可以自动检测。相应的系统还可以用于机场裂纹检测、隧道等场景。
在检测的时候,一定要排除太阳光的影响,要有补光系统,路面噪音也很大,我们也用了一些方法来解决不确定性问题,这时就可以检测出裂纹,然后可以对裂纹进行分类,最后需要进行修补的时候,就可以根据图像来计算需要多少材料,到什么地方去修补等。
虽然中智逻辑用了模糊逻辑做子集,但我认为它也是一个过渡逻辑。