【征文大赛投稿】+人类与机器学习+2020.02.13

digest [复制链接]
发表于 : 2020-2-13 11:29:09 最新回复:2020-02-13 21:52:00
142 1
goodie
goodie  精英

讯方·智汇云校投稿  作者:李铭浩,修正:徐剑波

当我们提到神经网络,第一反应我们总是会想到大脑,这一块大约重10kg的物质总是让人着迷。就是这么一块物质,让人类在物种争霸间爬上了食物链的顶端。也许论身体本身的素质我们永远不可能超过自然界的很多物种,例如狮子、大象和老虎,我们超过不了它们,但是它们却被我们关进了动物园里,所以是大脑,帮助我们走向食物链的顶端。既然它帮助我们走向食物链的顶端,不如我们也来研究一下它,为什么只是神经元与神经元的链接就可以做到这些事情的?

一、机器学习
谈到微观的神经元之前,不如我们来先说说宏观的地方,这个大脑,它的使用教程?这就好比我们教老人们如何应用最新的手机如何拍照和微信发图片,但我们不需要告诉他们底层的cpu是如何工作的。我们用最耳熟能详的高考来举例子。我们在上学的时候,究竟是怎样在学习的?首先老师给你发一堆试卷,试卷的高度堆起来可能比你我都高,我们写完试卷,并且给老师改错,之后了解错误后在写新的试卷,反反复复,但我们最终要解决的,并不是像山一样高的试卷,只是单纯的一张高考卷而已。可能很少人仔细想过,但这中间的内容却刚好符合了人工智能模型的训练。也就是我们的大脑如何学习。我们把一个能解决我们需要解决的事情的事物叫做模型,而这个模型之所以能解决我们的问题,是因为这个模型得到了训练。
我们把我们所有能收集到的试卷(假定10000张)叫做数据集,同时我们把试卷按照7:3的比例分成训练集和测试集,训练集就是我们平时练习所作的试卷,我们做完试卷交给老师去改,老师把错误的地方和正确答案告诉我们,这个就过程叫做监督学习,也就是有正确答案反馈的学习,当然我们反反复复做这么几个试卷,最终能把每个试卷做到满分,这并能体现我们模型的好坏,因为我们要解决的是高考,而不是手头上的试卷,此时就要证明我们学习后的模型的好坏了,证明的方法就是用之前分出来的测试集,因为我们要解决的问题不是已有的试卷,而是其他的试卷,这中间的过程叫做泛化,代表这我们能否解决新环境中遇到的新的问题,而测试集就是我们临近高考前的考前模拟,这份模拟卷基本能反映了你的能力,也就是你的模型训练的好坏,所以即使我们能把训练用的试卷做到百分百全对,也不代表你真正的能力。当然这其中也会有着很多的问题,假如一个学生在反复的学习中知道了1+2=3但却不知道2+1等于多少,这就说明了他在学习中“过拟合”了,过拟合最明显的体现就是泛化能力不足,也就是不能解决新的问题。这一切并不一定是唯一的方法,我们可以在划分数据的时候选择(交叉验证集,自助法)。在学习途中也可以使用(dorpout,正则化等等)来避免过拟合或者是找出更多的数据来帮助学习,但这过程中也存在老师由于其他原因不小心给出了错误的答案(噪声),干扰了学习。所以在高考完,各个大学们用高考分数来评价你是否有资格进入他们的学校。正是评估了你的模型好坏,当然背后真正所考核的,是你的学习能力的好坏(我们不只一种学习方法)。

二、神经网络
谈完宏观的大脑,我们来进一步聊一聊微观的事情,神经元,我们知道很出名的神经网络,那他是如何工作的呢?我们不妨先举一个例子,我手头上有着三个女生的信息,如下
【征文大赛投稿】+人类与机器学习+2020.02.13-3220908-1

这份表格只有两项数值,分别是身高和体重,我们把这些叫做特征。所以这里我们有两项特征,同时我希望通过这两项数据得到我对这个女孩的好感度,假如这是相亲吧,现在我们先来画一个简单的神经网络
【征文大赛投稿】+人类与机器学习+2020.02.13-3220908-2
左边的两个圆圈便是代入数据了,而右边的圆圈就是结果。那么现在我们来带入这两个特征数据,但是我们该怎么代入进去呢?只是单单的50,164么?不是,为了方便即使,我们要进行一个特征缩放的过程,什么是特征缩放?特征缩放就是将原数据的数值进行一个处理,使它更好的去用来计算,这里我们使用平均归一化,平均归一化就是将原先的数值变化为从0-1的一个范围内的数,数字原先越大越接近1,越小越接近0。归一化的公式:x(new)=x-min(x)/max(x)-min(x),x(new)表示变化后的x值,min(x)表示整个数据集中最小的值,
max(x)表示最大的值,
【征文大赛投稿】+人类与机器学习+2020.02.13-3220908-3
之后我们代入近神经网络
【征文大赛投稿】+人类与机器学习+2020.02.13-3220908-4
这是第一个数据的代入,那下一步呢?下一步就是乘上我们的权重了,什么是权重?权重就是我对这件事情的着重程度,也相当于系数,例如我对女生的身高不是很看重,但是我比较看重体重,那么体重的权重就是2,身高的权重就是1。数值的大小反映了这件事重不重要。我们把权重写作W,那么现在就是数值乘上权重,也就是Wx了,但现在还是不够,因为现在Wx是一个必定会经过原点的线,我们希望有多样性,所以再加上一个偏置,写作b,式子就变成了Wx+b,这个就是目前相较完整的式子了,但这个式子仍还有一个确定,因为目前所有的式子都是线性的,也就是在平面上画一条直线就可以表示,这样缺乏了更多的可能,所有我们在此基础上使用一个非线性方程,帮助我们,这里我们使用sigmoid公式,他是一个收敛函数
【征文大赛投稿】+人类与机器学习+2020.02.13-3220908-5
所以最后的式子就是f(Wx+b),sigmoid有一个好处就是结果一定在0与1之间
不错,这就是我们最终的表达式。但由于一开始权重W和偏置b值没有,所以我们先随机生成一个。
那么我们现在的神经网络是这样
但这里为了方便更好的理解我们就不使用特征缩放了。
【征文大赛投稿】+人类与机器学习+2020.02.13-3220908-6
这里的1.6和3分别是两个权重W,而4是偏置b,为了明显我们将第二组数据代入方程
【征文大赛投稿】+人类与机器学习+2020.02.13-3220908-7
那么整体下来就是f(1.6x74+3x176+4),结果就是0.99,这个答案一般意味着肯定,但这只是机器预测出的答案,那我的呢?很遗憾,我并不喜欢这个人,所以机器预测出的是错误的,那么这个机器就要进行修正,目前神经网络主要修正的方法就是使用梯度下降法。这里就先不进行解释
【征文大赛投稿】+人类与机器学习+2020.02.13-3220908-8
用平面坐标表示就是
【征文大赛投稿】+人类与机器学习+2020.02.13-3220908-9
那这样机器就可以学习到一个线性可分的结果,什么是线性可分?
【征文大赛投稿】+人类与机器学习+2020.02.13-3220908-10
机器认为大于这个线的都会是不好的,小于这个线都是好的,这一个笔直的线可以将问题答案分割开来,就是线性可分的问题
拿这个线的公式就是-2.07x1+(-1)x2+176=0 这里的x1,x2是变量而不是乘号
这里先不考虑个人审美问题,假如我就是这样子的选择,机器在反复修改权重后达到了这个效果,但很遗憾的是
【征文大赛投稿】+人类与机器学习+2020.02.13-3220908-11
那么就会表示成
【征文大赛投稿】+人类与机器学习+2020.02.13-3220908-12
这就很尴尬了,因为这就意味着线性不可分了,那么此事这个机器将永远找不出正确的方法。这也是异或问题的一个现象,但此时只要我们再添加一层网络,变成这样
【征文大赛投稿】+人类与机器学习+2020.02.13-3220908-13
那么这个问题就可以被机器所解答了,这里先不进行解释
【征文大赛投稿】+人类与机器学习+2020.02.13-3220908-14
这也是为什么网络需要多层的原因

可能神经网络会让人们觉得很复杂,我们来讨论一些轻松的事情,视觉。可能我们不知道,其实我们每分每秒都在锻炼我们大脑神经元的连接,当我们闭上眼睛,世界变得一片漆黑,但我们仍可以听到,闻到,触碰到这个世界,但这样可能这个世界会变得单调许多,看不到电视剧,美丽的脸庞和多彩的世界,甚至连路都很难走,可能我们失去了视觉,根本活不下去。我们把时间回调,回到那五亿年前,寒武纪物种大爆发。在那时,其海洋他物种还在悠然的趴在地上啃草与世无争时,一个捕食者悄然上线,那就是奇虾。他也许是第一批食物链顶端者,而帮助他登上食物链顶端的工具,便是视力,很难想象把,我们习以为常的视力正式帮助奇虾曾经站在食物链顶端强有力的工具,毕竟当时很多生物眼睛都没长,就一瞎子。如今视觉这一工具我们也都习以为常。假如有一个人,他从小就失去了视觉,在他长大后又拥有了视力,那他会看到什么?很幸运世界上刚好就有这么一个人,他提供给我们很多的信息。他在两岁的时候眼睛就因为特别原因失去了视力,但如今在他三四十岁时,接受了干细胞技术,帮助了他重见光明。那他看到了什么?“太多信息了”就是他所能说的,他睁开眼睛甚至没法走路。他说他走的时候同时要避开这些人,太难了,他不可能同时办到,可能这对我们来说太容易了,但对这个人来说,太难了,而其中的内部原因正是我们从小到大一直在训练着我们视觉神经网络。这些神经元像是老猎人一样知道如何处理这些信息,但对他来说,他的视觉神经如同刚出生的婴儿一样,不知道拿这些信息如何是好,如今他虽然恢复了视力,但还是需要导盲犬。这正是我们大脑的方式。大脑训练我们所能接受到的信息,但若是太多信息的同步接受,大脑在没经过训练**接受这些信息,就会出现像他一样,连走路都不会了,所以我们在认真思考一件事或者专注的听时,会把眼睛闭上,减少信息的获取,方便大脑能够专注的处理单一的信息,可能关于视觉的案例是一时半会是说不完的,这便是为什么人工智能视觉的研究(卷积神经网络)是最火热的,因为这是关于这个世界信息最多的一种获得方式。但这方面的工作似乎到了一个瓶颈期,似乎怎么也难以更上一层楼,而我认为关键的原因就是我给带入网络的信息是一个二维的图片,一个矩阵而已。正如我所强调的,信息是训练神经网络最关键的一步,所以视觉处理想更上一层楼,带入的信息必须是三维张量的,而不是二维矩阵的。
再说完视觉后,我们可以探讨一下人类文明的基石。语言。在义务教育里,有着一门让大多数人头疼的科目,英语。可能很多人从小到大就在学习英语。可如今会说英语的又有几个?我们先记住这个问题,先来看一下语言曾经摆在人工智能前的障碍。最初人们不知道如何让机器学习语言,有人想了一个办法,我们把一个词语拆开,分着读,把这些分开的读法当作特征带入。比如hello这个词,我们把他拆成”哈”,”楼”这两个音,要是机器听到这两个音连续出现,就认出说了hello这个词。但是在测试中发现了机器怎么也听不懂,那是怎么回事?那是因为每个人读一个单词时都多多少少的有一些不一样,比如说亚洲人读起来有一些奇怪。印度人读起来带有一丝丝咖喱味,而美式和英式又不同,南方和北方也不太一样,语速快慢都会影响,所以机器学不懂英语。而我们学习英语时,也是跟机器差不多,我们在脑子罗列一个excel表往里填对应的东西,当遇到问题时我们检索我们的excel表,这就是为什么我们学不会英语的原因,因为excel表记住了案例,而案例是无穷无尽的,我们永远也收集不完。这是我们犯的错误,也是当初机器犯的错误。那是什么解决了机器听懂语言的问题呢?神经网络。我们不再罗列一个excel表告诉机器,而是通过一组数值的传入,通过调整权重之间的连接让机器学习。在机器学习语言逻辑意思的时候,存在了一个问题,就是机器可能过早的下了一个结论。就比如我说“小花,这朵小花真漂亮”“小花,这是小明给你的东西”,这两句开头都用了小花,但是两个小花的意思是不一样的,所以在不了解整个句子的情况下,机器有可能只根据前面的信息就下了一个结论,所以我们希望机器能看完整句话,就存在一个解决方法,便是双向网络,在从前向后看的时候同时从后向前看,便可以抵住由于看的缺失导致存在错误的理解。
说到底,机器学习的方式,只不过是我们人类的那一套方法,所以再机器学习中会看到很多人类行为的影子,因为那就是我们的样子,但很多事情太微观了,我们也许察觉不到,就好比决策树算法的后剪枝的行为,对应了人类在青春期大脑会主动杀死大约30%的神经元链接,所以人们在青春期会变得冲动,不理智,愚蠢。可能很多人会觉得自己跟人工智能无关,或者他实在太难了,但即使这个世界上从来没有人工智能这个概念,人类在如今的发展中,思考问题的方式也要得以改变,从解决温饱,到解决繁衍,再到解决娱乐,人们也在一步步进化,这也是为什么强调终身学习这个概念的原因。学习人工智能这些从未要求你要为这个行业做出贡献,或为人类做出贡献。他也可只是我们终身学习的一个小旅程。


思考题:
树木是否也会思考?只是他们的思考方式未被人类察觉而已(这里的思考指真正意义上的思考,不是指像单细胞生物做出的应激反应一样)


最后做出一个答案,其实树木还是植物都是不会思考的,因为真正的思考是有代价的,代价就是大量能量的消耗,人类的大脑只占整体一小部分的质量,但却消耗极大的能量,cpu只占电脑的一小部分,但却是主要的电力消耗。树木在光合作用下获得不了那么多的能量,即使他们曾有过大脑,也会主动退化掉。这只代表个人观点

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
  • x
  • 常规:

点评 回复

智汇云校主要培训华为认证、红帽、Oracle等认证培训,https://www.zhihuirongyun.com
跳转到指定楼层
Becky_2019
Becky_2019  管理员 发表于 2020-2-13 21:52:00 已赞(0) 赞(0)

感谢投稿!^_^
  • x
  • 常规:

点评 回复

发表回复
您需要登录后才可以回帖 登录 | 注册

警告 内容安全提示:尊敬的用户您好,为了保障您、社区及第三方的合法权益,请勿发布可能给各方带来法律风险的内容,包括但不限于政治敏感内容,涉黄赌毒内容,泄露、侵犯他人商业秘密的内容,侵犯他人商标、版本、专利等知识产权的内容,侵犯个人隐私的内容等。也请勿向他人共享您的账号及密码,通过您的账号执行的所有操作,将视同您本人的行为,由您本人承担操作后果。详情请参看“隐私声明
如果附件按钮无法使用,请将Adobe Flash Player 更新到最新版本!
登录参与交流分享

登录参与交流分享

登录