【书海泛舟】白泽:控制论和科学方法论读书笔记(鸿思学社首发)|快看
有谁懂控制论?一切科学研究都必须有一个出发点,这个东西是确定的,必须要固定下来的。控制论和系统论的研究则开始于可能性空间,那么,可能性空间是什么呢?
可能性空间:我们将事物发展变化中面临的各种可能性集合称为这个事物的可能性空间。可能性指事物内部潜在的、预示事物发展前途的种种趋势;现实是已经实现了的可能性,已实际存在的事物。
【资料图】
控制论是关于控制的理论,根据要知道一个东西有什么用首先明确这个东西是什么的规则,我们首先询问什么是控制呢?我们观察控制过程的特征:1。被控制的对象必须存在多种发展的可能性。例如,坐在马路上,可以开车往左,也可以往右。 可以说这句话,也可以说那句话。2。被控制的对象不仅必须存在多种可能发展的可能性,而且,人可以在这些可能性中通过一定的手段进行选择,才谈得到控制。
现在我们来分析一下控制过程的组成:控制对象 控制者1,控制对象 特征:a:未来发展有多种可能性。b:控制者可以选择这些可能。2,控制者 具有选择控制对象的未来的能力。
我们在时间上来理解控制过程。
控制之前事物也有发展的趋势,只要人不干预,若干个该事物发展成不同未来是按照概率分布。控制之后,事物发展的未来改变了。朝着人期望的未来改变。例如捏住方向盘后,车开向左边。如果不控制,那么车子就是撞向前面。车子的原本趋势是往前走。现在从过程的角度来理解控制过程,一共三个阶段:控制前实际去施加控制动作的过程控制过后的结果可能性空间:我们将事物发展变化中面临的各种可能性集合称为这个事物的可能性空间。
任何事物,都有它一定的可能性空间,但这仅仅是可能性而已,至于事物具体发展称为可能性空间中的哪一个状态,要看具体条件而定。那么,控制过程是怎么进行的呢?我猜测是通过改变当时具体的条件来决定的。例如推门过程中门在某个方面受到的力:力的大小,方向,作用点。
连续控制
这里展现的是连续控制的例子。也就是说,在一个控制过程完成以后,继续下一个控制过程的过程。这种过程可以无限累加。也就是:aa,ba,b,ca,b,c,d......为什么要这样控制呢?例如,我们可以用网捉住鸟,再用手去捉住鸟。这里展示的就是两个控制过程。一个是网捉住鸟的过程,一个是人在网上捉住鸟的过程。显然,在网上捉住鸟比在天空中用手捉住简单的多,可行性的多。那么,在这个过程中,鸟发生了什么?在没有被网捉住之前,鸟可以在天上自由自在地飞翔,四处飞舞,拥有多种飞翔方向,高度,速度的可能性。被网络捕捉以后,就只能在网上扑翅。从被网络捕捉前的可以到处飞舞,到被捕捉以后只能在网上扑翅相比较,鸟的可能性大大降低了。当人在网络上去捕捉到鸟以后,又把鸟可以在网络上还可以扑翅,安静的可能性削减为:只能固定在人的手中,偏偏头之类的事情。相比较在网络上的可能性又大大降低。在这两个过程中,可能性相比较控制之前都在减小。从两个过程这个整体来看,鸟的运动的可能性都在不断地减少。那么,可以是反过来吗?鸟在鸟笼里面,我们发善心,把鸟放出去。这是把鸟运动状态的可能性空间增大了,鸟运动的可能性增多了也就是说,控制过程可以把事物的可能性集合增大,也可以减小。但是,控制过程能使得事物的可能性空间不变化吗?
现在我的答案是,不能,因为这样子就是没有去干扰事物的可能性,事物的可能性没有变化。这里存疑。
事物有可能性空间,是因为事物变化具有不确定性/矛盾性。矛盾性使得事物面临着肯定自己和否定自身两种状态。事物的不确定性由事物内部的矛盾决定。什么是肯定自身呢?这里我暂时理解为熵减,复杂化自身。什么是否定自身呢?这里我暂时理解为熵增,系统崩溃。
什么是控制呢?人们根据自己的目的,改变条件,使得事物沿着可能性空间内某种确定的方向发展的做法,就是控制。
控制的结构是什么?事物 特性:存在多种可能性控制者 特性:有目的, 能对事物的发展趋势做出选择。目的是什么?存疑。在目的的要求下,控制者对于事物的可能性空间做出标记,也就是希望事物朝着某些可能性未来进发。
事物 特征:有多种能被控制者选择的可能性。控制者 特征:a有目的,有对事物发展可能性的爱好偏向 b有能对事物的发展方向做出选择的能力。
现在,我们要定义控制对象。
首先,我们来观察事物。对于具有多种可能性的事物,出现的可能性是:可以被主体控制的可能性,不可以被行为主体控制的可能性。在事物的多种可能性中,是否同时存在可以被控制的可能性和不可以控制的可能性呢?答案是肯定的。例如,我们可以把水从杯子中抛出去,但是我们无法做到直接裂解水分子。水确实有这种发展趋势,虽然可能性极其的小。之前的捕捉飞鸟例子中,虽然我们也能做到徒手捕捉飞鸟,但是这种可能性太低了。控制的结构是什么?
事物 存在多种可能性
控制者 有目的, 能对事物的发展趋势做出选择。
目的是什么?存疑。在目的的要求下,控制者对于事物的可能性空间做出标记,也就是希望事物朝着某些可能性未来进发。我们现在把控制的结构再次地抽象化。现在我们的面前有两个主体。分别为:主体a,主体b。其中主体a有着自己的发展方向,发展方向至少有两种。主体b有着自己的目的,这种目的导致主体b偏向于主体a的发展偏向于某些未来。 进而采取行动去使得a偏向于这些未来。这里,我们需要对未来做出具体的规划。a的可能性是能被b选择的。如何规定呢?主体b能对a的发展方向做出选择。选择a 的可能性。这里我们就出现了控制的逻辑流程。先是存在两个主体a和b;其次是a的发展具有多种可能性;然后是主体b对于a的发展方向具有偏好,随后有能选择a发展方向的能力;最后是去选择的过程。控制在这里指的是去选择的过程。
什么是控制呢?人们根据自己的目的,改变条件,使得事物沿着可能性空间内某种确定的方向发展的做法,就是控制。人控制电脑,电脑控制机床。我对控制继续的定义是符合这个例子的,更具有普遍性。在这里,事物是主体a,人是主体b。在这里,金老的定义就成为了我的定义的一个子集/不过,还是和很久之前的问题一样,我得准确地描述什么是主体。这里留到以后去研究。
是的,我之间对控制过程的描述是正确的。不过,我描述控制的时候涉及到了这里的全过程,但是我仅仅是把选择的过程定义为控制。不对,控制和控制过程有什么差别?各自的定义是什么?一切控制过程由三个基本环节构成:第一个环节:了解事物面临的可能性空间是什么。第二个环节:在可能性空间中选择某一西俄状态为目标。第三个环节:控制条件,使得事物向既定的目标转化。
思考结束。
控制过程能使得事物的可能性空间不变化吗?可以。事物的发展趋势是可能性减少,然后控制者可以遏制这种趋势,对事物进行控制。保持事物的可能性空间大小不变。结束。
他一言不发走在城中,看似毫无目的,实则有所动作。地面上,一缕缕微不可察的细沙飘出,汇聚其掌心,金色颗粒越积越多,最终形成不规则状的金块。“珀尔修斯、蒂科拉,你喜欢阿戈斯吗?”“喜欢。”x2“如果在大海和陆地之间做出选择,你们喜欢哪种生活?”“……”这个问题蒂科拉不懂,珀尔修斯挠挠头:“大家在哪,我就喜欢哪里。”“如果我们家在阿戈斯有一套大房子,还有很多佣人,你觉得好吗?”“很好啊!”珀尔修斯连连点头:“如果家里有钱,父亲母亲就不用总是出海了,那很危险,不是每次都有今天的好运气。”“既然你这么说,我们就去买房子!”“大哥,我们没钱。”“现在有了。”罗素晃了晃手里的黄金:“我运气不错,一进城就捡到了钱。”
这里出现的是控制水平,控制水平是通过控制区间和深度来达到的。按照选择实现评价的步骤。现在得总结一下昨天做了什么1。可能性空间:我们将事物发展变化中面临的各种可能性集合称为这个事物的可能性空间。2。控制:人们根据自己的目的,改变条件,使得事物沿着可能性空间内某种确定的方向发展的做法。控制的结构 事物 控制者3。控制过程:控制前 控制时候,控制以后 控制是通过改变当时具体的条件来决定的。
一切控制过程由三个基本环节构成:第一个环节:了解事物面临的可能性空间是什么。第二个环节:在可能性空间中选择某一个状态集合为目标。第三个环节:控制条件,使得事物向既定的目标转化。4。控制论是关于控制的理论。5。可能性是事物的矛盾决定的。
控制可能性可以使得可能性减少,增大,保持。
现在来思考一个东西:主体b能采取的行动。控制:人们根据自己的目的,改变条件,使得事物沿着可能性空间内某种确定的方向发展的做法。我们的面前有两个主体,分别为:主体a,主体b其中一个主体a有着自己的发展方向,发展方向至少有两种。另一个主体b有着自己的目的,这种目的导致主体b偏向于主体a的发展偏向于某些未来。 进而采取行动去使得a偏向于这些未来。主体能采取的行动集合的差异性。行动集合的大小。举个例子联想:富人的行动集合和穷人的行动集合在社会中是不一样的。富人可以买到各自东西,随意决定自己是否去旅游等等,而这是穷人做不到的。每个人努力地学习,挣钱,基本都是为了扩大自己的行动集合,能做出更多的选择。而并不是自己的行动集合只有一小个,只能选择待在某个地方,不敢出去。
等质可能性
对于人来说,只要鸟处在被任意一个网格的状态就行。那么任何一个网孔对于人来说都是一样的,都是相同的作用,都是等价的,等质的。网的增多,只是加大了控制的集合,也就是让鸟被控制的可能性增大。这样子,人就可以轻松地在任何一个等质可能性中得到鸟被控制这个状态。也就是说,随着等质可能性的增多,鸟自由的可能性在减少,人去控制鸟花费的精力越少。
什么是控制能力呢?可能性空间缩得越小,标志着我们的控制能力越强。例如皮划艇在摇篮位面描述的三阶,控制住天地之间的原子,能直接控制原子。而不是只能控制一团石头之类的东西。可能性空间的前后集合比可以理解为 控制能力。用控制前的可能性集合/控制后的集合,称呼为k值,k值越大,那么控制能力越强。例如,直接把飞鸟从自由自在的状态直接约束在手中,那么这种控制能力是非常强的。也有类似的例子:筷子夹苍蝇。
我们先从网络开始。一张网和一个网孔的差别
一张网相比较一个网孔 更容易捕捉到鸟。用集合的思维来看,网是一个很大的集合,网孔是一个很小的集合。把这两个集合贴在鸟自由飞翔的位置,速度之类的集合上。网的集合比网孔的集合占比更大。先简单点,直接上手难的我的思维搭建不起来。那么,等质空能行大概就可以这样做。正如从某地到某地的路有若干条。路相同的情况下,只要选择一条就行了,没必要揪着某一条特定的路走。等质可能性的意义在于让人们做事情的时候降低控制的难度。
控制能力人有控制能力,机械也有控制能力。
哈哈哈哈。我的猜想正确的。
我对控制能力的定义和作者的是一样的。前后可能性的比值。现在的问题,如何计算事物的可能性空间呢?
我们来同时列举一下例子:网捕飞鸟的例子:
网的面积/空间的表面积--地面面积 等于网的控制能力。一个立方体中。面积是一个侧面。那么控制能力就是:1/5。如果是一个网孔是一面的三百分之一。那么网孔的控制能力就是:1/5x300=1/1500
显然,后者比前者更难捕捉到鸟。秃头,我迷糊了。
要试着总结经验,这里的经验类比之前我研究存量系统的经验,就是量和量之间的单位要一致。体积比体积,面积比面积。不对。也可以利用以前研究相对表面积的思路来研究。用不同质的量来比较。用体积比上面积。体积/面积。把体积固定下来,网的面积越大,那么这个k值越大。也就是控制难度越低。鸟在体积中自由运动,比在网上可能性多得多。存疑,下一个。
这里的状态为什么是12x2,而不是 2的12次方?
幽魂:@白泽因为球没有编号,视为相同的球,它们之间可以任意排序列如编号1。2。3。的三个球有;正1 正2 正3正1 正2 负3正1 负2 负3负1 负2 负3负1 负2 正3负1 正2 正3正1 负2 正3负1 正2 负3正1 负2 负3这九种状态
控制类型。随机控制:碰运气,不达到目标值可能性空间不会缩小。 可能性空间一直在缩小。 神农尝百草。 随机控制依靠速度,这需要电子计算机 基础假设:自己需要的那个状态在可能性空间中。有记忆的控制:凡被证明不是目标的状态就不再当作选择对象了。记忆控制中的否定。目标被排除。共轭控制:研究如何将一门人们无法完成的工作变成能够完成的工作。
例子,曹冲称象:这里想要知道的大象的质量。对象的质量和石头的质量是相等的,是同一种量。量的属性相同。所以可以把象和石头归结为:具有同样属性的事物。在这个事物的其他属性中,添加不同的特征,例如大象肉做的,石头是各种无机物做的。这些相比较我们想要知道的重量来说,都是无关紧要的。不过,我们要称的是象的重量这种量,又要保证象的整体还在,象不死。那么我们可以去寻找 有一种和象的质量这种量等质的东西,而这种东西又可以被分割。可以用石头,也可以用钢铁。可以用人,可以用黄金。只要有重量,又可以被分割就行。液体,固体。
a过程的共轭控制。a过程是控制u事物的可能性的过程。l过程是使得f事物等价于u事物的过程l负过程是使得控制u事物的可能性空间等价于f事物的过程。
这个有点绕。我们现在来分析一下这个系统。首先,我们选择两个事物。u和f。研究这两个事物。首先,我们要证明两者在某方面具有等同的可能性空间。例如曹冲称象故事里面,大象和石头都具有重量,在重量上面是等质的。要控制大象质量的可能性空间和石头质量的可能性空间是等同的,要怎么证明可能性空间等同呢?也就是选择集合是相同的。选择集合具有质的差异。例如重量的可能性空间和体积的可能性空间是不同的。重量,体积,硬度。因此,当我们采用共轭控制的时候,两个事物 的可能性空间要是同质的。这是目前最简单的。下面我们来考察一下是否是这样?在卡文迪许测量引力常数的实验中,实验是这样进行的。
两个球的万有引力导致 线扭曲。
在扭曲中,通过测量镜子扭曲的光线的程度,反过来计算扭矩的扭曲程度。
这里我们用共轭控制的思路来解释一下。首先,我们能轻而易举地测量光线的扭曲程度。这是我们能做到的a过程。但是我们想要的是测量杆的旋转程度。我们想要把选择程度控制好,在某一个程度上下,量化。我们可以做得是,我们做等量代换,。例如一百块钱等于十个十块钱。可以用一百块钱买一袋米。只要两种量之间存在某种固定的转化比例关系就行。那么,这里我们实质上就是在把不同质的量按照比例转化为等质的量。例如,a量与b量存在1:10的关系。b量变化一百,a量变化是10。在这里,是先把b量先转化成为和a量同质的量。 这个量的大小是10。然后再把a量和b量转化为和a量同质的这个量 一比一对换。这个有什么用呢?我们的控制能力很小,可以通过容易控制的量来去不容易控制的量。只要知道容易控制的量的大小 和容易控制的量和不容易控制的量 的 转化比例就能知道不容易控制的量的大小。这样子,我们就能做到原先做不到的事情。这就是我们的控制能力增强了。事物的可能性空间缩减到那些小的可能性空间。那么,在这里,这种控制过程可以无限叠加吗?是的,可以的。例如,我们控制车上的电子设备,电子设备控制发动机,发动机控制汽车的运动。这是连续控制。在这里,我们控制电子设备,就达到了间接控制汽车的运动。这就让我们原先做不到的事情变成了可以做得到的事情。a的控制范围指的是什么?我们知道控制的定义。那么控制a能控制更多事物。也就是选择他们的可能性。
因此,通过共轭控制,我们把我们原先不能控制的事物变成我们能控制的事物。我们把我们能控制的事物集合为一个集合。把我们通过共轭控制以后能控制得事物集合为一个新集合。显然,新集合比集合大得多。集合就是原先的控制范围,新集合就是后来的控制范围。通过共轭控制,从集合到新集合, a过程的控制范围就扩大了。不同质的量的转化。我的思路是正确的,请看下面的例子。
在l过程中,l把控制对象的各种量按照比例转化为a能控制的量。l负 过程中,l负把a过程控制后的量转化为控制对象能处理的对象。可能性空间的处理发生在a过程中。l过程和l负过程都是在把各种不同质的量转化为a过程能控制的量。感受器是转化为a的量,效应器是把a量再转化出来。过程就是:转化,处理,再倒转化。
理解无障碍,万岁。哈哈哈哈哈哈哈哈哈。我构造存量系统和网络模型又有了新的素材。共轭控制。在网络中,用三个节点代表三个过程。转化,处理,逆转化。
首先,选择两个主体:鹰 兔要达到的目的是,抓住兔子,这样子就必须两者在空间上非常接近。也就是距离差尽可能地小。在这个过程中,是什么做的呢?第一步,眼睛观察,确定相对距离差,然后大脑处理以后,使得相对差减小。通神经系统把这个神经冲动转化为翅膀的动作。
第一步,把兔子的各种信息转化为大脑能处理的信息量。第二步,处理信息量,缩小可能性空间。第三步,把信息输出去,转化为翅膀能理解的信息量。
在这个过程中,是相对距离在减小。这个控制过程一次次地执行。在整体上就呈现出相对距离不断地减小。也就是距离兔子越来越近。在这里,展现的就是连续控制的思路。负反馈的本质在于设计一个目标查不断减少的过程,通过系统不断把自己控制后果比价,使得目标差在一次又一次控制中慢慢减少,最后达到控制的目的。
我们来分析一下啊这个过程,首先才能在一个目标差:可以是距离差,可以是高度差,可以是状态差。其次,这种目标差可以是细分的,不断分下去的。这里就出现问题,可分性。目标差到底可以分为几次。这里如果我们把这个问题具体化,例如运动几次就到底目的地点?目标差的可分性。那么,为什么要这样分呢?原因是选择主体的能力选择能力不足以一次性到底。只能一步步来,例如,我们 在千斤顶顶起轮胎的过程中。我们的目的是最后顶起来,这个状态和当前的状态有差值,我们要调整的是对千斤顶当前状态和最终状态的差值的差值 。
前行 执行计划:
很不错,我补充一点。目标不仅有渐进式的,还有类别并列式的。比如你要在书架上放书,随便一放,当然很容易,但是早的时候就可能非常困难,按分类摆放,找的话就很容易。但是按什么分类放这就很随意,然后人为摆出一个分类之间的规律,就会把它更简单化。同样一个大分类之间它也可以分,但如果分的太详细,对于小书架来说精力就得不偿失。这就需要根据实际情况考虑可分程度。
尤其是做数学,在解方程的时候约分,化简,因式分解,都可以在一步之内完成。但如果人为的定义,先约分,再化简,再因式分解,对我来说就会更好。(也是亲身经历所以感慨一下)(也是暖一下回答)
白泽:我们首先确认了目标差的可分性。现在我们来确认出现目标差以后自动出现某种减少目标差的反应。这个是什么呢?出现出现目标差,自动减少一部分目标差。这里体现的是目标差的可分性。那么行动以后,再次提取信息,还是有目标差。不过这个目标差比前一次的目标差小得多。在一次次地循环中,目标差正好符合我们的需求。假设一次能减少的目标差是k个单位总得目标差是v个单位。 最能接受的最小目标差是f,那么可以出现公式:v--kx第一,认识目标差的可分性,第二是,明确目标差是需要多次去减少的,第三个是,明确自己能接受的相对误差。
不对,我能接受的东西也是一个可能性区间。区间上限和区间下限。 最后的目标差要在能接受的可能性空间里面波动。
理解了,把区间上限和下限的差值绝对化就行。把f指示为差值的绝对值就搞定。/v-kx/总的目标差分为两种:一种是 调节以后减少的可能性空间,一种是还没减少的可能性空间。随着负反馈一次次地进行。前者在增加,后者在减少。我们的目的使得前者不断增加,后者不断减少。那么,这里就可以类比电脑提示下载文件进度的进度条。
我下载书的时候,会提示已经下载完成百分之几。已经下载完的就是对下载完成目标的逼近的累积。还没下载的就是我们要减少的可能性空间。因此,这里可以使用进度条来衡量控制的程度,到了那一步。结束。
负反馈过程中,控制能力的增大。之前说控制能力是定义为之前和之后的可能性空间的比值。和我的是倒过来的,这里采用作者的定义。
第一次是:a/b第二次是b/c。联系起来就是:a/b x b/c=a/c若是进行无穷次负反馈控制,那么控制能力是 最开始的可能性空间/最后的可能性空间
这显然比控制者单独控制一次时,之前和之后的比值大得多。因此,这里有,负反馈控制使得控制者的控制能力增强。
后面的问题提到这,确实是的。这个有什么用呢?导弹打基地。直接发出去攻击要求的控制能力太高,不如让导弹自己修改相对距离差。通过负反馈来完成,这就只需要把导弹发出去,不必调准的那么精确。对控制能力的要求不那么高。显然,朝着一个方向发射比朝着远处的一个点发射容易的多。
结束。
现在我们把这运用到 适应性系统中,该怎么说呢?也就是面临问题再去想怎么解决问题,而不是从开始就细细地去规划自己的详细道路,这要求的控制能力太高了。显然,一边做,一边解决问题,缩小自己和终极目标的差距。 这种做法比从开始就把以后的道路完全规划好容易做得到。例子在这里。发现镭的过程。特征,放射性超级强。采用的方式,一次次地冶炼。使得放射性越来越强,和目标差越来越小。
把所有的信息转化为辐射信息,观察和最终状态的差值, 然后大脑处理,减少信息的可能性空间,随后冶炼,再一次随后观察和目标差的大小,。。。老师和学生过程中的负反馈。目标:学生听懂。 使得学生的状态和听懂的状态无限接近。听懂的状态是通过什么来衡量的?知识点,会解释,会用。那么,可以从那些方面获得这些东西呢?提问,学生的表情,作业情况。这就知道学生的状态,或者和最终状态的差距。然后,老师针对性选择那些学生不懂得知识点来说。使得对方不理解得知识点减少,理解知识点增多。这里,老师的选择的可能性空间是:若干个知识点。通过学生的反馈,老师知道排除那些知识点,讲授那些知识点,最后使得讲授的知识点越来越少。这里的理解怪怪的,感觉不对。
可能性空间不能变化。应该是以学生现在状态和理想状态的差值来作为行动方向。老师要观察是这个。老师获得这个状态差以后,就要想办法减少这个状态差。错了。
应该是,理想状态的学生具有的知识是u个。学生现有状态的知识是f个。目标是要使得u-f的差值尽可能地小,。那么,老师观察以后,输出学生不懂的知识点,减少u-f得差值。老师在一次课堂中只能减少k个知识点。我们把最终的差值固定在五个知识点。那么这个过程就可以表示为:/u-kx/<5。因为知识点不可能在某个点波动。所以只能是:u-kx<5。这是对学生的控制过程。
那么我们来观察老师的可能性空间的减少。目标使得要讲授的知识点是u个,目标是使得自己需要讲的知识点是n个。只要学生反应实质懂了,那么就把一部分知识点排除,每次排除k个。那么。u-kx< n。 x就是需要讲授的次数,也就是上课的次数,例如我们的上课总是强调课时是多少多少就是在强调x。那么这里我们研究x的意义,是标准上课次数,标准控制次数等等。多了就容易赶,少了就会拖沓。不管多还是少都不能达到全面最佳。所以按照之前我制作的理解力地图,这里可以制作一个成本地图。从标准控制次数这个点往少或者多走。总的成本都在增加,good。负反馈和目的的关系。这里留下一个问题。负反馈是一种趋向目的的行为。负反馈到此结束。