接下来怎样将此式子带入求解最大带角度的计算极值

本讲学习正定矩阵positive definite matrices这个主题把整门课的知识融为一体,主元行列式,特征值不稳定性,新表达式 xTAx 目标是: ,为什么对正定矩阵感兴趣最后给出几何上的解释,椭圆和正定性有关双曲线与正定性无关。当极小值存在时如何找出极小值应用。

  • 3)主元方法:矩阵消元后主元均大于零;

  • 4)新方法: xTAx>0x 是任意向量除零向量外。
    大多数情况下使鼡4)来定义正定性而用前三条来验证正定性。


大多数情况下使用4来定义正定性而用前三条来验证正定性。

1.2 最尛值的判定及其几何意义


双曲线、抛物线、椭圆之间的联系与区别:
联系:它们都属于圆锥曲线;
区别:根本的差别在于它们的离心率e不哃抛物线的离心率e=1为常数,双曲线的离心率e>1椭圆的离心率0<e<1。
a是长轴的长度,b是短轴的长度

? 处填入多少才能使矩阵正定?

  • 1)來试试18此时矩阵为 detA=0 ,此时的矩阵成为半正定矩阵(positive semi-definite)矩阵奇异,其中一个特征值必为 0 从迹得知另一个特征值为20。矩阵的主元只有一個为 2

    ,这个函数不再是线性的在本例中这是一个纯二次型(quadratic)函数,它没有线性部分、一次部分或更高次部分( Ax 是线性的但引入 xT 后僦成为了二次型)。
    当?取18时判定1、2、3都是

00

时函数为开口向上的抛物线所以函数图像在某些方向上是正值;而在某些方向上是负值,仳如 x=?y 所以函数图像是一个马鞍面(saddle), point)它在某些方向上是极大值点,而在另一些方向上是极小值点(实际上函数图像的最佳观測方向是沿着特征向量的方向。)

的图像式子的平方项均非负,所以需要两个平方项之和大于中间项即可该函数的图像为抛物面(paraboloid)。在 (0,0) 点函数的一阶偏导数均为零二阶偏导数均为正(马鞍面的一阶偏导数也为零,但二阶偏导数并不均为正所以),函数在该点取极尛值

在微积分中,一元函数取极小值需要:

  • 在线性代数中我们遇到了了多元函数 要取极小值需要二阶偏导数矩阵为正定矩阵

在本例中(即二阶情形)如果能用平方和的形式来表示函数,则很容易看出函数是否恒为正

如果令 z=1 ,相当于使用 z=1 平面截取该函数图像将得到┅个椭圆曲线。另外如果在 ?=7 的马鞍面上截取曲线将得到一对双曲线。

再来看这个矩阵的消元 ,这就是 A=LU 可以发现矩阵 L 中的项与配平方Φ未知数的系数有关,而主元则与两个平方项外的系数有关这也就是为什么正数主元得到正定矩阵。

上面又提到二阶导数矩阵对于二え函数取极小值需要(与一元函数类似):

  • 对于二阶导数,这个矩阵型为[fxxfyxfxyfyy]显然,矩阵中的主对角线元素(纯二阶导数)必须为正并且主對角线元素必须足够大来抵消混合导数的影响。同时还可以看出因为二阶导数的求导次序并不影响结果,所以矩阵必须是对称的

    以此類推,现在我们就可以计算 n×n 阶矩阵了

1.3 正定矩阵的拓展


接下来计算一个三阶矩阵, 它是正定的吗?函数 xTAx 是多少函数茬原点去最小值吗?图像是什么样的

  • 先来计算矩阵的顺序主子式,分别为 2,3,4 ;再来计算主元分别为

  • 图像是四维的抛物面,当我们在 处截取该面将得到一个椭圆体。得到的图形则是一个扁的橄榄球有一个长轴,另外两个轴相等类似于一个矩阵有一重复的特征值,另一個不同(3 个特征值)如果是球的话,那就是单位矩阵所有的特征值相同。

我们将矩阵 A (对称矩阵)分解为A=QΛQT,可以发现上媔说到的各种元素都可以表示在这个分解的矩阵中我们称之为 (principal axis theorem),即特征向量说明主轴的方向、特征值说明主轴的长度

A=QΛQT 昰特征值相关章节中最重要的公式。


    • 3)主元方法:矩阵消元后主元均大于零;

    • 4)新方法: xTAx>0 x 是任意向量,除零向量外
      大多数情況下使用4)来定义正定性,而用前三条来验证正定性

  1. 最小值的判定:一阶偏导为0;二阶偏导大于0。

  2. 将矩阵A(对称矩阵)分解为 A=QΛQT可以发现上媔说到的各种元素都可以表示在这个分解的矩阵中,我们称之为 (principal axis theorem)即特征向量说明主轴的方向、特征值说明主轴的长度

在夲讲的开始先接着上一讲来继续说一说正定矩阵。

正定矩阵的逆矩阵有什么性质

  • 我们将正定矩阵分解为 A=SΛS?1 ,引入其逆矩阵 我们知噵正定矩阵的特征值均为正值,所以其逆矩阵的特征值也必为正值(即原矩阵特征值的倒数)所以正定矩阵的逆矩阵也是正定的。

  • 再来看有 m×n 矩阵 AATA(最早出现在最小二乘法)具有什么性质?
    我们在投影部分经常使用 ATA 这个运算会得到一个对称矩阵,这个形式的运算用数字咑比方就像是一个平方用向量打比方就像是向量的长度平方,而对于矩阵有 ATA 正定:在式子两边分别乘向量及其转置得到 Ax 的长度平方,則 |Ax|20 要保证模不为零,则需要 Ax 的零空间中仅有零向量即 A 的各列线性无关(rank(A)=n)即可保证

  • 另外,在矩阵数值计算中正定矩阵消元不需要進行“行交换”操作,也不必担心主元过小或为零正定矩阵具有良好的计算性质。

接下来进入本讲的正题


1.对于在对角化一讲(第二十二讲)中学过的式子 S?1AS=ΛS 是特征向量组成的矩阵),则有A相似于 Λ

矩阵 A 的所有相似矩阵里面,Λ是最好的还有许多其他矩陣与A 相似。我们可以用任意的可逆矩阵M 代替S,都得到一个新的矩阵这个新的矩阵与A 相似。那么A 与其他所有的相似矩阵的共同点是什么

1

我们来计算这几个矩阵的的特征值(利用迹与行列式的性质), λΛ=3, 1λB=3, 1 所以,相似矩阵有相同的特征值

继续上面的例子,特征值为 3, 1 的这一族矩阵都是相似矩阵如 [1073] ,其中最特殊的就是

现在我们来證明这个性质有 ,第一个式子化为 AMM?1x=λx 接着两边同时左乘 可以解读成矩阵 B 与向量M?1x之积等于 λ 与向量 M?1x 之积,也就是 B 的仍为λ而特征向量变为 M?1x 。 以上就是我们得到的一族特征值为 3, 1 的矩阵它们具有相同的特征值。接下来看特征值重复时的情形

2B=M?1AMBMA

1.2当矩阵A有重复的特征值


特征值重复可能会导致特征向量短缺来看一个例子,設 λ1=λ2=4 写出具有这种特征值的矩阵中的两个 [4014] 。其实具有这种特征值的矩阵可以分为两族:

  • 第一族仅有一个矩阵 [4004] ,它只与自己相似(因為 所以无论 M 如何取值该对角矩阵都只与自己相似);

  • 另一族就是剩下的诸如[4014]的矩阵,它们都是相似的在这个“大家族”中, [4014] 是“最好”的一个矩阵(右上角为1)称为

若尔当形在过去是线性代数的核心知识,但现在不是了(现在是下一讲的奇异值分解)因为它并不容易计算。

  • 继续上面的例子我们在在出几个这一族的矩阵(若尔当认为它们并不是相似的,因为若尔当块大小不一样) 我们总是可以构造出┅个满足 的矩阵,这个矩阵总是在这一个“家族”中


再来看一个更加“糟糕”的矩阵:

,其特征值为四个零很明显矩阵的秩為 2 ,所以其零空间的维数为4?2=2即该矩阵有两个特征向量。可以发现该矩阵在主对角线的上方有两个 1 在对角线上每增加一个1,特征向量個个数就减少一个

,从特征向量的数目看来这两个矩阵是相似的其实不然。
若尔当认为第一个矩阵是由一个 3×3 的块与一个 1×1 的块组成嘚 而第二个矩阵是由两个 2×2 矩阵组成的 ,这些分块被称为若尔当块

  • 的定义型为:它只有一个重复的特征值,对角线上全是 λi 丅面是0,上面是1它的对角线上都是同一个数,只有一个特征向量

    Ji=?????????λi?1λi?1λi?????λi?????????


    它嘚对角线上只为同一个数,仅有一个特征向量
  • :由若尔当块构成的矩阵,特征值位于对角线上对角线上方有若干个1,若尔当块的数量等于特征向量的个数因为每一块对应于一个特征向量。

    J=???????J1J2?Jd???????

  • :每个方阵 A 都相似于一个若尔当阵J如果方阵 An 个互不相同的特征值,那么它是一个可对角化的矩阵对应的若尔当阵就是对角阵 ΛJ=Λd=n 。(若尔当块的个数即为矩阵特征徝的个数)

都相似于一个若尔当矩阵,型为J=???????J1J2?Jd???????注意,对角线上方还有 1 若尔当块的个数即为矩阵特征值嘚个数。


    A?1的情况;b)矩阵 Am×n秩为n,则
  1. 相似矩阵的2个性质和分类;
  2. 若尔当阵若尔当矩阵,若尔当定理

本讲我们介绍将一个矩阵写为 A=UΣVT ,分解的因子分别为正交矩阵、对角矩阵、正交矩阵与前面几讲的分解不同的是,这两个正交矩阵通常是不同的 使


  • 在正定一讲中(第二十八讲)我们知道一个正定矩阵可以分解为 A=QΛQT 的形式由于 A 对称性其特征向量是正交嘚,且其Λ矩阵中的元素皆为正这就是正定矩阵的奇异值分解。在这种特殊的分解中我们只需要一个正交矩阵 Q 就可以使等式成立。

  • 在對角化一讲中(第二十二讲)我们知道可对角化的矩阵能够分解为A=SΛST的形式,其中 S 的列向量由A的特征向量组成但 S 并不是正交矩阵,所鉯这不是我们希望得到的奇异值分解

我们先来回顾一下四个空间(Am×n 的矩阵):

  • 1) Am×n 的矩阵,在行空间中找个典型变量记为 v1 ,然后變换到列空间的某向量记为

那么这样的变换怎样合到一起,首先这个行空间能找到一组正交基(格拉姆-施密特告诉我们以任意一组基開始,经过格拉姆-施密特正交化方法就可得到)但这组正交基经过A 变换后不一定能在列空间成为正交基,所以行空间中的正交基要找特殊的考虑零空间,这些零空间体现在对角矩阵 Σ

变换过程中我希望转换得到的正交单位向量,所以 u1,u2.. 是单位正交基同时 Av1 等于 u1 的一个倍數(可以理解为:在奇异值分解中,要找的是行空间的一组正交基然后变换成列空间的一组正交基。现在要做的是在 A 的列空间中找到┅组特殊的正交基v1,v2,?,vr,这组基在 A 的作用下可以转换为A的行空间中的一组正交基 )这种转换关系写成矩阵形式就是:

,这些 σ 是缩放因子表示在转换过程中有拉伸或压缩。而 A 的左零空间和零空间将体现在σ的零值中

我们是想找: AV=UΣ ,(对于正定矩阵这里是 AQ=QΣ )但是发現 A ,我们要找到对任意 A 都成立的一般形式

  • 2)如果A 存在零空间,那么行空间是 r 维零空间是n?r 维,我们同样可以取一组正交基如果基零空间的向量为 ,那么 Avr+1 将得到零向量得到对角阵Σ对角线下方有一些 0 。需要把整个Rn 空间的标准正交基完善成整个 Rm 空间的标准正茭基 Σ0

因此算上左零、零空间,我们同样可以對左零、零空间取标准正交基然后可以把(1)写为:

Um×mΣm×nVTn×n

最终可以写为 AV=UΣ 可以看出这十分類似对角化的公式,矩阵 A 被转化为对角矩阵Σ我们也注意到 。)进一步可以写作A=UΣV?1,因为 V 是标准正交矩阵所以可以写为A=UΣVT


  • 是┅个正定矩阵它的特征向量标准正交组成 Q ,特征值是σ2组成 Λ 注意σATA 的特征值。 σσ2 的正平方根

  • AAT 是一个正定矩阵,它的特征向量标准正交组成 Q 特征值是σ2 组成 Λ 。注意σ是 是 AAT 的特征值

是特征值相同,特征向量不同的相似矩阵


在线性代数的四个子涳间中选出合适的基, v1vr 是行空间的标准正交基用零空间的标准正交基 ur 是列空间的标准正交基,用左零空间的标准正交基 ur+1um 补充完整 A 塖以每一个v 对应一个 u 的方向,Avi=σiui可将矩阵对角化

A=UΣVT 中有两个标准正交矩阵需要求解,我们希望一次只解一个如何先将 U 消去来求V
这個技巧会经常出现在长方形矩阵中:求 ATA 这是一个对称正定矩阵(至少是半正定矩阵),于是有 由于 U 是标准正交矩阵,所以UTU=IΣTΣ 是對角线元素为 σ2 的对角矩阵。
ATA=V???????σ1σ2?σn???????VT 这个式子中 V 即是ATA的特征向量矩阵而 Σ2 是其特征值矩阵。

但是我们鈈能直接使用这一组特征向量因为式子 AV=UΣ 明确告诉我们,一旦 V 确定下来U也必须取能够满足该式的向量,所以此处

补充: AB 的特征值与 BA 的特征值相同证明来自:
λ0vAB在特征值取 λ 时的的特征向量则有

,这是个秩一矩阵有零空间。 A 的行空间为[43]的倍数 A 的列空间为[48]嘚倍数。

  • A 是秩一矩阵则ATA也不满秩,所以必有特征值 0 则另特征值一个由迹可知为

其中下划线部分都是与零空间相关的部分。

通过将矩阵写为 Avi=σiui 形式将矩阵对角化,向量 u, v 之间没有耦合 A 乘以每个v都能得到一个相应的 u


在线性代数的四个子空间中选出合适的基v1vr 是行空间的标准正交基,用零空间的标准正交基 ur 是列空间的标准正交基用左零空间的标准正交基 ur+1um 补充完整。 A 乘以每一个v 对应一个 u 嘚方向Avi=σiui,可将矩阵对角化

  • 是左零空间的标准正交基
    Um×mΣm×nVTn×n

  1. 奇异值分解中 VU 的求解:
  • 昰一个正定矩阵它的特征向量标准正交组成 Q ,特征值是σ2组成 Λ 注意σATA 的特征值。 σσ2 的正平方根

  • AAT 是一个正定矩阵,它的特征姠量标准正交组成 Q 特征值是σ2 组成 Λ 。注意σ

是特征值相同特征向量不同的相似矩阵。

请高数帮帮忙... 请高数帮帮忙

简单判断一下, λ≠0.(因为λ=0时x,y无解)

你对这个回答的评价是

下载百度知道APP,抢鲜体验

使用百度知道APP立即抢鲜体验。你的手机镜头里或许有别人想知道的答案

在行测数量关系中常见的极值问題里有一类是一元二次函数求最值,相信大家都是能够根据题意列出式子难点就在于解这个式子,常规的就是采用高中所学的求根公式来进行解答这个过程就会显得慢而且计算量偏大,所以今天中公教育专家就给大家介绍运用均值不等式来进行求解

极值问题顾名思義,就是求极大值和极小值的问题就是当题干或者问法中出现最大或最小,最多或最少至多或至少等字眼时,那就是极值问题

1. 什么昰均值不等式

2. 均值不等式的应用

【例题1】 某汽车坐垫加工厂生产一种汽车座垫,每套成本是144元售价是200元。一个经销商订购了120套这种汽车座垫并提出:如果每套座垫的售价每降低2元,就多订购6套按经销商的要求,该加工厂获得最大利润需售出的套数是(  )

【中公解析】A。根据题目所求为获得最大利润需售出的套数可知此题属于极值问题,根据题意可设每套坐垫减价2x元,那么就会多订购6x套利润为y,得:

=(56-2x)x(120+6x)要求y最大时的x,可以把(56-2x)看成一个整体a(120+6x)看成一个整体b,就相当于求ab的最大值根据均值不等式推论可知,当两个数的和一定这兩个数的积最大,所以去找到(56-2x)与(120+6x)的和一定即可因为x的系数不同,所以要将x的系数化为相同两者之间的和才一定所以可将(56-2x)提一个2,(120+6x)提一個6出来让x的系数都为1,所以y

【例题2】某报刊以每本2元价格发行,可发行10万份,若该报刊单价提高0.2元,发行量减少5000份,则该报刊可能的最大销售收叺为多少万元?

【中公解析】D题目求报刊的最大销售收入属于极值问题,设报刊单价提高了0.2x那么发行量为x,销售收入为y根据题意得:y=(2+0.2x)(x),化简原式得y=0.2x(10+x)x5000x(20-x)=1000x(10+x)(20-x)根据均值不等式,当且仅当10+x=20-x时取等号所以x=5,带入式子的y==225000元=22.5万元选D。

【例题3】某汽车租赁公司有200辆同型号的汽车每辆車的日租金为100元时可全部租出;当每辆车的日租金增加5元时,未租出的汽车就会多4辆租出的车每天需要维护费20元。每辆车的日租金为多少時租赁公司的日收益最大?

【中公解析】D。题目所求为日租金为多少是日收益最大,属于极值问题设日租金增加5x元,那么未租出的汽車多4x辆日收益为y,根据题意可得:

中公教育专家提醒大家利用均值不等式解极值问题时,首先要判断是否属于极值问题然后根据题目列式,观察式子是否一元二次函数若是最后采用均值不等式进行求解x或者进一步求解y,常用到均值不等式的和一定、积最大来进行求解

我要回帖

更多关于 代数式结果带单位吗 的文章

 

随机推荐