Линейный оператор
yk =
aklxl (
k = 1, …,
n) (1)
или, коротко,
у = Ах (х ∈ Rn, у ∈ Rn) (2)
называется самосопряженным, если он равен своему сопряженному (А = А*), т. е. если
161
Ах = А*х ∀x ∈ Rn, (3)
иначе говоря, если матрица А симметрическая:
akl = alk (k,l = 1, …, n) (4)
(см. (3) и (3*) § 21). Мы считаем аkl и Rn действительными (см. ниже замечание 1).
Для самосопряженного оператора имеет место характерное равенство
(x, Аz) = (Ах, z) ∀x, z ∈ Rn
(см. § 21, (4)). Очевидно,
(x, Az) =
xk aklxl =
aklxkxl (
akl = alk). (4')
Выражение справа в (4') называется квадратичной формой n-го порядка. Это непрерывная функция от вектора х или, что все равно, от переменных x1, ..., хп.
Будем рассматривать эту функцию на множестве S значений х, имеющих единичную норму (|х| = 1). Множество S есть сфера в Rn радиуса 1 с центром в точке 0. S - ограниченное множество. Кроме того, оно замкнуто 1): если точки последовательности {xν} (ν = 1, 2, ...) принадлежат к S (т. е. |xv| = 1, ν = 1, 2, ...) и эта последовательность стремится к некоторой точке х0 ∈ Rn (xν → х0, ν → ∞), то неминуемо х0 ∈ S, т. е. |х0| = 1, потому что |1 -|x0|| = ||xν| - |x0|| ≤ |xν = x0| → 0, откуда |x0| - 1.
Найдем максимум квадратичной формы (4') на сфере S. Так как форма (4') есть непрерывная функция на замкнутом ограниченном множестве, то максимум ее на S достигается для некоторого единичного вектора х1 (|xl| = 1). Обозначим этот максимум через λ1:
λ1 = (Ах1, х1) ≥ (Ах, х) ∀ x : |х| = 1. (5)
Введем подпространство L', ортогональное к вектору x1, т. е. множество всех векторов v, каждый из которых
162
ортогонален к х1. В L’ возьмем произвольный единичный вектор v0 (|v0| = 1). Вектор
cos α ∙ х1 + sin α ∙ v0
зависит от α и имеет единичную норму
|cos α ∙ х1 + sin α ∙ v0| =
= (cos α ∙ х1 + sin α ∙ v0, cos α ∙ х1 + sin α ∙ v0)1/2 =
= (cos2α + sin2α)1/2= 1.
При α = 0 этот вектор обращается в х1. Но тогда функция
ψ(α) = (A(cos α ∙ xl + sin α ∙ v0), cos α ∙ xl + sin α ∙ v0)
достигает своего максимума в точке α = 0 (ψ(0) = (Ах1, х1)) и в силу необходимого условия экстремума
ψ’(0) = 0.
Вычислим эту производную. Имеем
ψ(α) = cos2α(Ax1, х1) + sin2α(Ax1, v0) + sin2α(Av0, v0).
Следовательно,
ψ’(α) = -sin2α(Ax1, x1) + 2cos2α(Ax1, v0) + sin2α(Ax0, v0)
и
ψ’(0) = 2(Axl, v0) = 0.
Мы получили, что вектор Аx1 ортогонален ко всем единичным векторам v0 ∈ L', следовательно, и к любым векторам v ∈ L'. Но тогда Аx1 отличается от x1 лишь множителем (см. следствие 1 в конце § 20), т. е.
Аx1 = λx1,
где λ - некоторое число.
Из первого соотношения (равенства) в (5), учитывая, что |x1| = 1, следует
163
λ1 = (λx1, x1) = λ.
Таким образом, мы доказали, что максимум квадратичной формы (4') на единичной сфере |х| = 1 достигается в некоторой точке х1,
При этом
Ax1 = λ1x1, |x1| = 1
Мы видим, что нетривиальный (не равный нулю) вектор х1 отображается при помощи оператора А в вектор λ1x1, ему коллинеарный.
Такой вектор называется собственным вектором оператора А, а число λ1 - принадлежащим этому вектору собственным значением.
Будем теперь рассматривать оператор А на подпространстве R1, определяемом как множество векторов л: (е Rn), ортогональных к вектору х1 (выше мы его обозначали через L'). R1 есть (я - 1)-мерное подпространство - в нем имеются ортонормированные базисы, состоящие из п - 1 векторов. Цель наша заключается в подыскании одного такого базиса, как мы увидим, естественно связанного с оператором А.
Важно подчеркнуть, что образ A(R1) подпространства R1 при помощи оператора А принадлежит к R1, потому что, если (х, х1) = 0, то
(Ах, x1) = (х, Ах1) = (х, λ1x1) = λ1(x, х1) = 0,
т. е. Ах ∈ R1.
Самосопряженность оператора А на R1 тривиальным образом сохраняется, потому что равенство
(Ах, у) = (х, Ау),
верное для всех х, у ∈ Rn, верно также для всех х, у ∈ R1.
164
Итак, мы теперь рассматриваем самосопряженный линейный оператор А на линейном подпространстве R1 измерения п - 1. К нему можно применить приведенные выше рассуждения и обнаружить в R1 существование единичного вектора х2 такого, что
Дело в том, что единичная сфера S1 в R1 определяется, очевидно, как множество единичных векторов х, ортогональных к х1. При этом
Ах2 = λ2х2.
Мы нашли второй собственный вектор оператора А -вектор х2 и принадлежащее к нему собственное значение λ2, очевидно, не превышающее λ1 (при уменьшении области рассмотрения максимум может только уменьшиться). При этом (х1, х2) = 0.
Подобным образом можно ввести подпространство R2, измерения п - 2, ортогональное к векторам х1 и х2, показать, что оператор А отображает R2 в R2 и определить третий единичный вектор х3, ортогональный к х1 и к х2 такой, что для него имеет место
и
Ах3 = λ3х3 (λ3 ≤ λ2 ≤ λ1).
Продолжив этот процесс по индукции до n-го вектора хп, мы получим ортонормированную систему векторов
λ1, λ2, …, λn (6)
и систему действительных чисел
165
λ1, λ2, …, λn, (7)
обладающих свойствами
(8)
Мы получили полную систему собственных векторов оператора А и принадлежащих им собственных значений. Так как ортонормированная система (6) принадлежит к Rn и состоит из п векторов, то она есть базис в Rn (см. § 17). Поэтому произвольный вектор x ∈ Rn можно разложить по этой системе:
x =
(
x, xk)
xk (9)
Тогда наш самосопряженный оператор А может быть записан следующим образом:
Мы доказали теорему.
Теорема 1. Самосопряженному оператору А в пространстве Rn соответствует ортогональная система векторов х1,.... хп (базис Rn) и система действительных чисел λ1, …, λп такие, что Ах для любого х ∈ Rn представляется в виде суммы (10).
Квадратичная форма (4') соответственно записывается следующим образом:
На практике часто мы исходим из некоторой квадратичной формы
166
aklxkxl (
akl =
alk)
Чтобы применить к ней полученные результаты, можно определить в связи с ней линейный оператор
y = Ах,
определяемый равенствами
y1 =
aijxj (
i =1, …,
n)
В силу условия akl = alk это самосопряженный оператор, и к нему применима теорема 1. На языке квадратичной формы теорема 1 может быть переформулирована следующим образом.
Теорема 2. Пусть задана квадратичная форма (4') в n-мерной системе координат x1 ..., хп пространства Rn с ортами i1, ..., in
. Существует прямоугольная система координат ξ1, ..., ξn с ортами х1, ..., хп, образующими ортогональный базис
, и система действительных чисел λ1, …, λn такие, что квадратичная форма (4') в этой системе есть сумма квадратов координат ξ8 вектора х, помноженных соответственно на числа λ8:
aklxkxl =
λ
sξ
(4’’’)
167
Переход от левой части (4’’’) к правой можно осуществить, если известны разложения векторов x1, ..., хn по ортам i1, ..., in. Пусть
xj =
β
jsis
(см. § 17, (7), где надо заменить ajs, ak соответственно на βs, хj). Так как i1, ..., in и х1 ..., хп - ортонормированные базисы в Rn, то матрица
Λ = ||βjs||
ортогональная. Мы считаем, что она известна. Один и тот же вектор х можно разложить по двум базисам:
x =
xsis =
ξ
jxj
Но тогда
и в силу линейной независимости системы i1, ..., in получим
xs =
β
jsξ
j (
s = 1, …,
n) (11)
Таким образом, переход от координат ξ1, ..., ξn к координатам x1, ..., xn осуществляется посредством матрицы Λ', транспонированной к Λ (т. е. с помощью строк матрицы Λ' или столбцов матрицы Λ).
Если подставить выражения (11) для хs в левую часть (4’’’), то должны получить правую. Запишем это равенство:
168
где
- символ Кронекера.
Если приравнять коэффициенты при одинаковых ξjξi, то получим равенства
которые можно трактовать следующим образом (см. § 15, (6)). Для матрицы
А = ||akl|| (akl = alk)
самосопряженного оператора А существует ортогональная матрица
Λ = ||βjs||
такая, что
Λ ∙ A ∙ Λ-1 = H,(12)
где H - некоторая диагональная матрица
H =
(13)
(λi - действительные числа), называемая канонической.
169
Отметим, что для ортогональной действительной матрицы Λ
Λ-1 = Λ'.
Так как определители ортогональных матриц |Λ| = |Λ-1| = ±1, то из (12) следует
(14)
Мы доказали, в частности, следующую теорему.
Теорема 3. Если определитель |Λ| самосопряженной матрицы А не равен нулю (|Λ| ≠ 0), то все ее собственные числа λ1, ..., λп не равны нулю (λj ≠ 0, j = 1, ..., п).
Из теоремы 2 следует, что
- 1) Если λ1 ≥ ... ≥ λn > 0, то квадратичная форма положительная для любых векторов ξ ≠ 0, а следовательно, и любых векторов х ≠ 0. В этом случае она называется строго положительной.
- 2) Если 0 ≥ λ1 ≥ λ2 ≥ ... ≥ λn, то форма отрицательная для любых ξ ≠ 0, следовательно, и любых x ≠ 0. В этом случае она называется строго отрицательной.
- 3) Если λ1 ≥ ... ≥ λn и λn = 0, то форма неотрицательная. Существует направление, (ось ξn), вдоль которого она равна нулю. Это положительная форма, но не строго.
- 4) Если λ1 = 0 ≥ λ1 ≥ ... ≥ λn, то форма отрицательная не строго.
- 5) Если λ1 ≥ 0, а λn < 0, то форма неопределенна. Если исключить нулевую точку, то вдоль оси ξ1 она положительная, вдоль же оси ξn - отрицательная.
Оказывается, что по виду матрицы ||А||, по знаку некоторых порождаемых ею определителей можно узнать, будут ли ее собственные числа все положительные, все отрицательные или среди них есть как положительные, так и
170
отрицательные. В этом заключается теорема Сильвестра1.
Составим ряд главных миноров квадратичной формы (Ах, х):
Согласно теореме Сильвестра, которую мы не доказываем, имеют место следующие утверждения:
- Если Δ1 > 0, Δ2 > 0, ..., Δn > 0, то форма строго положительна (случай 1)).
- Если Δ1 < 0, Δ2 > 0, Δ3 < 0, ..., (-1)nΔn > 0, то форма строго отрицательная (случай 2)).
- Если Δ1 > 0, Δ2 > 0, ..., Δn > 0 или Δ1 < 0, Δ2 > 0, ..., (-1)nΔn > 0
и имеется у, при котором Δj = 0, то форма заведомо не строго определенна.
- Во всех остальных случаях квадратическая форма неопределенна.
Замечание 1. Если Rn - комплексное пространство, a akl = alk - по-прежнему действительные числа, то рассуждения, приведенные выше, мало отличаются. Формула (4') теперь записывается так:
(x, Ax) =
xk aklxl =
aklxkxl.
Число (х, Ах) остается действительным, потому что
(x, Ax) =
aklxkxl =
alkxkxl =
aklxkxl =
= (
x, Ax)
171
Это показывает, что приведенные выше факты (формулы (4')-(10)) остаются неизменными, в частности числа λ1, ..., λn и в случае комплексного Rn действительны. Теорема 1 полностью сохраняется для комплексного Rn. Формула (4") теперь имеет вид
(x, Ax) =
λ
s |(
x, xs)|
2,
т. е. теперь уже квадраты чисел (х, xs) надо заменить на квадраты их модулей. Формула (4’’’) теперь уже выглядит следующим образом:
aklxkxl =
λ
s|ξ
s|
2,
а в остальном теорема 2 остается в силе.
Замечание 2. Отметим, что действительность собственных значений самосопряженного линейного оператора А и Rn (действительном или комплексном) можно доказать следующим образом. Пусть λ - собственное значение оператора А и x0 (|x0| = 1) - принадлежащий к нему собственный вектор. Так как Ах0 = λx0, то
λ = λ(x0, x0) = (λx0, x0) = (Ax0, x0) = (x0, Ax0) =
= (x0, λx0) = λ(x0, x0) = λ.
Ортогональность собственных векторов оператора, при надлежащих разным собственным значениям, тоже можно доказать непосредственно.
В самом деле,
Ах1 = λ1х1, Ах2 = λ2х2
(|x1| = 1, |x2| = 1, λ1 ≠ λ2),
тогда
172
λ1(x1, x2) = (λ1x1, x2) = (Ax1, x2) = (x1, Ax2) =
= (x1, λ2x2) = λ2(x1, x2) = λ2(x1, x2).
Так как λ1 ≠ λ2, то (x1, x2) = 0.
173
1См. нашу книгу "Высшая математика. Дифференциальное и интегральное исчисление", § 8.12.
1Дж. Дзк. Сильвестр (1814-1897) - английский математик.