http://www.math.hut.fi/teaching/v/3/02/L/L2.html

Päivitetty 12.9.2002 HA

Luento 2-3

ke-to 11-12.9.02 Vektoriavaruuden abstrakti määr.:
[TE] s. 1,
[LAY 3] Luku 4 s. 215 ->, aksiomat s. 217.
[KRE] s. 358 - 360, aksiomat s. 359, motivaatio s. 358.

Referenssejä

[TE] Timo Eirola: Lineaarialgebran perusteet (luentopruju)
[LAY] Lay: Linear Algebra
KRE CH 6
LAODE CH 5 Vector spaces s. 185 ->
Strang: Intro to Linear Algebra
Kivelä: 1) AG, 2) Matriisilasku ja LA

Vektoriavaruus

Motivaatio Matemaattiset siemenet, joita on kylvetty Rⁿ:ssä, puhkeavat kukkaan astuessamme abstraktion puutarhaan. Lineaarialgebran kauneus ja voima näkyy selvemmin, kun ryhdytään katsomaan Rⁿ:ää, geometristen vektoreiden joukkoa ym. esimerkkeinä yleisestä abstraktista vektoriavaruudesta.
Tilanne voidaan tiivistää kahdeksaan perusominaisuuteen, joista koko teoria on johdettavissa.
Tämä on aivan tyypillinen prosessi kaikessa matematiikassa.

Kannattaa siis palauttaa mieleen konkreettiset perusmallit:

Geometriset vektorit tasossa tai 3-ul. avaruudessa
Avaruudet Rⁿ ja Cⁿ

Avaruus R³ saadaan 3-d geometrisesta vektorimallista ottamalla kolme kiinteää vektoria (jotka eivät ole saman tason suuntaisia) koordinaattiakseleiksi (esim. suorakulmaiset perusvektorit) ja tarkastelemalla origosta alkavan paikkavektorin kärjen koordinaattien muodostamaa jonoa.

Tavalliset vektorilaskusäännöt : yhteen- ja vähennyslasku sekä skalaarilla (reaaliluvulla) kertominen ovat tällöin sitä, että

      u+v = (u₁+v₁,u₂+v₂,u₃+v₃)     cu = (cu₁,cu₂,cu₃)

Avaruudet Rⁿ ja Cⁿ

Edellä sanottu yleistyy ottamalla vektoreiksi jonot v=(v₁,v₂,...,v_n). Jos vektorin komponentit v_i ovat reaalisia, on kyseessä reaalinen vektoriavaruus, tällöin skalaareina ovat reaaliluvut. Yhtä hyvin voimme tarkastella avaruutta Cⁿ, jolloin vektorin komponentit ja skalaarikertoimet ovat kompleksilukuja. Laskutoimitukset määritellään siis vastaavasti kuin yllä.

Rajoitumme esimerkeissämme aluksi reaalisiin, mutta perusteoriassa ei ole (juuri) mitään eroa kompleksitapaukseen nähden.

Vektoriavaruuden perusominaisuudet (aksiomat)

[KRE] s. 334 - 335, [Lay] 3 s. 217, [TE] s. 1

Avaruuden Rⁿ (yhtä hyvin Cⁿ) vektoreilla (u,v,...) (ja skalaareilla r,s,...) on seuraavat ominaisuudet:

  (v1) u+v = v+u        (vaihdantalaki)
  (v2) (u+v)+w = u+(v+w)(liitäntälaki)
  (v3) u+0 = u          (on olemassa nollavektori)
  (v4) u+(-u)=0         (jokaisella u on vastavektori -u)
  (v5) r(u+v)=ru+rv     (1. osittelulaki)
  (v6) (r+s)u=ru+su     (2. osittelulaki)
  (v7) r(su)=(rs)u      (skalaarilla kertomisen liitännäisyys)
  (v8) 1u=u             (skalaarilla kertomisen ykkösalkio)

Nämä ominaisuudet ovat välittömiä seurauksia reaali (kompleksi) lukujen vastaavista ominaisuukista.

Toisaalta aivan samat ominaisuudet voidaan johtaa geometrisessa vektorimallissa puhtaasti geometrisin päättelyin.

Hienous piilee siinä, että ottamalla nämä ominaisuudet aksiomiksi, voidaan johtaa koko vektoriavaruuksien perusteoria, jolloin saadaan saman käsittelyn alle monia muitakin olioita kuin äärelliset lukujonot ja geometriset vektorit.
Erityisen tärkeitä sovellusten (ja teorian) kannalta ovat monet funktioavaruudet sekä lukujonoavaruudet.

Vektoriavaruuden määritelmä Edellä luetellut ominaisuudet otetaan yleisen (abstraktin) vektoriavaruuden määritelmäksi. Olkoon V joukko ja K "lukukunta", oletamme että K=R tai K=C. Olkoon määritelty V:n alkioiden välinen laskutoimitus + : V x V -> V ja K:n ja V:n alkioiden välinen laskutoimitus " ": K x V -> V (Laskutoimituksen merkki on yleensä tyhjä, kuten kertolaskussa) siten, että ominaisuudet (v1) ... (v8) ovat voimassa.
Tällöin sanotaan, että V on vektoriavaruus ja sen alkioita sanotaan vektoreiksi. Kunnan K alkioita (siis reaali- tai kompleksilukuja) sanotaan skalaareiksi .

Huom! Kun lähtökohtana ovat nämä 8 ominaisuutta ja vain ne, tulisi eräät ns. itsestäänselvyydet myös todistaa. (Oikeasti mikään ei ole "itsestään selvää".)

Esim: Osoita, että 0 x = 0 ja c 0=0 .
Tod:

0 x = (0+0) x = 0 x + 0 x    (v2).

Lisätään puolittain -(0 x) (0x:n vastavektori). Saadaan:

    0 =  0 x.

Jälkimmäinen aivan vastaavasti. mot.

Nämä ja muut vastaavat "itsestäänselvyydet" on käsitelty mm. vanhassa tutussa [LAODE]-kirjassa s. 189 - 189.

Painoasuhuom: Tästä lähtien emme jaksa "lihavoittaa" vektoreita, emmekä juurikaan harrasta ala-ja yläindeksejä, kirjoitamme usein u_i :n sijasta u[i]

Vektorialiavaruus

[TE] s. 2 Määr. 1.2., [LAY] s. 220 subspace

Vektoriavaruuden V aliavaruudella tarkoitamme epätyhjää V:n osajoukkoa W, joka on "suljettu" laskutoimitusten suhteen, ts.

     u in W ja v in W        ==> u+v in W
     u in W , r in R (tai C) ==> ru in W

(Pahoittelen notaatiota, mutta HTML-kieli on rajoitettua, käytämme sanaa "in" joukkoon kuulumismerkkinä.)

Aliavaruudessa pätevät kaikki ominaisuudet ((v1) - (v8)) tietysti. Ts. aliavaruus on osajoukko, joka on itse vektoriavaruus, kun käytetään niitä laskutoimituksia, jotka perusavaruudelta V periytyvät.

Selvitä itsellesi, että 0-vektori on aliavaruudessa ja kunkin vektorin vastavektori! (Huomaa, että edellisessä tarvitaan oletusta "epätyhjä". )

Geometrinen havainnollistus

Muistathan aina tuon tuostakin miettiä, mitä jokin käsite tarkoittaa havainnollisessa geometrisessa maailmassamme. Ajatusviiva ---------

2-d-tasossa aliavaruuksia ovat O:n kautta kulkevat suorat (ja koko avaruus) (ja triviaalilla tavalla pelkkä O).
3-d-avaruudessa aliavaruuksia ovat koko avaruuden ja pelkän O:n lisäksi

O:n kautta kulkevat suorat
O:n kautta kulkevat tasot

Viritelmä.

[TE] Määr. 1.3, Lay: s. 221: A subspace spanned by a set

Olkoot u₁,...u_m in V.
Kaikkien lineaarikombinaatioiden joukkoa merk.

sp({u₁,...,u_m}) . Se koostuu muotoa

                                  m
                                -----
                                 \
                                  )   c_i u_i
                                 /
                                -----
                                i = 1

olevista summista, missä c_i:t ovat mielivaltaisia skalaareja. Joukkoa sp({u₁,...,u_m}) kutsutaan vektorien u₁,...,u_m viritelmäksi ( "span") .

Viritelmä on V:n aliavaruus, koska

Kahden lineaarikombinaation summa on lineaarikombinaatio
skaari kertaa lineaarikombinaatio = lineaarikombinaatio

Sanonta: Vektorit u₁,...,u_m virittävät (ali)avaruuden V, jos V=sp({u₁,...,u_m}).

Lineaarinen riippuvuus/mattomuus `LRV/LRT`

[TE] Määr 1.4 s. 3
[Lay] a. 237 Linearly independent sets, bases
[KRE8] s. 332 , (Rⁿ:ssä)

Aiemmin olemme kohdanneet nämä käsitteet Rⁿ:n vektorien yhteydessä. Nyt määrittelemme ne yleisen vektoriavaruuden (abstrakteille) vektoreille. Määritelmät ovat muodollisesti täsmälleen samoja.

Tarkastellaan vektoriyhtälöä

      c₁u₁ + c₂u₂ + ... + c_mu_m = 0

Tämä toteutuu, jos c₁=c₂= ... = c_m=0. (Triviaali ratkaisu)

Kaksi mahdollisuutta:

Muita ratkaisuja ei ole. Tällöin sanomme: Vektorit u₁,u₂,...,u_m ovat lineaarisesti riippumattomia (LRT)
Muita ratkaisuja on. Tällöin sanomme: Vektorit u₁,u₂,...,u_m ovat lineaarisesti riippuvia (LRV)

Havainnollisesti ...

Lause. ([TE] Lause 1.1) Vektorit u₁,u₂,...,u_m ovat LRV,
jos ja vain jos
Jokin u_k on muiden lineaarikombinaatio.

Tod. (1) Oletetaan LRV. Tällöin on olemassa kertoimet c₁, ..., c_m, joista jokin # 0, s.e. yhtälö

      c₁u₁ + c₂u₂ + ... + c_mu_m = 0

toteutuu. Jaetaan tällä kertoimella (kun kerran on lupa) ja siirretään muut termit toiselle puolelle.

(2) Käänteinen puoli vastaavasti.

[QED]

Havainto 1. Jos 0-vektori on mukana vektorijoukossa, se on LRV.
Tietysti, koska voidaan valita 0-vektorin kertoimeksi mikä vain, vaikka 1 ja muiden vektorien kertoimiksi 0, näin saadaan ei-triv. lineaarikombinaatio, joka tuottaa 0-vektorin.

Havainto 2. LRT-joukon osajoukko on LRT, LRV-joukon ylijoukko on LRV.
Riittää selvittää vaikkapa jälkimmäinen: Olkoon {a₁,...,a_m} LRV . Tällöin on olemassa kertoimet c₁,...,c_m siten, että

      c₁a₁ + c₂a₂ + ... + c_ma_m = 0

ja jokin c_i#0 . Jos joukkoon otetaan uusia jäseniä, niin laitetaan ne summaan jatkoksi 0-kertoimilla varustettuna. Näin saadaan edelleenkin ei-triv-lin. kombinaatio (äskeinen c_i on mukana), joka antaa 0-vektorin.

Edellinen seuraa "kontrapositiolla", eli jos LRT joukolla olisi LRV osajoukko, niin tällä LRV-joukolla olisikin LRT ylijoukko, mikä on ristiriidassa edellä osoitetun kanssa.

Miten selvitetään LRT / LRV Rⁿ:ssä

No tämähän on tuttua entuudestaan, mutta kertaus ...

Esim. Ovatko vektorit

a[1] := [3, 0, 2, 2], a[2] := [-6, 42, 24, 54],a[3] := [21, -21, 0, 15]

LRT / LRV ?

Kyse on siis siitä, onko vektoriyhtälöllä

      c₁a₁ + c₂a₂ + c₃a₃ = 0

pelkästään triviaaliratk., vai onko muitakin.

No ei muuta kuin kirjoitetaan vektoriyhtälömme komponenttimuodossa (käytämme Maplea tekstinkäsittelyyn):


                            [3]        [-6]        [ 21]
                            [ ]        [  ]        [   ]
                            [0]        [42]        [-21]
                       c[1] [ ] + c[2] [  ] + c[3] [   ]
                            [2]        [24]        [  0]
                            [ ]        [  ]        [   ]
                            [2]        [54]        [ 15]

Yhdistämme komponentit (eli siirrymme sarakeajattelusta riviajatteluun):

                         [3 c[1] - 6 c[2] + 21 c[3] ]
                         [                          ]
                         [    42 c[2] - 21 c[3]     ]
                         [                          ]
                         [     2 c[1] + 24 c[2]     ]
                         [                          ]
                         [2 c[1] + 54 c[2] + 15 c[3]]

Kysymys on siis yhtälösysteemin Ac = 0, missä


                                  [3    -6     21]
                                  [              ]
                                  [0    42    -21]
                             A := [              ]
                                  [2    24      0]
                                  [              ]
                                  [2    54     15]

ratkaisuista.

Yleinen menettely Rⁿ:n vektorien LRV/LRT selvitykseen

Huomaamme siis, että tutkittavat vektorit ladottiin sarakkeiksi matriisiin A . Sitten on vain tehtävänä tutkia homogeeniyhtälön (siis yhtälön, jossa oikea puoli on 0-vektori) ratkaisujen lukumäärää.

    (1) Jos on pelkkä 0-ratkaisu (triv. ratk.), niin LRT.
    (2) Jos on muitakin, niin LRV

Homma johtaa siis Gaussin eliminaatioon:

> ref(A); # Oma alias ref
                               [3    -6     21]
                               [              ]
                               [0    42    -21]
                               [              ]
                               [0     0     30]
                               [              ]
                               [0     0      0]

Toiseksi alimmainen yhtälö: 30c[3] = 0 , joten c[3] = 0. Siitä kun edetään ylöspäin, saadaan c[2] = 0 , c[1] = 0.
(Tai suoraan: Jokainen sarake on pivot-sarake)

Johtopäätös: LRT

päivitysraja 12.9.02

Tästä eteenpäin vanhaa tekstiä, joka saattaa sisältää viitteitä vanhempiin painoksiin (ja asiattomia linkkejäkin). Asiat ovat sinänsä oikein, mutta esityksen logiikkaa kannattaa pikemmin seurata [TE]-monisteesta ja/tai luentoprujuista.

Kanta(basis) ja dimensio

KRE 7.5 s. 354, GRE1, 2.9 s. 50, GRE2 9.9. s. 448, STR 3.4 s. 140 (vanha painos)

Monia yhtäpitäviä tapoja määritellä. Otetaan lähemmin GRE:n esitystä mukaileva, itse asiassa tarkalleen STR:n mukainen.

Määritelmä. Vektoriavaruuden V kanta on vektorijoukko {e[1],e[2],...,e[m]}, joka

   1. on LRT
   2. virittää V:n

Havainnollisesti: 2 eri suuntaista vektoria tasossa on tason kanta, 3 vektoria, jotka eivät ole saman tason suuntaisia, muod. 3-d-avaruuden kannan.

Lause Jos {e[1],e[2],...,e[m]} on V:n kanta, niin jokaisella vektorilla v in V on yksikäsitteinen esitys muodossa
(Tämä on GRE-määritelmä.)

> sum(c[i]*e[i],i=1..m);  
                                  m
                                -----
                                 \
                                  )   c[i] e[i]
                                 /
                                -----
                                i = 1

Määritelmä. Vektoriavaruuden V dimensio on maksimimäärä LRT vektoreita, joka avaruuteen mahtuu. Tätä lukua merk dim V Jos äärellistä ylärajaa LRT-vektoreille ei ole, sanotaan, että avaruus on ääretönulotteinen.

Peruslause. Jos avaruudella V on kanta, jossa on m vektoria, niin dim V = m.

Tod. Olkoon {e[1],e[2],...,e[m]} avaruuden V kanta. Koska kanta on LRT, on
dim V >= m.

Jää siis näytettäväksi käänteinen puoli. Ts. osoitettava, että jokainen m+1 vektorin joukko on LRV.

Olk. {f[1],f[2],...,f[m+1]} mielivaltainen m+1 vekt. joukko. Koska {e[1],e[2],...,e[m]} on kanta, voidaan jokainen f[i]-vektori lausua kantavektoreiden e[k] lineaarikombinaationa:

> f[1]:=sum(a[1,k]*e[k],k=1..m);
                                    m
                                  -----
                                   \
                          f[1] :=   )   a[1, k] e[k]
                                   /
                                  -----
                                  k = 1

> f[m+1]:=sum(a[m+1,k]*e[k],k=1..m);
                                    m
                                  -----
                                   \
                      f[m + 1] :=   )   a[m + 1, k] e[k]
                                   /
                                  -----
                                  k = 1

Meidänhän piti tutkia f[k]-vektoreiden LRV:tä. Siksi muodostetaan yhtälö

      c[1]f[1] + c[2]f[2] + ... + c[m+1]f[m+1] = 0

Sijoitetaan tähän yhtälöön f[k]-vektorit lausuttuna e[k]-vektorien avulla. Kun kerätään kunkin e[k]:n kerroin yhteen ja käytetään hyväksi e[k]-vektorien LRT:tta, päädytään lineaariseen yhtälösysteemiin, jonka matriisi on

       [a[1, 1]     a[2, 1]     ...    a[m+1,1] ]
       [                                        ]
       [a[1, 2]     a[2, 2]     ...    a[m+1,2]]
       [                                        ]
       ....

       [                                        ]
       [a[1, m]     a[2, m]     ...    a[m+1,m]]

ja tuntemattomat ovat c[1], ..., c[m+1].

Siis r <= m < m+1 = n ja bmato=0 (HY). Tällöin n-r >=1 vapaata parametria, joten äärettömän monta ratkaisua ja siis LRV, kuten piti osoittaa.

(Yleisestihän pätee: Jos HY:ssä on enemmän tuntemattomia kuin yhtälöitä, niin ratkaisuja on ääretön määrä, eli ei-triviaaleja ratkaisuja on, juuri yllä mainitusta syystä, muistathan myös otsikon "Tärkeä seurauslause homogeenisille systeemeille" tällä sivulla (L1) [QED]

Äärellisulotteisen avaruuden jokaisessa kannassa on siis yhtä monta vektoria

No selväähän se, jos V on tuo avaruus, niin kantavektoreita on dim(V) kpl.

Olisi peräti merkillistä, ellei pätisi:

Lause. dim Rⁿ=n

Tod. Vektorit e[1]=(1,0,...,0), e[2]=(0,1,0,...,), e[n]=(0,0,...,1)ovat LRT ja virittävät. Edellinen lause soveltuu siis.

Lause. dim(sp({u[1],...,u[m]})) = max määrä LRT vektoreita virittäjäjoukossa {u[1],...,u[m]}

Tod. Olkoon d mainittu max määrä. Numeroidaan vektorit niin, että {u[1],...,u[d]} ovat LRT, jolloin loput ovat lausuttavissa näiden lineaarikombinaatioina (muussa tapauksessa LRT vektoreita oliskin enemmän kuin d kpl.) Mutta kaikki sp({u[1],...,u[m]}):n vektorit voidaan lausua vektoreiden {u[1],...,u[d]}lineaarikombinaatioina (koska lineaarikombinaatioden lineaarikombinaatio on alkup. vekt. lin. komb.). Siten {u[1],...,u[d]}on sp({u[1],...,u[m]}):n LRT ja virittävä joukko, eli kanta.

Huom: Tämä voidaan yhtä hyvin ilmaista niin, että avaruuden sp({u[1],...,u[m]}) kanta saadaan valitsemalla maksimaalinen LRT joukko virittäjävektoreita.

Avaruuden Rⁿ n:n vektorin joukko: Kantaan riittää toinen: LRT tai VIR

Lause (lkm=dim => (VIR<=>LRT)). Jos dim V = m ja jos {u[1],...,u[m]} on LRT tai virittää, niin se on V:n kanta.
Tod
(1) Jos {u[1],...,u[m]} on LRT, niin sen on pakko virittää, sillä virittämättömyydestä seuraisi sellaisen vektorin löytyminen, joka yhdessä näiden kanssa muodostaisi LRT joukon, vastoin dimension maksimaalisuutta.

(2) Jos {u[1],...,u[m]} virittää, niin se ei voi olla LRV, sillä muutenhan saataisiin vähemmän vektoreita sisältävä kanta pudottamalla tuo tarpeeton lineaarikombinaatio pois. (Jos jäljelle jäävä joukko olisi vieläkin LRV, niin jatkettaisiin pudottamista siis niin, että viritysominaisuus olisi koko ajan voimassa.)

This page created by mailto:Heikki.Apiola@hut.fi