http://www.math.hut.fi/teaching/v/3/02/L/L2.html
Päivitetty 12.9.2002 HA

Luento 2-3

ke-to 11-12.9.02 Vektoriavaruuden abstrakti määr.:
[TE] s. 1,
[LAY 3] Luku 4 s. 215 ->, aksiomat s. 217.
[KRE] s. 358 - 360, aksiomat s. 359, motivaatio s. 358.

Referenssejä

Vektoriavaruus


Motivaatio Matemaattiset siemenet, joita on kylvetty Rn:ssä, puhkeavat kukkaan astuessamme abstraktion puutarhaan. Lineaarialgebran kauneus ja voima näkyy selvemmin, kun ryhdytään katsomaan Rn:ää, geometristen vektoreiden joukkoa ym. esimerkkeinä yleisestä abstraktista vektoriavaruudesta.

Tilanne voidaan tiivistää kahdeksaan perusominaisuuteen, joista koko teoria on johdettavissa.

Tämä on aivan tyypillinen prosessi kaikessa matematiikassa.


Kannattaa siis palauttaa mieleen konkreettiset perusmallit: Avaruus R3 saadaan 3-d geometrisesta vektorimallista ottamalla kolme kiinteää vektoria (jotka eivät ole saman tason suuntaisia) koordinaattiakseleiksi (esim. suorakulmaiset perusvektorit) ja tarkastelemalla origosta alkavan paikkavektorin kärjen koordinaattien muodostamaa jonoa.

Tavalliset vektorilaskusäännöt : yhteen- ja vähennyslasku sekä skalaarilla (reaaliluvulla) kertominen ovat tällöin sitä, että

      u+v = (u1+v1,u2+v2,u3+v3)     cu = (cu1,cu2,cu3)
     

Avaruudet Rn ja Cn

Edellä sanottu yleistyy ottamalla vektoreiksi jonot v=(v1,v2,...,vn). Jos vektorin komponentit vi ovat reaalisia, on kyseessä reaalinen vektoriavaruus, tällöin skalaareina ovat reaaliluvut. Yhtä hyvin voimme tarkastella avaruutta Cn, jolloin vektorin komponentit ja skalaarikertoimet ovat kompleksilukuja. Laskutoimitukset määritellään siis vastaavasti kuin yllä.

Rajoitumme esimerkeissämme aluksi reaalisiin, mutta perusteoriassa ei ole (juuri) mitään eroa kompleksitapaukseen nähden.

Vektoriavaruuden perusominaisuudet (aksiomat)

[KRE] s. 334 - 335, [Lay] 3 s. 217, [TE] s. 1

Avaruuden Rn (yhtä hyvin Cn) vektoreilla (u,v,...) (ja skalaareilla r,s,...) on seuraavat ominaisuudet:

  (v1) u+v = v+u        (vaihdantalaki)
  (v2) (u+v)+w = u+(v+w)(liitäntälaki)
  (v3) u+0 = u          (on olemassa nollavektori)
  (v4) u+(-u)=0         (jokaisella u on vastavektori -u)
  (v5) r(u+v)=ru+rv     (1. osittelulaki)
  (v6) (r+s)u=ru+su     (2. osittelulaki)
  (v7) r(su)=(rs)u      (skalaarilla kertomisen liitännäisyys)
  (v8) 1u=u             (skalaarilla kertomisen ykkösalkio)

Nämä ominaisuudet ovat välittömiä seurauksia reaali (kompleksi) lukujen vastaavista ominaisuukista.

Toisaalta aivan samat ominaisuudet voidaan johtaa geometrisessa vektorimallissa puhtaasti geometrisin päättelyin.

Hienous piilee siinä, että ottamalla nämä ominaisuudet aksiomiksi, voidaan johtaa koko vektoriavaruuksien perusteoria, jolloin saadaan saman käsittelyn alle monia muitakin olioita kuin äärelliset lukujonot ja geometriset vektorit.
Erityisen tärkeitä sovellusten (ja teorian) kannalta ovat monet funktioavaruudet sekä lukujonoavaruudet.

Vektoriavaruuden määritelmä Edellä luetellut ominaisuudet otetaan yleisen (abstraktin) vektoriavaruuden määritelmäksi. Olkoon V joukko ja K "lukukunta", oletamme että K=R tai K=C. Olkoon määritelty V:n alkioiden välinen laskutoimitus + : V x V -> V ja K:n ja V:n alkioiden välinen laskutoimitus " ": K x V -> V (Laskutoimituksen merkki on yleensä tyhjä, kuten kertolaskussa) siten, että ominaisuudet (v1) ... (v8) ovat voimassa.
Tällöin sanotaan, että V on vektoriavaruus ja sen alkioita sanotaan vektoreiksi. Kunnan K alkioita (siis reaali- tai kompleksilukuja) sanotaan skalaareiksi .

Huom! Kun lähtökohtana ovat nämä 8 ominaisuutta ja vain ne, tulisi eräät ns. itsestäänselvyydet myös todistaa. (Oikeasti mikään ei ole "itsestään selvää".)

Esim: Osoita, että 0 x = 0 ja c 0=0 .
Tod:

0 x = (0+0) x = 0 x + 0 x    (v2).

Lisätään puolittain -(0 x)    (0x:n vastavektori). Saadaan:

    0 =  0 x.
Jälkimmäinen aivan vastaavasti. mot.

Nämä ja muut vastaavat "itsestäänselvyydet" on käsitelty mm. vanhassa tutussa [LAODE]-kirjassa s. 189 - 189.

Painoasuhuom: Tästä lähtien emme jaksa "lihavoittaa" vektoreita, emmekä juurikaan harrasta ala-ja yläindeksejä, kirjoitamme usein ui :n sijasta u[i]

Vektorialiavaruus

[TE] s. 2 Määr. 1.2., [LAY] s. 220 subspace
Vektoriavaruuden V aliavaruudella tarkoitamme epätyhjää V:n osajoukkoa W, joka on "suljettu" laskutoimitusten suhteen, ts.
     u in W ja v in W        ==> u+v in W
     u in W , r in R (tai C) ==> ru in W 
(Pahoittelen notaatiota, mutta HTML-kieli on rajoitettua, käytämme sanaa "in" joukkoon kuulumismerkkinä.)

Aliavaruudessa pätevät kaikki ominaisuudet ((v1) - (v8)) tietysti. Ts. aliavaruus on osajoukko, joka on itse vektoriavaruus, kun käytetään niitä laskutoimituksia, jotka perusavaruudelta V periytyvät.

Selvitä itsellesi, että 0-vektori on aliavaruudessa ja kunkin vektorin vastavektori! (Huomaa, että edellisessä tarvitaan oletusta "epätyhjä". )

Geometrinen havainnollistus

Muistathan aina tuon tuostakin miettiä, mitä jokin käsite tarkoittaa havainnollisessa geometrisessa maailmassamme. Ajatusviiva ---------

2-d-tasossa aliavaruuksia ovat O:n kautta kulkevat suorat (ja koko avaruus) (ja triviaalilla tavalla pelkkä O).
3-d-avaruudessa aliavaruuksia ovat koko avaruuden ja pelkän O:n lisäksi


Viritelmä.

[TE] Määr. 1.3, Lay: s. 221: A subspace spanned by a set

Olkoot u1,...um in V .
Kaikkien lineaarikombinaatioiden joukkoa merk.

sp({u1,...,um}) . Se koostuu muotoa

                                  m
                                -----
                                 \
                                  )   ci ui
                                 /
                                -----
                                i = 1

olevista summista, missä ci:t ovat mielivaltaisia skalaareja. Joukkoa sp({u1,...,um}) kutsutaan vektorien u1,...,um viritelmäksi ( "span") .

Viritelmä on V:n aliavaruus, koska

Sanonta: Vektorit u1,...,um virittävät (ali)avaruuden V, jos V=sp({u1,...,um}).

Lineaarinen riippuvuus/mattomuus LRV/LRT

[TE] Määr 1.4 s. 3
[Lay] a. 237 Linearly independent sets, bases
[KRE8] s. 332 , (Rn:ssä)

Aiemmin olemme kohdanneet nämä käsitteet Rn:n vektorien yhteydessä. Nyt määrittelemme ne yleisen vektoriavaruuden (abstrakteille) vektoreille. Määritelmät ovat muodollisesti täsmälleen samoja.

Tarkastellaan vektoriyhtälöä

      c1u1 + c2u2 + ... + cmum = 0 
Tämä toteutuu, jos c1=c2= ... = cm=0 . (Triviaali ratkaisu)

Kaksi mahdollisuutta:

Havainnollisesti ...

Lause. ([TE] Lause 1.1) Vektorit u1,u2,...,um ovat LRV,
jos ja vain jos
Jokin uk on muiden lineaarikombinaatio.

Tod. (1) Oletetaan LRV. Tällöin on olemassa kertoimet c1, ..., cm, joista jokin # 0, s.e. yhtälö

      c1u1 + c2u2 + ... + cmum = 0 
toteutuu. Jaetaan tällä kertoimella (kun kerran on lupa) ja siirretään muut termit toiselle puolelle.

(2) Käänteinen puoli vastaavasti.

[QED]


Havainto 1. Jos 0-vektori on mukana vektorijoukossa, se on LRV.
Tietysti, koska voidaan valita 0-vektorin kertoimeksi mikä vain, vaikka 1 ja muiden vektorien kertoimiksi 0, näin saadaan ei-triv. lineaarikombinaatio, joka tuottaa 0-vektorin.

Havainto 2. LRT-joukon osajoukko on LRT, LRV-joukon ylijoukko on LRV.
Riittää selvittää vaikkapa jälkimmäinen: Olkoon {a1,...,am} LRV . Tällöin on olemassa kertoimet c1,...,cm siten, että

      c1a1 + c2a2 + ... + cmam = 0 
ja jokin ci#0 . Jos joukkoon otetaan uusia jäseniä, niin laitetaan ne summaan jatkoksi 0-kertoimilla varustettuna. Näin saadaan edelleenkin ei-triv-lin. kombinaatio (äskeinen ci on mukana), joka antaa 0-vektorin.

Edellinen seuraa "kontrapositiolla", eli jos LRT joukolla olisi LRV osajoukko, niin tällä LRV-joukolla olisikin LRT ylijoukko, mikä on ristiriidassa edellä osoitetun kanssa.

Miten selvitetään LRT / LRV Rn:ssä

No tämähän on tuttua entuudestaan, mutta kertaus ...

Esim. Ovatko vektorit

a[1] := [3, 0, 2, 2], a[2] := [-6, 42, 24, 54],a[3] := [21, -21, 0, 15]

LRT / LRV ?
Kyse on siis siitä, onko vektoriyhtälöllä
      c1a1 + c2a2 + c3a3 = 0 
pelkästään triviaaliratk., vai onko muitakin.

No ei muuta kuin kirjoitetaan vektoriyhtälömme komponenttimuodossa (käytämme Maplea tekstinkäsittelyyn):


                            [3]        [-6]        [ 21]
                            [ ]        [  ]        [   ]
                            [0]        [42]        [-21]
                       c[1] [ ] + c[2] [  ] + c[3] [   ]
                            [2]        [24]        [  0]
                            [ ]        [  ]        [   ]
                            [2]        [54]        [ 15]
Yhdistämme komponentit (eli siirrymme sarakeajattelusta riviajatteluun):
                         [3 c[1] - 6 c[2] + 21 c[3] ]
                         [                          ]
                         [    42 c[2] - 21 c[3]     ]
                         [                          ]
                         [     2 c[1] + 24 c[2]     ]
                         [                          ]
                         [2 c[1] + 54 c[2] + 15 c[3]]

Kysymys on siis yhtälösysteemin Ac = 0, missä

                                  [3    -6     21]
                                  [              ]
                                  [0    42    -21]
                             A := [              ]
                                  [2    24      0]
                                  [              ]
                                  [2    54     15]
ratkaisuista.

Yleinen menettely Rn:n vektorien LRV/LRT selvitykseen

Huomaamme siis, että tutkittavat vektorit ladottiin sarakkeiksi matriisiin A . Sitten on vain tehtävänä tutkia homogeeniyhtälön (siis yhtälön, jossa oikea puoli on 0-vektori) ratkaisujen lukumäärää.

    (1) Jos on pelkkä 0-ratkaisu (triv. ratk.), niin LRT.
    (2) Jos on muitakin, niin LRV
Homma johtaa siis Gaussin eliminaatioon:
> ref(A); # Oma alias ref
                               [3    -6     21]
                               [              ]
                               [0    42    -21]
                               [              ]
                               [0     0     30]
                               [              ]
                               [0     0      0]
Toiseksi alimmainen yhtälö: 30c[3] = 0 , joten c[3] = 0 . Siitä kun edetään ylöspäin, saadaan c[2] = 0 , c[1] = 0 .
(Tai suoraan: Jokainen sarake on pivot-sarake)

Johtopäätös: LRT



päivitysraja 12.9.02
Tästä eteenpäin vanhaa tekstiä, joka saattaa sisältää viitteitä vanhempiin painoksiin (ja asiattomia linkkejäkin). Asiat ovat sinänsä oikein, mutta esityksen logiikkaa kannattaa pikemmin seurata [TE]-monisteesta ja/tai luentoprujuista.

Kanta(basis) ja dimensio

KRE 7.5 s. 354, GRE1, 2.9 s. 50, GRE2 9.9. s. 448, STR 3.4 s. 140 (vanha painos)

Monia yhtäpitäviä tapoja määritellä. Otetaan lähemmin GRE:n esitystä mukaileva, itse asiassa tarkalleen STR:n mukainen.

Määritelmä. Vektoriavaruuden V kanta on vektorijoukko {e[1],e[2],...,e[m]}, joka

   1. on LRT
   2. virittää V:n
Havainnollisesti: 2 eri suuntaista vektoria tasossa on tason kanta, 3 vektoria, jotka eivät ole saman tason suuntaisia, muod. 3-d-avaruuden kannan.

Lause Jos {e[1],e[2],...,e[m]} on V:n kanta, niin jokaisella vektorilla v in V on yksikäsitteinen esitys muodossa
(Tämä on GRE-määritelmä.)

> sum(c[i]*e[i],i=1..m);  
                                  m
                                -----
                                 \
                                  )   c[i] e[i]
                                 /
                                -----
                                i = 1

Määritelmä. Vektoriavaruuden V dimensio on maksimimäärä LRT vektoreita, joka avaruuteen mahtuu. Tätä lukua merk dim V Jos äärellistä ylärajaa LRT-vektoreille ei ole, sanotaan, että avaruus on ääretönulotteinen.

Peruslause. Jos avaruudella V on kanta, jossa on m vektoria, niin dim V = m.

Tod. Olkoon {e[1],e[2],...,e[m]} avaruuden V kanta. Koska kanta on LRT, on
dim V >= m.

Jää siis näytettäväksi käänteinen puoli. Ts. osoitettava, että jokainen m+1 vektorin joukko on LRV.

Olk. {f[1],f[2],...,f[m+1]} mielivaltainen m+1 vekt. joukko. Koska {e[1],e[2],...,e[m]} on kanta, voidaan jokainen f[i]-vektori lausua kantavektoreiden e[k] lineaarikombinaationa:

> f[1]:=sum(a[1,k]*e[k],k=1..m);
                                    m
                                  -----
                                   \
                          f[1] :=   )   a[1, k] e[k]
                                   /
                                  -----
                                  k = 1

> f[m+1]:=sum(a[m+1,k]*e[k],k=1..m);
                                    m
                                  -----
                                   \
                      f[m + 1] :=   )   a[m + 1, k] e[k]
                                   /
                                  -----
                                  k = 1

Meidänhän piti tutkia f[k]-vektoreiden LRV:tä. Siksi muodostetaan yhtälö
      c[1]f[1] + c[2]f[2] + ... + c[m+1]f[m+1] = 0

Sijoitetaan tähän yhtälöön f[k]-vektorit lausuttuna e[k]-vektorien avulla. Kun kerätään kunkin e[k]:n kerroin yhteen ja käytetään hyväksi e[k]-vektorien LRT:tta, päädytään lineaariseen yhtälösysteemiin, jonka matriisi on
       [a[1, 1]     a[2, 1]     ...    a[m+1,1] ]
       [                                        ]
       [a[1, 2]     a[2, 2]     ...    a[m+1,2]]
       [                                        ]
       ....

       [                                        ]
       [a[1, m]     a[2, m]     ...    a[m+1,m]]

ja tuntemattomat ovat c[1], ..., c[m+1].
Siis r <= m < m+1 = n ja bmato=0 (HY). Tällöin n-r >=1 vapaata parametria, joten äärettömän monta ratkaisua ja siis LRV, kuten piti osoittaa.

(Yleisestihän pätee: Jos HY:ssä on enemmän tuntemattomia kuin yhtälöitä, niin ratkaisuja on ääretön määrä, eli ei-triviaaleja ratkaisuja on, juuri yllä mainitusta syystä, muistathan myös otsikon "Tärkeä seurauslause homogeenisille systeemeille" tällä sivulla (L1) [QED]


Äärellisulotteisen avaruuden jokaisessa kannassa on siis yhtä monta vektoria

No selväähän se, jos V on tuo avaruus, niin kantavektoreita on dim(V) kpl.

Olisi peräti merkillistä, ellei pätisi:

Lause. dim Rn=n

Tod. Vektorit e[1]=(1,0,...,0), e[2]=(0,1,0,...,), e[n]=(0,0,...,1) ovat LRT ja virittävät. Edellinen lause soveltuu siis.


Lause. dim(sp({u[1],...,u[m]})) = max määrä LRT vektoreita virittäjäjoukossa {u[1],...,u[m]}

Tod. Olkoon d mainittu max määrä. Numeroidaan vektorit niin, että {u[1],...,u[d]} ovat LRT, jolloin loput ovat lausuttavissa näiden lineaarikombinaatioina (muussa tapauksessa LRT vektoreita oliskin enemmän kuin d kpl.) Mutta kaikki sp({u[1],...,u[m]}):n vektorit voidaan lausua vektoreiden {u[1],...,u[d]} lineaarikombinaatioina (koska lineaarikombinaatioden lineaarikombinaatio on alkup. vekt. lin. komb.). Siten {u[1],...,u[d]} on sp({u[1],...,u[m]}):n LRT ja virittävä joukko, eli kanta.


Huom: Tämä voidaan yhtä hyvin ilmaista niin, että avaruuden sp({u[1],...,u[m]}) kanta saadaan valitsemalla maksimaalinen LRT joukko virittäjävektoreita.

Avaruuden Rn n:n vektorin joukko: Kantaan riittää toinen: LRT tai VIR

Lause (lkm=dim => (VIR<=>LRT)). Jos dim V = m ja jos {u[1],...,u[m]} on LRT tai virittää, niin se on V:n kanta.
Tod
(1) Jos {u[1],...,u[m]} on LRT, niin sen on pakko virittää, sillä virittämättömyydestä seuraisi sellaisen vektorin löytyminen, joka yhdessä näiden kanssa muodostaisi LRT joukon, vastoin dimension maksimaalisuutta.

(2) Jos {u[1],...,u[m]} virittää, niin se ei voi olla LRV, sillä muutenhan saataisiin vähemmän vektoreita sisältävä kanta pudottamalla tuo tarpeeton lineaarikombinaatio pois. (Jos jäljelle jäävä joukko olisi vieläkin LRV, niin jatkettaisiin pudottamista siis niin, että viritysominaisuus olisi koko ajan voimassa.)



This page created by mailto:Heikki.Apiola@hut.fi