Motivaatio Matemaattiset siemenet, joita on kylvetty Rn:ssä, puhkeavat kukkaan astuessamme abstraktion puutarhaan. Lineaarialgebran kauneus ja voima näkyy selvemmin, kun ryhdytään katsomaan Rn:ää, geometristen vektoreiden joukkoa ym. esimerkkeinä yleisestä abstraktista vektoriavaruudesta.Tilanne voidaan tiivistää kahdeksaan perusominaisuuteen, joista koko teoria on johdettavissa.
Tämä on aivan tyypillinen prosessi kaikessa matematiikassa.
Tavalliset vektorilaskusäännöt : yhteen- ja vähennyslasku sekä skalaarilla (reaaliluvulla) kertominen ovat tällöin sitä, että
u+v = (u1+v1,u2+v2,u3+v3) cu = (cu1,cu2,cu3)
Rajoitumme esimerkeissämme aluksi reaalisiin, mutta perusteoriassa ei ole (juuri) mitään eroa kompleksitapaukseen nähden.
Avaruuden Rn (yhtä hyvin Cn) vektoreilla (u,v,...) (ja skalaareilla r,s,...) on seuraavat ominaisuudet:
(v1) u+v = v+u (vaihdantalaki) (v2) (u+v)+w = u+(v+w)(liitäntälaki) (v3) u+0 = u (on olemassa nollavektori) (v4) u+(-u)=0 (jokaisella u on vastavektori -u) (v5) r(u+v)=ru+rv (1. osittelulaki) (v6) (r+s)u=ru+su (2. osittelulaki) (v7) r(su)=(rs)u (skalaarilla kertomisen liitännäisyys) (v8) 1u=u (skalaarilla kertomisen ykkösalkio)Nämä ominaisuudet ovat välittömiä seurauksia reaali (kompleksi) lukujen vastaavista ominaisuukista.
Toisaalta aivan samat ominaisuudet voidaan johtaa geometrisessa vektorimallissa puhtaasti geometrisin päättelyin.
Hienous piilee siinä, että ottamalla nämä ominaisuudet aksiomiksi,
voidaan johtaa koko vektoriavaruuksien perusteoria, jolloin saadaan saman
käsittelyn alle monia muitakin olioita kuin äärelliset lukujonot ja
geometriset vektorit.
Erityisen tärkeitä sovellusten (ja teorian) kannalta ovat monet
funktioavaruudet sekä lukujonoavaruudet.
Vektoriavaruuden määritelmä Edellä luetellut ominaisuudet otetaan
yleisen (abstraktin) vektoriavaruuden määritelmäksi. Olkoon V joukko ja K
"lukukunta", oletamme että K=R tai K=C. Olkoon määritelty V:n alkioiden
välinen
laskutoimitus + : V x V -> V ja K:n ja V:n alkioiden välinen
laskutoimitus
" ": K x V -> V (Laskutoimituksen merkki on yleensä tyhjä, kuten
kertolaskussa) siten, että ominaisuudet (v1) ... (v8) ovat voimassa.
Tällöin sanotaan, että V on vektoriavaruus ja sen alkioita sanotaan
vektoreiksi. Kunnan K alkioita (siis reaali- tai kompleksilukuja)
sanotaan skalaareiksi .
Huom! Kun lähtökohtana ovat nämä 8 ominaisuutta ja vain ne, tulisi eräät ns. itsestäänselvyydet myös todistaa. (Oikeasti mikään ei ole "itsestään selvää".)
Esim: Osoita, että 0 x = 0 ja
c 0=0 .
Tod:
0 x = (0+0) x = 0 x + 0 x (v2).
0 = 0 x.Jälkimmäinen aivan vastaavasti. mot.
Nämä ja muut vastaavat "itsestäänselvyydet" on käsitelty mm. vanhassa tutussa [LAODE]-kirjassa s. 189 - 189.
Painoasuhuom: Tästä lähtien emme jaksa "lihavoittaa" vektoreita, emmekä juurikaan harrasta ala-ja yläindeksejä, kirjoitamme usein ui :n sijasta u[i]
Vektoriavaruuden V aliavaruudella tarkoitamme epätyhjää V:n
osajoukkoa W, joka on "suljettu" laskutoimitusten suhteen, ts. u in W ja v in W ==> u+v in W u in W , r in R (tai C) ==> ru in W |
Aliavaruudessa pätevät kaikki ominaisuudet ((v1) - (v8)) tietysti. Ts. aliavaruus on osajoukko, joka on itse vektoriavaruus, kun käytetään niitä laskutoimituksia, jotka perusavaruudelta V periytyvät.
Selvitä itsellesi, että 0-vektori on aliavaruudessa ja kunkin vektorin vastavektori! (Huomaa, että edellisessä tarvitaan oletusta "epätyhjä". )
Geometrinen havainnollistus
Muistathan aina tuon tuostakin miettiä, mitä jokin käsite tarkoittaa havainnollisessa geometrisessa maailmassamme. Ajatusviiva ---------
2-d-tasossa aliavaruuksia ovat O:n kautta kulkevat suorat (ja koko avaruus)
(ja triviaalilla tavalla pelkkä O).
3-d-avaruudessa aliavaruuksia ovat
koko avaruuden ja pelkän O:n lisäksi
Olkoot u1,...um in V
.
Kaikkien lineaarikombinaatioiden joukkoa merk.
sp({u1,...,um}) . Se koostuu muotoa
m ----- \ ) ci ui / ----- i = 1olevista summista, missä ci:t ovat mielivaltaisia skalaareja. Joukkoa sp({u1,...,um}) kutsutaan vektorien u1,...,um viritelmäksi ( "span") .
Viritelmä on V:n aliavaruus, koska
Sanonta: Vektorit u1,...,um virittävät (ali)avaruuden V, jos V=sp({u1,...,um}).
[TE] Määr 1.4 s. 3
[Lay] a. 237 Linearly independent sets, bases
[KRE8] s. 332 , (Rn:ssä)
Aiemmin olemme kohdanneet nämä käsitteet Rn:n vektorien yhteydessä. Nyt määrittelemme ne yleisen vektoriavaruuden (abstrakteille) vektoreille. Määritelmät ovat muodollisesti täsmälleen samoja.
Tarkastellaan vektoriyhtälöä
c1u1 + c2u2 + ... + cmum = 0Tämä toteutuu, jos c1=c2= ... = cm=0 . (Triviaali ratkaisu)
Kaksi mahdollisuutta:
Lause. ([TE] Lause 1.1) Vektorit
u1,u2,...,um ovat LRV,
jos ja
vain jos
Jokin uk on muiden lineaarikombinaatio.
Tod. (1) Oletetaan LRV. Tällöin on olemassa kertoimet c1, ..., cm, joista jokin # 0, s.e. yhtälö
c1u1 + c2u2 + ... + cmum = 0toteutuu. Jaetaan tällä kertoimella (kun kerran on lupa) ja siirretään muut termit toiselle puolelle.
(2) Käänteinen puoli vastaavasti.
[QED]
Havainto 2. LRT-joukon osajoukko on LRT, LRV-joukon ylijoukko on
LRV.
Riittää selvittää vaikkapa jälkimmäinen: Olkoon
{a1,...,am} LRV . Tällöin on olemassa
kertoimet c1,...,cm siten, että
c1a1 + c2a2 + ... + cmam = 0ja jokin ci#0 . Jos joukkoon otetaan uusia jäseniä, niin laitetaan ne summaan jatkoksi 0-kertoimilla varustettuna. Näin saadaan edelleenkin ei-triv-lin. kombinaatio (äskeinen ci on mukana), joka antaa 0-vektorin.
Edellinen seuraa "kontrapositiolla", eli jos LRT joukolla olisi LRV osajoukko, niin tällä LRV-joukolla olisikin LRT ylijoukko, mikä on ristiriidassa edellä osoitetun kanssa.
Esim. Ovatko vektorit
a[1] := [3, 0, 2, 2], a[2] := [-6, 42, 24, 54],a[3] := [21, -21, 0, 15] LRT / LRV ?Kyse on siis siitä, onko vektoriyhtälöllä
c1a1 + c2a2 + c3a3 = 0pelkästään triviaaliratk., vai onko muitakin.
No ei muuta kuin kirjoitetaan vektoriyhtälömme komponenttimuodossa (käytämme Maplea tekstinkäsittelyyn):
[3] [-6] [ 21] [ ] [ ] [ ] [0] [42] [-21] c[1] [ ] + c[2] [ ] + c[3] [ ] [2] [24] [ 0] [ ] [ ] [ ] [2] [54] [ 15]Yhdistämme komponentit (eli siirrymme sarakeajattelusta riviajatteluun):
[3 c[1] - 6 c[2] + 21 c[3] ] [ ] [ 42 c[2] - 21 c[3] ] [ ] [ 2 c[1] + 24 c[2] ] [ ] [2 c[1] + 54 c[2] + 15 c[3]]Kysymys on siis yhtälösysteemin Ac = 0, missä
[3 -6 21] [ ] [0 42 -21] A := [ ] [2 24 0] [ ] [2 54 15]ratkaisuista.
Yleinen menettely Rn:n vektorien LRV/LRT selvitykseenHuomaamme siis, että tutkittavat vektorit ladottiin sarakkeiksi matriisiin A . Sitten on vain tehtävänä tutkia homogeeniyhtälön (siis yhtälön, jossa oikea puoli on 0-vektori) ratkaisujen lukumäärää. (1) Jos on pelkkä 0-ratkaisu (triv. ratk.), niin LRT. (2) Jos on muitakin, niin LRV |
> ref(A); # Oma alias ref [3 -6 21] [ ] [0 42 -21] [ ] [0 0 30] [ ] [0 0 0]Toiseksi alimmainen yhtälö: 30c[3] = 0 , joten c[3] = 0 . Siitä kun edetään ylöspäin, saadaan c[2] = 0 , c[1] = 0 .
Johtopäätös: LRT
Monia yhtäpitäviä tapoja määritellä. Otetaan lähemmin GRE:n esitystä mukaileva, itse asiassa tarkalleen STR:n mukainen.
Määritelmä. Vektoriavaruuden V kanta on vektorijoukko {e[1],e[2],...,e[m]}, joka
1. on LRT 2. virittää V:nHavainnollisesti: 2 eri suuntaista vektoria tasossa on tason kanta, 3 vektoria, jotka eivät ole saman tason suuntaisia, muod. 3-d-avaruuden kannan.
Lause Jos {e[1],e[2],...,e[m]} on V:n kanta, niin
jokaisella vektorilla v in V on yksikäsitteinen esitys muodossa
(Tämä on
GRE-määritelmä.)
> sum(c[i]*e[i],i=1..m); m ----- \ ) c[i] e[i] / ----- i = 1
Peruslause. Jos avaruudella V on kanta, jossa on m vektoria, niin dim V = m.
Tod. Olkoon {e[1],e[2],...,e[m]} avaruuden V kanta.
Koska kanta on LRT, on
dim V >= m.
Jää siis näytettäväksi käänteinen puoli. Ts. osoitettava, että jokainen m+1 vektorin joukko on LRV.
Olk. {f[1],f[2],...,f[m+1]} mielivaltainen m+1 vekt. joukko. Koska {e[1],e[2],...,e[m]} on kanta, voidaan jokainen f[i]-vektori lausua kantavektoreiden e[k] lineaarikombinaationa:
> f[1]:=sum(a[1,k]*e[k],k=1..m); m ----- \ f[1] := ) a[1, k] e[k] / ----- k = 1 > f[m+1]:=sum(a[m+1,k]*e[k],k=1..m); m ----- \ f[m + 1] := ) a[m + 1, k] e[k] / ----- k = 1Meidänhän piti tutkia f[k]-vektoreiden LRV:tä. Siksi muodostetaan yhtälö
c[1]f[1] + c[2]f[2] + ... + c[m+1]f[m+1] = 0Sijoitetaan tähän yhtälöön f[k]-vektorit lausuttuna e[k]-vektorien avulla. Kun kerätään kunkin e[k]:n kerroin yhteen ja käytetään hyväksi e[k]-vektorien LRT:tta, päädytään lineaariseen yhtälösysteemiin, jonka matriisi on
[a[1, 1] a[2, 1] ... a[m+1,1] ] [ ] [a[1, 2] a[2, 2] ... a[m+1,2]] [ ] .... [ ] [a[1, m] a[2, m] ... a[m+1,m]] ja tuntemattomat ovat c[1], ..., c[m+1].Siis r <= m < m+1 = n ja bmato=0 (HY). Tällöin n-r >=1 vapaata parametria, joten äärettömän monta ratkaisua ja siis LRV, kuten piti osoittaa.
(Yleisestihän pätee: Jos HY:ssä on enemmän tuntemattomia kuin yhtälöitä, niin ratkaisuja on ääretön määrä, eli ei-triviaaleja ratkaisuja on, juuri yllä mainitusta syystä, muistathan myös otsikon "Tärkeä seurauslause homogeenisille systeemeille" tällä sivulla (L1) [QED]
Olisi peräti merkillistä, ellei pätisi:
Lause. dim Rn=n
Tod. Vektorit e[1]=(1,0,...,0), e[2]=(0,1,0,...,), e[n]=(0,0,...,1) ovat LRT ja virittävät. Edellinen lause soveltuu siis.
Tod. Olkoon d mainittu max määrä. Numeroidaan vektorit niin, että {u[1],...,u[d]} ovat LRT, jolloin loput ovat lausuttavissa näiden lineaarikombinaatioina (muussa tapauksessa LRT vektoreita oliskin enemmän kuin d kpl.) Mutta kaikki sp({u[1],...,u[m]}):n vektorit voidaan lausua vektoreiden {u[1],...,u[d]} lineaarikombinaatioina (koska lineaarikombinaatioden lineaarikombinaatio on alkup. vekt. lin. komb.). Siten {u[1],...,u[d]} on sp({u[1],...,u[m]}):n LRT ja virittävä joukko, eli kanta.
(2) Jos {u[1],...,u[m]} virittää, niin se ei voi olla LRV, sillä muutenhan saataisiin vähemmän vektoreita sisältävä kanta pudottamalla tuo tarpeeton lineaarikombinaatio pois. (Jos jäljelle jäävä joukko olisi vieläkin LRV, niin jatkettaisiin pudottamista siis niin, että viritysominaisuus olisi koko ajan voimassa.)