1. Repetition: skalärprodukten i
I har vi redan den bekanta punktprodukten (dot product):
där och .
Denna produkt ger oss verktyg som vinkel, längd och avstånd — begrepp som är centrala i geometri och optimering. Frågan som denna föreläsning besvarar är: kan vi definiera liknande begrepp på andra vektorrum, som polynomrum eller funktionsrum?
2. Allmän skalärprodukt — definition
Definition: Skalärprodukt (inre produkt)
Låt vara ett reellt vektorrum. En skalärprodukt (inner product) på är en funktion som uppfyller följande fyra axiom för alla och alla skalärer :
Nr Axiom Namn 1 Symmetri 2 Additivitet 3 Homogenitet 4 , med likhet om och bara om Positivdefinithet Ett vektorrum utrustat med en skalärprodukt kallas ett inre produktrum.
Axiom 2 + 3 tillsammans kallas linjäritet i första argumentet
Tack vare symmetrin (axiom 1) är skalärprodukten även linjär i det andra argumentet. Man säger att den är bilinjär.
3. Norm och avstånd
Från en skalärprodukt kan vi definiera längd och avstånd:
Definition: Norm och avstånd
Låt vara en skalärprodukt på .
Normen (längden) av :
Avståndet mellan och :
Koppling till geometri: Vinkelräthet (ortogonalitet) och kortaste avstånd definieras med hjälp av normen. Begreppet “vinkelrät” i ett allmänt inre produktrum betyder att .
4. Grundläggande räkneregler
Exempel 1: Skalärprodukten av nollvektorn med valfri vektor
Påstående: för alla .
Bevis med axiomen:
Tolkning: Oavsett vilken skalärprodukt vi väljer — standardprodukten i , en viktad variant, eller en integralskalärprodukt — ger nollvektorn alltid skalärprodukt noll. Detta följer direkt av homogenitetsaxiomet (axiom 3). Notera att vi inte behöver veta vilken skalärprodukt det är — resultatet gäller generellt.
Exempel 2: Avståndet är symmetriskt
Påstående: .
Bevis:
Vi behöver beräkna normen av där :
Alltså .
Tolkning: Avståndet från till är samma som avståndet från till . Beviset visar att detta inte är ett antagande utan en konsekvens av axiomen — homogeniteten (axiom 3) tillåter oss att flytta skalären utanför, och gör att tecknet försvinner.
Exempel 3: Utveckla
Skalärprodukten beter sig som en “multiplikation” — vi kan utveckla den med distributiva lagen precis som en algebraisk produkt.
Beräkning: Använd additivitet (axiom 2) och homogenitet (axiom 3):
Använd symmetri (axiom 1): , samt :
Tolkning: Räknereglerna fungerar exakt som vanlig algebra — “multiplicera” parenteserna och samla termer. Den enda skillnaden mot vanlig multiplikation är att inte i allmänhet förenklas vidare (det är inte nödvändigtvis ). Notera hur de fyra axiomen är allt vi behöver för denna beräkning.
5. Skalärprodukter på
5.1 Standardskalärprodukten
Exempel 4: Standardskalärprodukten i
Den vanliga punktprodukten:
Verifiering av axiomen:
- Symmetri: ✓ (multiplikation av reella tal är kommutativ)
- Additivitet: Följer av distributivitet i ✓
- Homogenitet: ✓
- Positivdefinithet: , och om och bara om alla ✓
Tolkning: Standardskalärprodukten är det “naturliga” valet i — den ger den euklidiska geometrin vi är vana vid, med räta vinklar, Pythagoras sats, och Cauchy–Schwarz olikhet. Enhetscirkeln () blir en vanlig cirkel.
5.2 Viktade skalärprodukter
Exempel 5: Viktad skalärprodukt i
Definiera på :
Talen och kallas vikter. Denna funktion är en giltig skalärprodukt:
- Symmetri: ✓
- Additivitet: Distributivitet ✓
- Homogenitet: ✓
- Positivdefinithet: , och ✓ (vikterna är positiva!)
Tolkning: Vikterna ändrar geometrin. Med standardprodukten bildar en cirkel (). Med den viktade produkten bildar en ellips (). Riktningar med högre vikt “kostar mer” — de bidrar mer till normen. Detta används t.ex. i statistik där olika variabler har olika varians.
Generell viktad skalärprodukt
På med vikter :
Kravet är att alla vikter är strikt positiva (). Om någon vikt vore eller negativ bryts axiom 4 (positivdefinithet).
5.3 Icke-exempel: när villkoren inte uppfylls
Exempel 6: En funktion som inte är en skalärprodukt — nollvikt
Försök definiera på :
(Tredje komponenten ignoreras — den har effektivt vikten .)
Kontroll av axiom 4: Välj :
Men ! Alltså bryter detta mot kravet "" i axiom 4.
Slutsats: Detta är inte en skalärprodukt. ✗
Tolkning: Problemet är att funktionen inte “ser” den tredje komponenten. Två helt olika vektorer, och , får samma norm. En skalärprodukt måste kunna skilja alla vektorer åt — om måste . Vikten för varje komponent måste vara strikt positiv.
Exempel 7: En funktion som inte är en skalärprodukt — saknar symmetri
Försök definiera på :
Kontroll av axiom 1 (symmetri): Beräkna .
Jämför: mot .
Välj och :
, så symmetrin bryter. ✗
Tolkning: Formeln behandlar och olika — den innehåller men inte separat. En skalärprodukt måste vara symmetrisk: att byta plats på och ska inte ändra resultatet.
5.4 Matrisbaserad skalärprodukt
Exempel 8: Skalärprodukt via en inverterbar matris
Låt vara en inverterbar -matris. Definiera på :
(Punktprodukten av de transformerade vektorerna.)
Verifiering av axiomen: Axiom 1–3 följer direkt av att punktprodukten och matrismultiplikation uppfyller symmetri, additivitet och homogenitet.
Axiom 4 (det kritiska):
Och (den sista ekvivalensen gäller eftersom är inverterbar, dvs. ).
Slutsats: är en skalärprodukt om och bara om är inverterbar. ✓
Tolkning: Denna konstruktion “mäter avstånd i ett transformerat koordinatsystem”. Om roterar och skalar rummet, så mäter hur och relaterar till varandra efter transformationen. Inverterbarheten av är avgörande — om vore singulär kunde den krympa en hel riktning till noll, och axiom 4 skulle brytas.
6. Skalärprodukter på polynomrum
6.1 Evalueringsskalärprodukt
Den viktigaste typen av skalärprodukt på polynomrum bygger på att evaluera polynomen i fasta punkter och bilda en viktad summa.
Evalueringsskalärprodukt på
Välj distinkta punkter och positiva vikter . Definiera:
Krav: Man behöver minst distinkta punkter för . I behövs alltså minst 3 punkter; i behövs minst 8.
Varför just punkter? Ett polynom av grad som är noll i punkter måste vara nollpolynomet (det har fler nollställen än grad). Detta säkerställer axiom 4: om måste för minst ett , och med positiva vikter ger detta .
Exempel 9: Evalueringsskalärprodukt på (tre punkter)
Definiera på (polynom av grad ):
Här är punkterna , , och vikterna , , .
Verifiering:
- 3 distinkta punkter för (polynom av grad ) → tillräckligt ✓
- Alla vikter positiva () ✓
Beräkningsexempel: Låt och .
Punkt Bidrag
Tolkning: Evalueringsskalärprodukten “samplar” polynomen i fasta punkter. Vikterna styr hur mycket varje punkt bidrar — punkten har störst vikt (), men bidraget blev ändå noll eftersom . Denna typ av skalärprodukt är fundamental i numerisk analys, t.ex. Gauss-kvadratur.
6.2 Icke-exempel: för få punkter
Exempel 10: Bara två punkter i — inte en skalärprodukt
Försök definiera på :
Bara 2 punkter, men kräver minst 3. Vad går fel?
Välj . Då:
Men ! Axiom 4 bryts. ✗
Tolkning: Polynomet är nollskilt men har nollställen precis i de två samplingspunkterna . Med bara 2 punkter kan ett andragradspolynom “smyga igenom” utan att skalärprodukten märker det. Därför krävs minst punkter för — det är precis det antal som säkerställer att inget nollskilt polynom av grad kan vara noll i samtliga punkter.
6.3 Fler exempel på
Exempel 11: Två evalueringspunkter i — giltigt eller ej?
Definiera på :
Bara 2 punkter, men kräver 3 → inte en skalärprodukt. ✗
Motexempel: ger , , alltså trots .
Tolkning: Samma princip som i Exempel 10 — polynomet har nollställen precis i samplingspunkterna.
Exempel 12: Icke-symmetrisk evalueringsprodukt
Försök definiera på :
Kontroll av axiom 1 (symmetri):
✓
Symmetri håller! Men vad med axiom 4?
Kontroll av axiom 4: .
Välj : , .
Slutsats: Axiom 4 bryts — positivdefinitheten kräver . ✗
Tolkning: Problemet är att termerna inte har formen (som alltid är ), utan med — en blandad produkt som kan vara negativ. En giltig evalueringsskalärprodukt kräver att samma punkt evalueras i båda faktorerna: .
Exempel 13: Tre punkter med positiva vikter — giltig skalärprodukt
Definiera på :
Kontroll:
- 3 distinkta punkter () för → tillräckligt ✓
- Alla vikter positiva () ✓
Slutsats: Giltig skalärprodukt. ✓
Tolkning: Punkten har störst vikt (), vilket innebär att polynomens beteende nära spelar störst roll för normen och ortogonalitet. Valet av punkter och vikter styr vilken “geometri” man får på polynomrummet.
7. Skalärprodukter via integration
Integration ger en naturlig skalärprodukt på funktionsrum. Till skillnad från evalueringsskalärprodukter (som samplar i ändligt många punkter) tar integralen hänsyn till funktionens beteende överallt.
7.1 På polynomrum
Exempel 14: Integralskalärprodukt på polynomrum
Definiera på (alla polynom) eller :
Verifiering av axiomen:
- Symmetri: ✓ (vanlig multiplikation)
- Additivitet: Integralen är linjär ✓
- Homogenitet: ✓
- Positivdefinithet: (integranden är ). Och om med kontinuerlig, måste för alla , alltså är nollpolynomet ✓
Viktad variant: Man kan även definiera
Funktionen fungerar som en “vikt” — den betonar polynomens beteende nära (där är störst).
Tolkning: Integralskalärprodukten mäter “överlappet” mellan två polynom. Om och är positiva på samma intervall och negativa på samma intervall ger de en stor positiv skalärprodukt. Om de har motsatt tecken (en positiv där den andra är negativ) kan skalärprodukten bli noll eller negativ. Ortogonalitet () betyder att de positiva och negativa bidragen tar ut varandra — polynomen “cancellerar”.
7.2 På funktionsrum
Exempel 15: Integralskalärprodukt på
Låt vara rummet av alla kontinuerliga funktioner . Definiera:
Verifiering: Exakt samma argument som för polynom. Axiom 1–3 följer av integralens linjäritet och multiplikationens kommutativitet. Axiom 4 följer av att och att en kontinuerlig funktion vars integral är noll över måste vara identiskt noll.
Tolkning: Detta är en av de viktigaste skalärprodukterna i matematik och fysik. Fourier-analys bygger helt på denna skalärprodukt: Fourier-koefficienterna beräknas som där är basfunktioner (sinus/cosinus). Två funktioner är “ortogonala” om deras integral av produkten är noll — precis som två vektorer i vars punktprodukt är noll.
8. Sammanfattning: checklista för skalärprodukter
| Kontroll | Fråga att ställa |
|---|---|
| Symmetri | Är ? |
| Additivitet | Kan vi “bryta ut” en summa? |
| Homogenitet | Kan vi “dra ut” en skalär? |
| Positivdefinithet | Är för alla ? |
Vanligaste fallgropen
Axiom 4 är nästan alltid det axiom som bryter. Kontrollera alltid:
- Viktad skalärprodukt: Alla vikter strikt positiva?
- Evalueringsskalärprodukt: Tillräckligt många distinkta punkter?
- Matrisbaserad: Är matrisen inverterbar?
9. Skalärprodukt på matrisrum — spåret
Förutom , polynomrum och funktionsrum kan man definiera skalärprodukter på matrisrum. Den viktigaste konstruktionen använder spåret (trace).
9.1 Definition via spåret
Definition: Frobenius-skalärprodukt
Definiera på (alla -matriser):
där betecknar spåret — summan av diagonalelementen.
Varför fungerar detta? Om vi “vecklar ut” matriserna till vektorer i (genom att stapla kolumnerna) motsvarar precis standardskalärprodukten av de utvecklade vektorerna. Det beror på att , och summan av diagonalelementen ger — precis den elementvisa produktens summa.
Exempel 16: Skalärprodukt på via spåret
Låt och .
Beräkning:
Alternativt (elementvis): Summera produkterna av motsvarande element:
Samma svar! Den elementvisa metoden är ofta snabbare i praktiken.
Verifiering av axiomen:
- Symmetri: ✓ (spåret är invariant under transponat av produkten)
- Additivitet: ✓
- Homogenitet: ✓
- Positivdefinithet: , och alla element är noll ✓
Tolkning: Frobenius-skalärprodukten behandlar en matris som en “lång vektor” — den ignorerar matrisstrukturen och mäter bara elementvis överensstämmelse. Normen kallas Frobenius-normen och mäter den totala “storleken” av matrisens element.
10. Beräkningsexempel: norm och avstånd
Nu tillämpar vi skalärprodukten för att beräkna norm (längd) och avstånd i olika rum.
Exempel 17: Norm och avstånd i med evalueringsskalärprodukt
Definiera på :
(Tre distinkta punkter med vikter — alla positiva, 3 punkter för → giltig skalärprodukt.)
a) Beräkna .
Normen definieras som , så:
Punkt Vikt Bidrag
b) Beräkna avståndet .
Avståndet definieras som . Polynomet .
Punkt Vikt Bidrag till
Tolkning: Polynomet är noll i punkterna och , så de enda bidraget kommer från punkten . Med en annan skalärprodukt (andra punkter eller vikter) hade avståndet blivit annorlunda — geometrin beror på valet av skalärprodukt.
11. Bästa approximation — tillämpning av skalärprodukten
En av de viktigaste tillämpningarna av skalärprodukter är att hitta den bästa approximationen av en funktion med ett polynom. Idén är att minimera avståndet (i skalärproduktens mening) mellan funktionen och polynomet.
Exempel 18: Approximera med ett andragradspolynom
Använd evalueringsskalärprodukten:
Problem: Hitta polynomet som minimerar
dvs. avståndet mellan funktionen och polynomet mätt med den givna skalärprodukten.
Metod: Den bästa approximationen uppnås när residualen är ortogonal mot alla polynom i . Det leder till villkoren:
Dessa tre ekvationer (de s.k. normalekvationerna) ger ett -linjärt system i obekanta , , .
Beräkning av de relevanta värdena:
Punkt Vikt Normalekvatoner (skriv för ):
Skalärprodukter av baspolynomen med sig själva och med varandra beräknas genom att evaluera i punkterna och vikta. Dessa ekvationer ger det linjära systemet som löses med Gausselimination för att bestämma , , .
Tolkning: Approximationen hittar det polynom som matchar “bäst” i de tre samplingspunkterna, viktat efter . Punkten har dubbel vikt, så approximationen anpassas extra noga där. Denna metod generaliserar minsta-kvadrat-anpassning till godtyckliga skalärprodukter och är grunden för numeriska metoder som Gauss-kvadratur och ortogonala polynom.
12. Centrala olikheter och satser
I ett allmänt inre produktrum gäller samma fundamentala olikheter som i . Dessa olikheter följer enbart från de fyra axiomen — de gäller i alla inre produktrum oavsett om vi jobbar med vektorer, polynom, matriser eller funktioner.
12.1 Cauchy–Schwarz olikhet
Sats: Cauchy–Schwarz olikhet
Låt vara en skalärprodukt på . Då gäller för alla :
med likhet om och bara om och är linjärt beroende (dvs. den ena är en skalär multipel av den andra, eller en av dem är nollvektorn).
Bevisidé: Om gäller olikheten trivialt (båda sidor är noll). Antag och betrakta vektorn (ortogonala projektionens residual). Axiom 4 ger . Att utveckla denna olikhet med hjälp av bilinjäriteten ger exakt Cauchy–Schwarz olikhet.
Specialfall i : Med standardskalärprodukten återfås den klassiska Cauchy–Schwarz olikheten:
Tolkning: Cauchy–Schwarz begränsar hur “parallella” två vektorer kan vara relativt sina normer. I med standardprodukten kan man definiera vinkeln mellan och via , och olikheten säger att — helt konsekvent med att cosinus alltid ligger mellan och . I allmänna inre produktrum (polynom, funktioner) saknas geometrisk vinkel, men Cauchy–Schwarz gäller ändå och kan användas som en generaliserad vinkeldefinition.
12.2 Triangelolikheten
Sats: Triangelolikheten
Låt vara en skalärprodukt på . Då gäller för alla :
Bevis:
Använd Cauchy–Schwarz: :
Ta roten ur båda sidor (båda icke-negativa):
Följdsats — triangelolikheten för avstånd:
Bevis av följdsatsen: Sätt och . Då ger triangelolikheten:
Tolkning: Triangelolikheten säger att den raka vägen alltid är kortast — att gå via en mellanpunkt kan aldrig ge ett kortare avstånd. Namnet kommer från att i en triangel med hörn , , är varje sida kortare än summan av de andra två. Denna olikhet gäller i alla inre produktrum och är fundamental för att normen verkligen ska bete sig som en “längd”.
12.3 Pythagorassatsen (generaliserad)
Sats: Pythagorassatsen
Låt vara en skalärprodukt på . Då gäller:
(Ortogonalitet är ekvivalent med att Pythagoras sats gäller.)
Bevis:
Likhet med gäller om och bara om , dvs. , dvs. .
Tolkning: I med standardprodukten ger detta den klassiska Pythagoras sats för rätvinkliga trianglar. Men satsen gäller i alla inre produktrum: om två polynom är ortogonala (deras skalärprodukt är noll) gäller att “normen av summan i kvadrat = summan av normerna i kvadrat”. Pythagorassatsen generaliseras även till fler än två vektorer: om är parvis ortogonala, så gäller
13. Ortogonala och ortonormala mängder
13.1 Definition
Definition: Ortogonal mängd
En mängd vektorer i ett inre produktrum kallas ortogonal om vektorerna är parvis ortogonala:
(Varje par av distinkta vektorer i mängden har skalärprodukt noll.)
Definition: Ortonormal mängd
En ortogonal mängd kallas ortonormal om dessutom varje vektor har norm 1:
Ekvivalent:
( kallas Kronecker-delta.)
Tolkning: En ortogonal mängd är en samling vektorer som alla är vinkelräta mot varandra — en generalisering av koordinataxlarna i . En ortonormal mängd är dessutom “normaliserad” så att varje vektor har enhetslängd. Standardbasen i är det enklaste exemplet på en ortonormal mängd.
13.2 Varför är ortogonala mängder viktiga?
Sats: Ortogonala nollskilda vektorer är linjärt oberoende
Om är en ortogonal mängd och ingen vektor är nollvektorn, så är mängden linjärt oberoende.
Bevis: Antag att . Ta skalärprodukten med på båda sidor:
Bilinjäriteten ger: .
Alla termer utom den :te försvinner på grund av ortogonaliteten ( för ):
Eftersom gäller (axiom 4), så . Detta gäller för alla , alltså .
Praktisk konsekvens: Om vi har en ortogonal mängd med nollskilda vektorer i ett -dimensionellt inre produktrum, bildar den automatiskt en bas — en ortogonal bas. Och om vi dessutom normaliserar vektorerna till enhetslängd får vi en ortonormal bas.
13.3 Räkneexempel
Exempel 19: Visa att en mängd är ortogonal i
Visa att är en ortogonal mängd i med standardskalärprodukten.
Metod: Beräkna alla parvis skalärprodukter och verifiera att de är noll.
Vi har tre vektorer, så vi behöver kontrollera par:
Par 1: och :
Par 2: och :
Par 3: och :
Hmm, det ger . Kontrollera tredje vektorn — om den istället är :
Med den korrekta tredje vektorn :
Nyckelinsikten: Kontrollera alltid alla par — det räcker inte att kontrollera ett enda!
Poäng: I praktiken kontrollerar man skalärprodukter. Alla måste vara noll för ortogonalitet.
Exempel 20: Ortogonal mängd i — korrekt verifiering
Visa att är en ortogonal mängd i .
Par 1: ✓
Par 2: ✓
Par 3: ✓
Alla par ortogonala → mängden är ortogonal. ✓
Är den ortonormal? Kontrollera normerna:
- ✓
Inte ortonormal (normerna är inte alla lika med 1). Men vi kan normalisera:
Nu är en ortonormal bas för .
Tolkning: Att gå från ortogonal till ortonormal mängd är bara en fråga om normalisering — dela varje vektor med sin norm. Ortogonaliteten bevaras eftersom normalisering bara ändrar längden, inte riktningen: .
13.4 Fördelen med ortonormala baser
Om är en ortonormal bas för ett inre produktrum blir koordinatberäkningen extremt enkel:
Koordinaterna fås genom skalärprodukter — ingen Gausselimination behövs!
Varför? Om och vi tar skalärprodukten med :
(Alla termer utom den :te försvinner tack vare ortogonaliteten, och den :te förenklas tack vare .)
14. Sammanfattning: checklista för skalärprodukter
| Kontroll | Fråga att ställa |
|---|---|
| Symmetri | Är ? |
| Additivitet | Kan vi “bryta ut” en summa? |
| Homogenitet | Kan vi “dra ut” en skalär? |
| Positivdefinithet | Är för alla ? |
Vanligaste fallgropen
Axiom 4 är nästan alltid det axiom som bryter. Kontrollera alltid:
- Viktad skalärprodukt: Alla vikter strikt positiva?
- Evalueringsskalärprodukt: Tillräckligt många distinkta punkter?
- Matrisbaserad: Är matrisen inverterbar?
Sammanfattning av skalärprodukter vi har sett
| Rum | Skalärprodukt | Krav |
|---|---|---|
| (standard) | Inga extra | |
| (viktad) | ||
| (matrisbaserad) | inverterbar | |
| (evaluering) | distinkta punkter, | |
| eller (integral) | Inga extra | |
| (Frobenius) | Inga extra |
Resurser
Videor
- 3Blue1Brown: Abstract vector spaces — varför abstrakta vektorrum och funktionsrum beter sig som
- 3Blue1Brown: Dot products and duality — skalärprodukt och projektion visuellt
- MIT 18.06SC: Orthogonal Vectors and Subspaces (Gilbert Strang) — ortogonalitet och inre produkt
- MIT 18.06SC: Projection Matrices and Least Squares (Gilbert Strang) — bästa approximation och normalekvationer
Wikipedia
- Inner product space
- Dot product
- Cauchy–Schwarz inequality
- Orthonormality
- Frobenius inner product
- Function space
Fördjupning
- Kursbok kap 6.1 — fullständig genomgång av inre produktrum med bevis
- Georgia Tech — Interactive Linear Algebra: Inner Products
- Georgia Tech — Interactive Linear Algebra: Orthogonal Sets