\(\qquad\qquad\) VALIN EFNI Í STÆRÐFRÆÐI OG REIKNIFRÆÐI
Í þessum fyrirlestrarnótum eru tekin fyrir nokkur valin efni sem kennd eru í námskeiðinu Stærðfræði og reiknifræði við HÍ. Námsefnið er í smávegis þróun, en til að byrja með a.m.k. verður fjallað um þrjú aðskilin stærðfræðileg efni:
Föll af mörgum breytistærðum
Línulega algebru
Tölulega greiningu
Það verður ekki kafað mjög djúpt í þessi efni, enda er námsefnið ætlað til kennslu á nokkrum vikum (u.þ.b. fimm) en í HÍ eru heil námskeið helguð hverju framantalinna þriggja efna (Stærðfræðigreining 2 fjallar um föll af mörgum breytistærðum).
Samhliða svolítið stærðfræðilegri umfjöllun um námsefnið verða kynntar aðferðir til að fást við verkefni úr því með Python. Um notkun Python er annars fjallað í sérstakri rafbók, Fyrirlestrarnótur um Python.
1 Föll af mörgum breytistærðum¶
Byrjað verður á umfjöllun um föll af tveimur breytistærðum, og tekin dæmi um hvernig hægt er að snúa jöfnum til að skrifa stærð eða breytu sem er fólgin í jöfnu sem fall af hinum stærðunum (breytunum). Næst verða sýndar aðferðir til að skoða útlit tvívíðra falla án sérstakrar tilvísunar í Python en í Viðauka A er síðan farið nánar í hvernig hægt er að teikna slíkar myndir með Python. Þá eru hlutafleiður og stiglar á dagskrá, og fjallað er um aðferðir til að finna útgildi falla, bæði stærðfræðilega og með Python. Loks er talað stuttlega um föll af fleiri en tveimur breytistærðum.
Meðal hugtaka sem ekki er fjallað um hér en eru á dagskrá í náskeiðinu Stærðfræðigreining 2 eru ferlar, pólhnit, skorðuð útgildi og Lagrange-margfaldarar, margföld heildi og vigursvið.
1.1 Einvíð og tvívíð föll¶
Gert er ráð fyrir að lesendur þekki vel til falla sem varpa tölu í aðra tölu. Slík föll eru oft kölluð einvíð föll. Ritað er \(f:\Bbb{R} \to \Bbb{R}\) til að sýna að \(f\) sé fall sem varpi rauntölu í rauntölu og gildi fallsins í tiltekinni rauntölu \(x\) (sem sé talan sem \(x\) varpast í) er táknað með \(f(x)\). Oft er líka talað um fallið \(f(x)\), eða t.d. fallið \(x^2 + 1\) þar sem fallið er gefið með formúlunni \(f(x) = x^2 + 1\).
Meðal algengra hugtaka sem tengjast einvíðum föllum og margir læra um eru:
gröf falla
formengi og varpmengi (domain og range)
algeng föll: margliður, ræð föll, vísisföll, lograr, hornaföll
samskeytt (eða samsett) og andhverf föll (composite og inverse)
samfelld föll (continuous)
diffrun og afleiður (differentiation, derivatives)
heildun (integration)
Það gæti verið gagnlegt fyrir lesanda að rifja þessi hugtök upp, t.d. í rafrænu kennslubókunum Undirbúingur í stærðfræði og Stærðfræðigreining I á edbook.hi.is.
Það eru ýmsir möguleikar á að útvíkka einvíð föll, hægt væri að skoða föll sem varpa tölu í aðrar tvær tölur (það gefur ferla) eða þá föll sem varpa tveim tölum í aðrar tvær (vigursvið), en hér byrjum við á föllum sem varpa tveimur tölum í eina aðra.
Skilgreining: Tvívítt fall
Látum \(A \subseteq \Bbb{R}^2\). Fall sem úthlutar sérhverju pari \((x,y) \in A\) tiltekinni tölu \(z \in \Bbb{R}\) nefnist tvívítt fall (bivariate function) eða fall af tveimur breytistærðum. Ritað er \(f:A \to \Bbb{R}\) og \(z = f(x,y)\). Mengið \(A\) nefnist formengi fallsins og mengi allra mögulegra \(z\)-gilda nefnist varpmengi þess.
Athugasemd: Orðanotkun
Varpmengi er stundum nefnt myndmengi. Á ensku er það kallað image og formengi nefnist domain
Algengt er að hugsa um \(\Bbb{R}^2\) sem tvívíða hnitakerfið eða planið og þá er \(f\) fall sem úthlutar punkti í planinu tiltekinni tölu. En þetta er alls ekki nauðsynlegt. Tölurnar \(x\) og \(y\) geta vel verið bara einhverjar tölur sem ekki tákna hnit á neinum punkti sbr. liði 1–3 í sýnidæminu hér á eftir.
Oft táknar \(f(x,y)\) einhverja formúlu sem inniheldur \(x\) og \(y\), t.d. \(x + 3y\) en það er samt ekki nausðsynlegt, sbr. lið 4 í sýnidæminu. Svo er að sjálfsögðu hægt að nota aðra bókstafi en \(x\), \(y\), \(z\) og \(f\) eins og í liðum 3 og 4 í sýnidæminu. Einnig er mögulegt að nota breytur með vísa, t.d. \(y = f(x_1, x_2)\) eða (sbr. Python) \(y = f(x_0, x_1)\)
1.2 Dæmi um tvívíð föll¶
Sýnidæmi: Tvívíð föll
Látum \(x\) og \(y\) vera tvær tölur og \(f(x,y)\) tákna summu þeirra.
Látum \(A = \{(x,y) \in \Bbb{R}^2 | y \neq 0\}\) og \(g(x,y) = x/y\).
Flatarmál þríhyrnings með grunnlínu \(g\) og hæð \(h\) er gefið með fallinu
\[F(g,h) = \frac{gh}{2}\]Meðalhiti \(h\) á einhverjum stað á jörðunni með hnattstöðu (lengd og breidd) \(l\) og \(b\) er fall, \(h = H(l,b)\). \(H\) er dæmi um fall sem ekki er hægt að lýsa með einfaldri formúlu (mynd 1.4 sýnir litamynd af \(H\)).
Í þarnæstu æfingu verða formengi og varpmengi þessara falla á dagskrá.
Sérhver tvístæð talnaaðgerð, eins samlagningin og deilingin í a- og lið 2 sýnidæmisins, svarar til tvívíðs falls (frádráttur, margföldun, veldi, afgangur).
Æfing: Þrihyrningar og keilur
Teiknið (einhvern) þríhyrning með grunnlínu 3 og hæð 2. Reiknið svo flatarmál hans með fallinu \(F\)
Ákvarðið \(g\) þannig að \(F(g,2) = 18\).
Rúmmál keilu er einn þriðji af flatarmáli grunnflatar sinnum hæð hennar. Flatarmál hrings með radíus \(r\) er \(r^2\pi\). Lýsið rúmmáli keilu með tvíðvíðu falli af hæð hennar \(h\), og radíus grunnflatar, \(r\).
Reiknið rúmmál keilu með radíus grunnflatar 8 cm og hæð 18 cm.
Æfing: Formengi
Ákvarðið stærsta mögulega (eða viðeigandi) formengi og tilsvarandi varpmengi fallanna \(f\), \(g\), \(F\) og \(H\) í sýnidæminu hér á undan. Ath. að varpmengi \(H\) verður aðeins lýst með orðum, en hin ætti að vera hægt að tilgreina með stærðfræðirithætti.
Athugasemd:
Í svörunum má nota \(\Bbb{R}^+\) til að tákna jákvæðu rauntölurnar (án núlls), \(A \times B\) til að tákna faldmengið \(\{(a,b) \mid a \in A, b \in B\}\), \((a,b]\) eða \(]a,b]\) fyrir hálfopna bilið \(\{x \mid a < x \leq b\}\) (og tilsvarandi fyrir önnur bil) og loks \(A-B\) fyrir mengjamismuninn, stök \(A\) sem eru ekki í \(B\).
Æfing: Fallbyssa
Ef miðunarhorn fallbyssu (frá láréttu) er \(\theta\), upphafshraði kúlunnar er \(s\) og horft er framhjá loftmótstöðu, þá er lárétt vegalengd sem kúlan fer
þar sem \(g\) er þyngdarhröðunin, látum til einföldunar \(g = 10 \text{ m/s}^2\). Skrifið
\(d\) sem fall af \(s\) og \(\theta\)
\(s\) sem fall af \(d\) og \(\theta\)
\(\theta\) sem fall af \(d\) og \(s\)
Ákvarðið miðunarhornið í gráðum ef \(s\) = 150 m/s og d = 2000 m
1.3 Myndir af tvívíðum föllum¶
Á sama hátt og ferillinn \(\{(x,y) | y = f(x)\}\) er kallað graf einvíða fallsins \(f\), þá skilgreinum við graf tvívíðs falls \(f\) sem flötinn, eða yfirborðið \(\{(x,y,z) | z = f(x,y)\}\).
Til skoða gröf (útlit) tvívíðra falla eru ýmsar aðferðir. Ein algeng er að búa til hæðarlínumynd (contour plot) eins og hér er sýnt:
Hæðarlínur eru líka notaðar á landakortum og sýna hvar maður getur gengið í landslagi án þess að fara upp eða niður brekku, sem sé í sömu hæð yfir sjávarmáli. Þannig mynda þær t.d. lokaða ferla í kring um fjallstinda og lautir eða lægðir. Í gröfum tvíðvíðra falla er talað um hágildi (maxima) og lággildi (minima) eða hágildis- og lággildispunkta. Á myndinni að ofan sjást þrjú hágildi en ekkert lággildi.
Hér er landakort með hæðarlínum af Öskjuhlíð. Þeir sem eru kunnugir staðháttum sjá Veðurstofuhæðina og vatnstankinn, hólana í duftkirkjugarðinum og hljóðmanirnar við Bústaðaveg og Kringlumýrarbraut. Takið líka eftir að þar sem það eru engir litir og engar merkingar á hæðarlínunum þarf að þekkja vel til staðhátta til að vita að það er lægð (með tjörn) en ekki hæð þar sem merkt er með L.
Á Wikipediu má skoða landakort með merktum hæðarlínum og við munum síðar í námskeiðinu búa til ýmsar slíkar myndir með Python og Matplotlib.
Það er líka hægt að gera margskonar öðruvísi myndir af gröfum tvívíðra falla. Hér er t.d. litakóðuð mynd (eða hæðarsvæðamynd), sem sýnir meðalhitafallið \(H\) úr síðusta grein:
og hér eru netmynd (mesh plot) og upplýst þrívíð mynd af tvívíða fallinu
Enn ein leið er svo að skoða þversnið af tvívíðu falli, en þá er önnur breytan fest í einhverju gildi og eingöngu skoðað hvernig fallið er háð hinni breytunni. Lítum t.d. á fallið \(f(x,y)\) hér á undan og festum \(y=1\). Þversniðsfallið verður þá:
og graf þess lítur svona út:
Svo mætti teikna svona myndir fyrir fleiri gildi á \(y\) til að átta sig á hvernig tvívíða fallið lítur út.
Python: Teikning tvívíðra falla
Matplotlib hefur ýmsar skipanir til að teikna tvíðvíð föll: contour
teiknar hæðarlínumyndir, contourf
teiknar hæðarsvæðamynd (litakóðaða
mynd) og plot_surface
má nota til að teikna bæði netmynd og upplýsta
þrívíða mynd. Auk þessara þriggja má nefna plot_wireframe
,
plot_trisurf
og quiver
. Hér er dæmi um notkun contour
til að
teikna hæðarlínur fallsins
def f(x,y):
f1 = 3/(1+(x-2)**2+4*(y-3)**2)
f2 = 4/(1+x**2+y**2)
return f1 - f2
x = np.linspace(-2,4)
y = np.linspace(-1,4)
(X,Y) = np.meshgrid(x,y)
Z = f(X,Y)
plt.set_cmap('rainbow')
plt.contour(X, Y, Z, linewidths=3)
plt.colorbar()
plt.grid('True')
Notkun contour
og annarra skipana til að teikna tvívíð föll er nánar lýst
í Viðauka A.
1.4 Diffrun tvívíðra falla¶
Hægt er að útvíkka einvíða diffrun yfir í tvíða með ýmsu móti. Við byrjum á að skilgreina diffrun sem fæst með því að halda annarri breytu tvívíðs falls fastri og skoða það sem einvítt fall af hinni breytunni.
Skilgreining: Hlutafleiða
Ef \(f(x,y)\) er fall af \(x\) og \(y\) þá skilgreinum við hlutafleiðu (partial derivative) \(f\) með tilliti til (m.t.t.) \(x\) í punktinum \((a,b)\) sem markgildið (limit)
og hlutafleiðu \(f\) m.t.t. \(y\) í \((a,b)\) sem
(ef þessi markgildi eru til).
Skilgreiningin þýðir að hlutafleiða m.t.t. annarrar breytunnar er eins og venjuleg afleiða (derivative) af þverskurðarfallinu (cross section function) sem fæst með því að halda hinni breytunni fastri: Ef \(g(x) = f(x,b)\) þá gildir
Skilgreining: Diffranleiki
Ef markgildin sem skilgreina hlutafleiðurnar eru bæði til er sagt að \(f\) sé diffranlegt (differentiable) í \((a,b)\), en annars er það ódiffranlegt þar.
Hlutafleiðurnar tvær af \(f\) skilgreina tvö ný föll, \(f_x\colon A \to \Bbb{R}\) og \(f_y\colon A \to \Bbb{R}\). Gera þarf greinarmun á því að reikna hlutafleiðu \(f\), sem felur í sér að finna formúlur þessara falla fyrir almenn \(x\) og \(y\), og að reikna hlutafleiðu í tilteknum punkti, en þá er svarið tiltekin tala eða gildi.
Hlutafleiður koma víða við sögu í stærðfræði og stærðfræðilegum greinum. Í fyrsta lagi má nota þær í stærðfræðigreiningu til að finna lággildi og hágildi, normalvigra (sem eru hornréttir á yfirborð), snertiplön og Taylor-nálganir, og svo eru þær grunnurinn í svonefndum hlutafleiðujöfnum, sem eru mikið notaðar í til að smíða stærðfræðileg líkön t.d. í eðlisfræði, verkfræði, jarðeðlisfræði og hagfræði.
Sýnidæmi: Reikningur hlutafleiða
Látum \(f(x,y) = x^2y + 2y\). Þá er
(þar sem \(y\) er fasti virkar þetta eins og við séum að diffra t.d. \(x^2\cdot 3 + 2\cdot 3\)). Á sama hátt er
Hlutafleiðan af \(f\) m.t.t. \(x\) í punktinum \((3,5)\) fæst svo með því að stinga inn: \(f_x(3,5) = 2\cdot 3\cdot 5 = 30\).
Athugasemd: Einvíðar diffrunarreglur
Æfing: Hlutafleiður þriggja falla
Reiknið bæði \(f_x\) og \(f_y\) ef \(f(x,y) = x^2 + y\).
Diffrið fallið \(x \sin(y)\) bæði með tilliti til \(x\) og \(y\).
Lát \(f(x,y) = (1-x)^2 + (y-x^2)^2\). Ákvarðið fallið \(f_x(x,y)\) og gildið \(f_y(1,2)\).
1.5 Aðrir rithættir fyrir hlutafleiðu¶
Stundum viljum við diffra fall sem ekki hefur verið gefið nafn, í raun að diffra formúlu. Ef diffra skal formúlu m.t.t. \(x\) má setja \(D_x\) framan við hana, t.d.
Ef það er gert má setja lóðrétt strik með lágvísi aftan við til að sýna að reikna eigi hlutafleiðuna í tilteknum punkti:
Annar algengur ritháttur er að nota „rúnnað d“ (stundum borið fram del), t.d.
Slíkan rithátt má auðvitað líka nota þótt fallið hafi fengið nafn. Þannig er \(D_y f(x,y) = f_y(x,y)\). Ef ritað hefur verið \(z = \text{formúla}\), t.d. \(z = xy\) þá er oft litið svo á, þegar tekin er hlutafleiða, að \(z\) sé jafngild formúlunni, sem sé:
Æfing: Nokkrar hlutafleiður
Finnið eftirfarandi hlutafleiður:
Æfing
Látum \(d\) vera drægni fallbyssu eins og í æfingunni aftast í grein 1.2,
\(d = \dfrac{\normalsize{v^2}}{\normalsize{g}} \sin 2\theta\)
þar sem \(v\) er skothraðinn, \(\theta\) er horn miðað við láréttan flöt og \(g\) er þyngdarhröðunin (við notum \(g = 10 \text{m/s}^2\)).
Ákvarðið \(\dfrac{\partial\normalsize{d}}{\partial\normalsize{v}\vphantom{\theta}}\) og \(\dfrac{\partial\normalsize{d}}{\partial\normalsize{\theta}}\)
Fyrir gefinn hraða \(v\) verður drægnin að einvíðu falli, \(d = f(\theta)\), og hlutafleiðan m.t.t. \(\theta\) verður jöfn venjulegu afleiðunni \(f'(\theta)\). Þá má finna hámarksdrægni fallbyssunnar með því að leysa \(f'(\theta) = 0\). Finnið \(d_\text{max}\) ef \(v = 150 \text{ m/s}\).
1.6 Stigull¶
Venjuleg afleiða af einvíðu falli í tilteknum punkti er hallatala (slope) snertils (tangent) í punktinum. Til að útvíkka þessa skilgreiningu fyrir tvítt fall þarf að taka tillit til þess að í hverjum punkti eru margir snertlar. Til að höggva á hnútinn er valinn sá snertill sem hefur mestan bratta. Þannig er afleiða tvíðvíða fallsins eða stigull (gradient) þess látinn vera vigur en ekki tala eins og afleiða einvíða fallsins, stefna hans sýnir í hvaða átt bratinn er mestur og lengd hans gefur brattann.
Skilgreining: Stigull
Stigull falls \(f\) í punkti \((a,b)\) er vigur sem stefnir í þá átt sem fallið vex hraðast, og lengd hans er jöfn hallatölu snertils við graf fallsins sem stefnir í sömu átt.
Stigullinn mælir sem sé hve bratt graf fallsins er og átt mesta bratta. Hægt er að skoða þverskurðarfall eftir línu sem liggur í bröttustu stefnuna og lengd stigulsins verður afleiða þess falls. Ef fallið hefur engan halla er stigullinn núll.
Hér er mynd sem varpar ljósi á hugtakið stigul, og í Wikipediugreininni um stigla má skoða fleiri myndir.
Ritháttur og orðanotkun
Stigullinn af \(f\) er oftast táknaður með \(\nabla f\) en stundum með \(f'\), og stigull í \((x,y)\) er þá
Stigullinn er dæmi um svonefnt vigursvið (vector field), en það er fall \(\Bbb R^2 \to \Bbb R^2\) sem sendir sem sé punkta í planinu yfir í vigra. Venjuleg tvívíð föll eru líka stundum kölluð skalarsvið (scalar field), en skalar er annað orð yfir tölu. Þetta orðfæri er einkum notað í eðlisfræði, en líka í stærðfræðigreiningu sem er einmitt oft beitt í eðlisfræði. Stundum er líka talað um vigurgilt fall á \(\Bbb R^2\) (vector-valued function on \(\Bbb R^2\))
Tvívíð keðjuregla og tengsl stiguls og hlutafleiða
Einvíða keðjureglan segir að afleiða \(f(g(x))\) sé \(f'(g(x))g'(x)\) (sjá athugasemd aftarlega í kafla 1.4). Þessi regla er sönnuð í stærðfræðigreiningu, sjá t.d. hér. Á Khan Academy eru frekari útskýringar og þar er líka fín umfjöllun um tvívíðu keðjuregluna, þar með talið sönnun á henni.
Regla: Tvívíð keðjuregla
\[D_t f(x(t),y(t)) = f_x(x(t),y(t))x'(t) + f_y(x(t),y(t))y'(t)\]
Stigull er síðan nátengdur hlutafleiðum eins og þessi regla segir:
Regla: Stigull er vigur af hlutafleiðum
Stigull diffranlegs falls \(f\) í \((a,b)\) er vigurinn með hlutafleiðum \(f\), þ.e.a.s.
Við bregðum svo út af vananum, að sleppa flestum sönnunum, og sönnum þessa reglu. Með sönnuninni fylgir líka skýringarmynd.
Sönnun reglu
Látum \(p = (a,b)\) og \(u\) vera almennan vigur útfrá \(p\) með lengd 1. Svo skoðum við þverskurð af fallinu í stefnu \(u\). Látum \(g\) vera fallið í þeim þverskurði, sem sé \(g(t) = f(p+tu)\). Hallatala snertils í þessa stefnu er g‘(0) og með því að nota tvívíðu keðjuregluna fæst:
þar sem \(h = (f_x(p), f_y(p))\) og \(h \cdot u\) táknar innfeldi \(h\) og \(u\) (sbr. kafla 10.3 í Fyrirlestrarnótum um Python.
Næst er notuð regla um innfeldi sem margir kannast við, nefnilega að innfeldi tveggja vigra fáist með því að margfalda saman lengdir þeirra og kósínus af horninu milli þeirra. Reglan verður sönnuð í kaflanum um línulega algebru, en hún segir sem sé:
Þetta gefur okkur að snertilhallinn er \(g'(0)\) = \(|h|\cdot |u|\cos \theta\) = \(|h|\cdot 1\cdot \cos\theta\) = \(|h|\cos \theta\) þar sem \(\theta\) er hornið á milli \(h\) og \(u\). Þessi halli verður stærstur þegar \(\theta\) = 0 (því þá er kósínusinn 1, en annars er hann minni), það er að segja þegar \(u\) stefnir í sömu átt og \(h\). En sú mesta bratta stefna er einmitt stefna stigulsins, og svo gildir auk þess að stigullinn hefur lengd sem er þessi mesti bratti, og niðurstaðan er að stigullinn hlýtur að vera jafn \(h\), eins og sanna átti.
Stigull og hæðarlínur
Eins og útskýrt var að framan er stigull vigur sem stefnir upp bröttustu brekkuna, og hann er því lengri sem brattinn er meiri. Ein afleiðing þessa er eftirfarandi regla.
Regla: Stiglar eru hornréttir á hæðarlínur
Stigull falls í gefnum punkti er hornréttur á hæðarlínu fallsins í gegn um punktinn
Sýnidæmi: Stigull fundinn
Finnum stigul fallsins
fyrst í almennum punkti \((x,y)\) og síðan í punktinum \((2,1)\). Hlutafleiður \(f\) eru \(f_x = 2x+y-3\) og \(f_y = x + 2y\) og almenni stigullinn er því
Ef við látum \(x=2\) og \(y=1\) fæst:
Python: Örvarit
Matplotlib fallið quiver
má nota til að teikna örvarit: örvar í
rétthyrndu neti sem sýna vigursvið. Örvarnar hafa rétta stefnu, en lengdir
þeirra eru skalaðar sjálfkrafa, þó þannig að hlutfallslegar lengdir haldi
sér. Þetta fall má nota til að teikna stigla falls, eins og sýnt er með
dæmi í Viðauka A.
1.7 Stefnuafleiða¶
Snertilhallinn sem kom við sögu í sönnuninni hér á undan hefur nafn, og er kallaður stefnuafleiða. Hana má skilgreina þótt \(u\) hafi ekki lengd 1, nefnilega:
Skilgreining: Stefnuafleiða
Stefnuafleiða diffranlegs falls \(f\) í stefnu vigurs \(u\) í punkti \(p\) er hallatalan sem fæst ef farið er frá \(p\) úteftir \(u\), nánar tiltiltekið afleiða fallsins \(g(t) = f(p + tu)\) í 0.
Og ef \(u\) hefur lengd 1 þá er stefnuafleiðan hallatala snertils við graf fallsins í \(p\) sem stefnir í sömu átt og \(u\). Bláa línan \(T\) á eftirfarandi mynd sýnir umræddan snertil.
Stefnuafleiðan er táknuð með \(f'(p; u)\). Svo er líka hægt að skilgreina stefnuafleiðuna með formúlu, sem minnir á formúluna sem venjuleg afleiða er skilgreind með:
Næsta setning gefur okkur aðferð til að reikna stefnuafleiðu og sönnun hennar er í raun þegar komin, sem hluti af sönnuninni hér á undan (í grein 1.6). Hún er nefnilega innfeldi stigulsins í \(p\) og stefnuvigursins \(u\):
Regla: Tengsl stefnuafleiðu við stigul
\(f'(p;u) = \nabla f(p) \cdot u\)
Stefnuafleiðan er sem sé innfeldi. Ein afleiðing af þessari setningu er að hlutafleiður \(f\) eru stefnuafleiður í stefnu einingavigranna, \((1,0)\) og \((0,1)\), en um einingavigra verður fjallað nánar í kaflanum um línulega algebru.
Sýnidæmi: Stefnuafleiða falls
Finnum stefnuafleiðu fallsins
út eftir \(u = (1, 3)\) í punktinum \(p = (2,1)\). Skv. síðasta sýnidæmi er \(\nabla f(2,1) = (2,4)\) og stefnuafleiðan er þess vegna
Æfing: Stefnuafleiða
Lát \(f(x, y) = x^2 + 2xy\), \(p=(1,2)\) og \(u=(1,1)\). Reiknið \(f'(p; u)\).
1.8 Annars stigs hlutafleiður Hesse-fylki og tvívíðar ákveður¶
Eftirfarandi skilgreining er fengin að láni úr fyrirlestrarnótum um Stærðfræðigreiningu II:
Skilgreining:
Ritum \(z=f(x,y)\). Annars stigs hlutafleiður f eru skilgreindar með formúlunum
Þar er líka sannað að \(f_{xy}(x,y) = f_{yx}(x,y)\) ef \(f\) uppfyllir tiltekin samfelldniskilyrði, sem flest föll sem við fáumst við gera.
Annars stigs hlutafleiður eru oft settar fram í fylki sem stundum er táknað með \(\nabla^2 f\):
Skilgreining: Hesse-fylki
Hesse-fylki (Hessian matrix) tvívíðs falls \(f\) í punkti \(p = (x,y)\) er fylkið
Skv. framansögðu er Hesse-fylkið (yfirleitt) samhverft.
Ákveða (determinant) er hugtak sem oft er notað í línulegri algebru. Ákveður verða notaðar í næsta undirkafla til að flokka útgildi og í kafla 2.13 er setning sem tengir ákveður og andhverfanleg fylki. Fyrir \(2 \times 2\) fylki er skilgreining ákveðunnar einföld:
Skilgreining: Tvívíð ákveða
Ákveða \(2 \times 2\) fylkis \(A = \begin{pmatrix}a & b\\c & d\end{pmatrix}\) er
Ákveður má skilgreina fyrir almenn ferningslaga fylki, en skilgreiningin er dálítið flókin og við látum duga að vísa í Wikipedíugreinina um ákveður.
Python: Ákveða
Fallið la.det
má nota til að reikna ákveðu ferningslaga fylkis. Til að
virkja það þarf að flytja NumPy pakka fyrir línulega inn með import
numpy.linalg as la
.
1.9 Útgildi tvívíðra falla¶
Hágildi og lággildi
Tvívítt fall \(f\colon A\to \Bbb R\) er sagt hafa víðvært hágildi (global maximum) í punkti \(p = (x_0, y_0)\) ef gildi fallsins þar er stærra en eða jafnt og gildi þess í öllum öðrum punktum formengisins \(A\), og á sama hátt hefur \(f\) víðvært lággildi (minimum) í \(p\) ef gildið þar er minna en eða jafnt og gildið allsstaðar annarsstaðar. Ef til er grennd um \(p\) þannig að \(f(p) \geq f(x,y)\) fyrir alla punkta \((x,y)\) í grenndinni þá er hágildið staðbundið (local). Staðbundið lággildi er skilgreint á samsvarandi hátt. Ef gildi falls er hvergi (í \(A\) eða grenndinni) jafn hátt (lágt) og í \(p\) er hágildið (lággildið) kallað strangt (strict). Samheiti yfir há- og lágildi er útgildi (extremum).
Við höfum þegar séð ýmsar hæðarlínumyndir með há- og lággildum, t.d. í myndum 1.2, 1 og 5.
Ákvörðun útgilda falla hefur margskonar hagnýtingu, og sérstök undirgrein hagnýtrar stærðfræði, töluleg bestunarfræði (numerical optimization), fjallar um aðferðir til þess að finna þau. Stundum snýst verkefnið um að hámarka hagnað eða lágmarka kostnað, en stundum er markmiðið að finna stika líkans sem nálga gögn vel.
Útgildi fundin með því að leysa jöfnur
Á sama hátt og útgildi einvíðra falla einkennast af því að afleiðan þar er núll, þá einkennast útgildi tvívíðra falla af því að stigullinn þar er núll. Lausnir jöfnunnar
gefa þá útgildin en auk þess söðulpunkta (saddle points) sem sum föll hafa. Það eru punktar þar sem stigullinn er núll, og þannig að til er leið frá þeim með vaxandi \(f\)-gildum og önnur með minnkandi \(f\)-gildum. Sérstöðupunktur er samheiti yfir hágildis-, lággildis- og söðulpunkta.
Dæmi um fall með söðulpunkt er \(f(x,y) = 10 + x^2 - y^2\) sem sýnt er á eftirfarandi mynd:
Þar sem báðar hliðar í jöfnunni að ofan eru vigur felur lausn hennar í sér að leysa saman tvær jöfnur í tveimur óþekktum (\(x\) og \(y\)):
Stundum er hægt að leysa þessar jöfnur með algebru/stærðfræðigreiningu, en oftar en ekki þarf að beita tölulegum aðferðum. Eftir að lausnirnar eru fundnar þarf svo að flokka þær í hágildi, lággildi og söðulpunkta.
Sýnidæmi: Sérstöðupunktar
Ákvörðum sérstöðupunkta fallsins
Stigullinn er \(\nabla f = (2x + y - 3, x + 2y)\) svo við þurfum að leysa jöfnurnar:
Smá útreikningar gefa nú \(x = 2\) og \(y = -1\). En er þetta lággildi, hágildi eða söðulpunktur? Svarið er lággildi, og það er m.a. hægt að sjá útfrá því að þetta er eina lausnin, og að fallið vex upp úr öllu valdi ef \(x\) og \(y\) eru látin stefna á óendanlegt.
Flokkun útgilda
Hér að framan skoðuðum við hvað gerist fyrir stór \(x\) og \(y\) til að sjá að um lággildi væri að ræða, en önnur aðferð til að sjá hvort hvort núllstöð stiguls tvíðs falls sé hágildis-, lággildis- eða söðulpunktur er að reikna Hesse-fylki fallsins í núllstöðinni, í framhaldi ákveðu þess, og nota svo eftirfarandi reglu:
Regla: Hesse-fylki og útgildi
Gerum ráð fyrir að \(\nabla f(x,y) = 0\), \(H = \nabla ^2 f(x,y)\) og \(a = h_{11} = f_{xx}(x,y)\). Þá gildir:
Ef \(\det(H) > 0\) og \(a > 0\) þá hefur \(f\) staðbundið lággildi í \((x,y)\)
Ef \(\det(H) > 0\) og \(a < 0\) þá hefur \(f\) staðbundið hágildi í \((x,y)\)
Ef \(\det(H) < 0\) þá hefur \(f\) söðulpunkt í \((x,y)\)
Ef \(\det(H) = 0\) þá er ekkert hægt að segja.
Sýnidæmi: Útgildispunktar, framhald
Hesse-fylki fallsins \(f\) fæst með því að diffra aftur:
(t.d. fæst stakið efst til vinstri með því að diffra \(f_x(x,y) = 2x + y - 3\) með tilliti til \(x\)). Fylkið er sem sé fasti og því:
Svo fæst \(\det(H) = 2 \cdot 2 - 1 \cdot 1 = 3\) og \(a = h_{11} = 2\). Skv. síðustu reglu er því punkturinn \((2,-1)\) lággildispunktur.
Æfing: Loklaus kassi
Smíða skal loklausan kassa sem tekur 500 \(\text{cm}^3\) (sem sé hálfan lítra) úr blikkplötum þannig að sem minnst blikk sé notað. Ákvarðið hæð hans, lengd og breidd með eftirfarandi aðferð: Kallið lengdina \(x\) og breiddina \(y\). Þá verður hæðin \(h = 500/(xy)\). Látið nú \(f(x,y)\) = flatarmál blikksins sem þarf, finnið formúlu fyrir \(f\) og lágmarkið með því að leysa jöfnurnar sem fást þegar hlutafleiður \(f\) eru settar núll.
Athugið
Fyrirlestrarnótur í Stærðfræðigreiningu 2 eru með ýmislegt efni og myndir sem gæti gagnast við að skilja tvívíð föll, hlutafleiður og stigla betur
Sýnidæmi: Jafna bestu línu
Aðferð minnstu kvaðrata (linear least squares method) til að finna jöfnu bestu línu snýst um að lágmarka kvaðratsummu fjarlægða milli línunnar og gefins punktasafns. Ef punktarnir eru \((x_1,y_1),\ldots,(x_n,y_n)\) og jafna línunnar er:
og þá er þessi kvaðratsumma gefin með tvívíða fallinu:
(sjá á wikipedíu). Því minni sem þessi summa er, því betur fylgir línan punktasafninu. Jöfnu bestu línu má þannig ákvarða með því að reikna stigla fallsins \(S\) og leysa jöfnurnar sem fást með því að setja þá jafna núll. Þetta gefur:
Þetta eru tvær jöfnur í óþekktu stærðunum \(a\) og \(b\) og það eru
einmitt þær sem eru leystar í NumPy fallinu polyfit
í kafla 13.6 í
Fyrirlestrarnótum um Python.
1.10 Margvíð föll¶
Skilgreining og dæmi
Rifjum upp að tvívítt fall er fall \(f\colon A \to \Bbb{R}\) þar sem \(A \subseteq \mathbb{R}^2\). Á sama hátt er \(n\)-vítt fall fall:
Við getum tekið dæmi um hitastigfallið H á mynd 1.4. Það væri hægt að hugsa sér fall til að tákna meðalhita ekki bara við yfirborð, heldur líka ofar, t.d. í 10 m hæð (eða 1 km). Almennt mætti skilgreina þrívítt fall:
(þó það væri líklega ansi erfitt að ákvarða gildi \(H\) allsstaðar). Við gætum líka hugsað okkur að ákvarða jöfnu bestu parabólu með því að lágmarka fallið
(þá er gildir \(S\colon \mathbb{R}^3 \to \mathbb{R}\)). Það er mun erfiðara að búa til myndir af margvíðum föllum en tvívíðum. Helsta aðferðin er að sýna nokkur þverskurðarföll: Við gætum t.d. sýnt sérstaka mynd af meðalhitanum við yfirborð, í 100 m hæð, 200 m hæð o.s.frv. Veðurfræðingar skoða stundum veðurkort í jafnþrýstiflötum, t.d. 500 millibara fletinum.
Viðfang skrifað sem vigur
Stakið \(x\) í formenginu sem margvítt fall varpar úr er vigur með \(n\) stökum:
og ef þetta stak varpast t.d. í 5 má rita viðföng þess annaðhvort sem margar tölur (stökin í vigrinum) eða einn vigur, sem sé
Á eftirfarandi mynd væri \(X \subseteq \mathbb{R}^n\), \(Y = \mathbb{R}\) og \(f(x) = 5\).
Þegar unnið er samhliða með stærðfræði og Python getur líka verið þægilegt að byrja að telja í 0. Svona vigur-ritháttur fyrir viðfangið er því algengari sem \(n\) er stærra. Ef \(n\) er 2 eða 3 er oft ritað \(f(x,y)\) eða \(f(x,y,z)\) en fyrir math:n geq 4 er algengast að nota \(f(x)\) og láta \(x\) vera vigur, og það er reyndar oft gert líka fyrir \(n=2\textrm{ eða }3\). Reyndar höfum við nú þegar nýtt okkur þennan möguleika, í sönnuninni í kafla 1.6 þar sem við skrifuðum \(p\) í stað \((a,b)\).
Margvíðir stiglar
Stigull af \(n\)-víðu falli er \(n\)-vigur:
Eins og fyrir tvívíð föll segir stigullinn okkur í hvaða átt fallið vex hraðast. Við getum hugsað okkur fugl á flugi sem er kalt, hann gæti e.t.v. haft vit á að fljúga í stefnu stiguls þrívíða fallsins \(H\) sem talað var um í greinininn hér á undan. Margvíðir stiglar verða aftur á dagskrá þegar fjallað verður um Taylor-nálgun í kaflanum um línulega algebru.