\(\qquad\qquad\) VALIN EFNI Í STÆRÐFRÆÐI OG REIKNIFRÆÐI

Í þessum fyrirlestrarnótum eru tekin fyrir nokkur valin efni sem kennd eru í námskeiðinu Stærðfræði og reiknifræði við HÍ. Námsefnið er í smávegis þróun, en til að byrja með a.m.k. verður fjallað um þrjú aðskilin stærðfræðileg efni:

Föll af mörgum breytistærðum
Línulega algebru
Tölulega greiningu

Það verður ekki kafað mjög djúpt í þessi efni, enda er námsefnið ætlað til kennslu á nokkrum vikum (u.þ.b. fimm) en í HÍ eru heil námskeið helguð hverju framantalinna þriggja efna (Stærðfræðigreining 2 fjallar um föll af mörgum breytistærðum).

Samhliða svolítið stærðfræðilegri umfjöllun um námsefnið verða kynntar aðferðir til að fást við verkefni úr því með Python. Um notkun Python er annars fjallað í sérstakri rafbók, Fyrirlestrarnótur um Python.

1  Föll af mörgum breytistærðum

Byrjað verður á umfjöllun um föll af tveimur breytistærðum, og tekin dæmi um hvernig hægt er að snúa jöfnum til að skrifa stærð eða breytu sem er fólgin í jöfnu sem fall af hinum stærðunum (breytunum). Næst verða sýndar aðferðir til að skoða útlit tvívíðra falla án sérstakrar tilvísunar í Python en í Viðauka A er síðan farið nánar í hvernig hægt er að teikna slíkar myndir með Python. Þá eru hlutafleiður og stiglar á dagskrá, og fjallað er um aðferðir til að finna útgildi falla, bæði stærðfræðilega og með Python. Loks er talað stuttlega um föll af fleiri en tveimur breytistærðum.

Meðal hugtaka sem ekki er fjallað um hér en eru á dagskrá í náskeiðinu Stærðfræðigreining 2 eru ferlar, pólhnit, skorðuð útgildi og Lagrange-margfaldarar, margföld heildi og vigursvið.

1.1  Einvíð og tvívíð föll

Gert er ráð fyrir að lesendur þekki vel til falla sem varpa tölu í aðra tölu. Slík föll eru oft kölluð einvíð föll. Ritað er \(f:\Bbb{R} \to \Bbb{R}\) til að sýna að \(f\) sé fall sem varpi rauntölu í rauntölu og gildi fallsins í tiltekinni rauntölu \(x\) (sem sé talan sem \(x\) varpast í) er táknað með \(f(x)\). Oft er líka talað um fallið \(f(x)\), eða t.d. fallið \(x^2 + 1\) þar sem fallið er gefið með formúlunni \(f(x) = x^2 + 1\).

Meðal algengra hugtaka sem tengjast einvíðum föllum og margir læra um eru:

  • gröf falla

  • formengi og varpmengi (domain og range)

  • algeng föll: margliður, ræð föll, vísisföll, lograr, hornaföll

  • samskeytt (eða samsett) og andhverf föll (composite og inverse)

  • samfelld föll (continuous)

  • diffrun og afleiður (differentiation, derivatives)

  • heildun (integration)

Það gæti verið gagnlegt fyrir lesanda að rifja þessi hugtök upp, t.d. í rafrænu kennslubókunum Undirbúingur í stærðfræði og Stærðfræðigreining I á edbook.hi.is.

Það eru ýmsir möguleikar á að útvíkka einvíð föll, hægt væri að skoða föll sem varpa tölu í aðrar tvær tölur (það gefur ferla) eða þá föll sem varpa tveim tölum í aðrar tvær (vigursvið), en hér byrjum við á föllum sem varpa tveimur tölum í eina aðra.

Skilgreining: Tvívítt fall

Látum \(A \subseteq \Bbb{R}^2\). Fall sem úthlutar sérhverju pari \((x,y) \in A\) tiltekinni tölu \(z \in \Bbb{R}\) nefnist tvívítt fall (bivariate function) eða fall af tveimur breytistærðum. Ritað er \(f:A \to \Bbb{R}\) og \(z = f(x,y)\). Mengið \(A\) nefnist formengi fallsins og mengi allra mögulegra \(z\)-gilda nefnist varpmengi þess.

Athugasemd: Orðanotkun

Varpmengi er stundum nefnt myndmengi. Á ensku er það kallað image og formengi nefnist domain

../_images/tvívítt-fall.jpg

Mynd 1.1: Tvívítt fall. \(A\) er formengi fallsins.

Algengt er að hugsa um \(\Bbb{R}^2\) sem tvívíða hnitakerfið eða planið og þá er \(f\) fall sem úthlutar punkti í planinu tiltekinni tölu. En þetta er alls ekki nauðsynlegt. Tölurnar \(x\) og \(y\) geta vel verið bara einhverjar tölur sem ekki tákna hnit á neinum punkti sbr. liði 1–3 í sýnidæminu hér á eftir.

Oft táknar \(f(x,y)\) einhverja formúlu sem inniheldur \(x\) og \(y\), t.d. \(x + 3y\) en það er samt ekki nausðsynlegt, sbr. lið 4 í sýnidæminu. Svo er að sjálfsögðu hægt að nota aðra bókstafi en \(x\), \(y\), \(z\) og \(f\) eins og í liðum 3 og 4 í sýnidæminu. Einnig er mögulegt að nota breytur með vísa, t.d. \(y = f(x_1, x_2)\) eða (sbr. Python) \(y = f(x_0, x_1)\)

1.2  Dæmi um tvívíð föll

Sýnidæmi: Tvívíð föll

  1. Látum \(x\) og \(y\) vera tvær tölur og \(f(x,y)\) tákna summu þeirra.

  2. Látum \(A = \{(x,y) \in \Bbb{R}^2 | y \neq 0\}\) og \(g(x,y) = x/y\).

    ../_images/þríhyrningur.jpg
  3. Flatarmál þríhyrnings með grunnlínu \(g\) og hæð \(h\) er gefið með fallinu

    \[F(g,h) = \frac{gh}{2}\]
  4. Meðalhiti \(h\) á einhverjum stað á jörðunni með hnattstöðu (lengd og breidd) \(l\) og \(b\) er fall, \(h = H(l,b)\). \(H\) er dæmi um fall sem ekki er hægt að lýsa með einfaldri formúlu (mynd 1.4 sýnir litamynd af \(H\)).

Í þarnæstu æfingu verða formengi og varpmengi þessara falla á dagskrá.

Sérhver tvístæð talnaaðgerð, eins samlagningin og deilingin í a- og lið 2 sýnidæmisins, svarar til tvívíðs falls (frádráttur, margföldun, veldi, afgangur).

Æfing: Þrihyrningar og keilur

../_images/keila.jpg
  1. Teiknið (einhvern) þríhyrning með grunnlínu 3 og hæð 2. Reiknið svo flatarmál hans með fallinu \(F\)

  2. Ákvarðið \(g\) þannig að \(F(g,2) = 18\).

  3. Rúmmál keilu er einn þriðji af flatarmáli grunnflatar sinnum hæð hennar. Flatarmál hrings með radíus \(r\) er \(r^2\pi\). Lýsið rúmmáli keilu með tvíðvíðu falli af hæð hennar \(h\), og radíus grunnflatar, \(r\).

  4. Reiknið rúmmál keilu með radíus grunnflatar 8 cm og hæð 18 cm.

Æfing: Formengi

Ákvarðið stærsta mögulega (eða viðeigandi) formengi og tilsvarandi varpmengi fallanna \(f\), \(g\), \(F\) og \(H\) í sýnidæminu hér á undan. Ath. að varpmengi \(H\) verður aðeins lýst með orðum, en hin ætti að vera hægt að tilgreina með stærðfræðirithætti.

Athugasemd:

Í svörunum má nota \(\Bbb{R}^+\) til að tákna jákvæðu rauntölurnar (án núlls), \(A \times B\) til að tákna faldmengið \(\{(a,b) \mid a \in A, b \in B\}\), \((a,b]\) eða \(]a,b]\) fyrir hálfopna bilið \(\{x \mid a < x \leq b\}\) (og tilsvarandi fyrir önnur bil) og loks \(A-B\) fyrir mengjamismuninn, stök \(A\) sem eru ekki í \(B\).

Æfing: Fallbyssa

Ef miðunarhorn fallbyssu (frá láréttu) er \(\theta\), upphafshraði kúlunnar er \(s\) og horft er framhjá loftmótstöðu, þá er lárétt vegalengd sem kúlan fer

../_images/fallbyssa.jpg
\[d = \dfrac{\normalsize{s^2}}{\normalsize{g}} \sin 2\theta\]

þar sem \(g\) er þyngdarhröðunin, látum til einföldunar \(g = 10 \text{ m/s}^2\). Skrifið

  1. \(d\) sem fall af \(s\) og \(\theta\)

  2. \(s\) sem fall af \(d\) og \(\theta\)

  3. \(\theta\) sem fall af \(d\) og \(s\)

  4. Ákvarðið miðunarhornið í gráðum ef \(s\) = 150 m/s og d = 2000 m

1.3  Myndir af tvívíðum föllum

Á sama hátt og ferillinn \(\{(x,y) | y = f(x)\}\) er kallað graf einvíða fallsins \(f\), þá skilgreinum við graf tvívíðs falls \(f\) sem flötinn, eða yfirborðið \(\{(x,y,z) | z = f(x,y)\}\).

Til skoða gröf (útlit) tvívíðra falla eru ýmsar aðferðir. Ein algeng er að búa til hæðarlínumynd (contour plot) eins og hér er sýnt:

../_images/hæðarlínur.jpg

Mynd 1.2: Hæðarlínumynd með þremur hágildum

Hæðarlínur eru líka notaðar á landakortum og sýna hvar maður getur gengið í landslagi án þess að fara upp eða niður brekku, sem sé í sömu hæð yfir sjávarmáli. Þannig mynda þær t.d. lokaða ferla í kring um fjallstinda og lautir eða lægðir. Í gröfum tvíðvíðra falla er talað um hágildi (maxima) og lággildi (minima) eða hágildis- og lággildispunkta. Á myndinni að ofan sjást þrjú hágildi en ekkert lággildi.

Hér er landakort með hæðarlínum af Öskjuhlíð. Þeir sem eru kunnugir staðháttum sjá Veðurstofuhæðina og vatnstankinn, hólana í duftkirkjugarðinum og hljóðmanirnar við Bústaðaveg og Kringlumýrarbraut. Takið líka eftir að þar sem það eru engir litir og engar merkingar á hæðarlínunum þarf að þekkja vel til staðhátta til að vita að það er lægð (með tjörn) en ekki hæð þar sem merkt er með L.

../_images/öskjuhlíð.jpg

Mynd 1.3: Hæðarlínukort af vef Reykjavíkurborgar

Á Wikipediu má skoða landakort með merktum hæðarlínum og við munum síðar í námskeiðinu búa til ýmsar slíkar myndir með Python og Matplotlib.

Það er líka hægt að gera margskonar öðruvísi myndir af gröfum tvívíðra falla. Hér er t.d. litakóðuð mynd (eða hæðarsvæðamynd), sem sýnir meðalhitafallið \(H\) úr síðusta grein:

../_images/jarðarhiti.jpg

Mynd 1.4: Meðalhiti ársins

og hér eru netmynd (mesh plot) og upplýst þrívíð mynd af tvívíða fallinu

\[f(x,y) = \frac{1 + 4\sin r}{1 + 4r} \text{ þar sem } r = \sqrt{x^2 + y^2}:\]
../_images/netmynd.jpg

Mynd 1.5: Tvær myndir af tvívíðu falli

Enn ein leið er svo að skoða þversnið af tvívíðu falli, en þá er önnur breytan fest í einhverju gildi og eingöngu skoðað hvernig fallið er háð hinni breytunni. Lítum t.d. á fallið \(f(x,y)\) hér á undan og festum \(y=1\). Þversniðsfallið verður þá:

\[g(x) = f(x,1) = \frac{1 + 4\sin \sqrt{x^2 + 1}}{1 + 4\sqrt{x^2 + 1}}\]

og graf þess lítur svona út:

../_images/þversnið.png

Mynd 1.6: Þversnið fallsins á Mynd 1.5: þegar \(y=1\)

Svo mætti teikna svona myndir fyrir fleiri gildi á \(y\) til að átta sig á hvernig tvívíða fallið lítur út.

Python: Teikning tvívíðra falla

Matplotlib hefur ýmsar skipanir til að teikna tvíðvíð föll: contour teiknar hæðarlínumyndir, contourf teiknar hæðarsvæðamynd (litakóðaða mynd) og plot_surface má nota til að teikna bæði netmynd og upplýsta þrívíða mynd. Auk þessara þriggja má nefna plot_wireframe, plot_trisurf og quiver. Hér er dæmi um notkun contour til að teikna hæðarlínur fallsins

\[f(x,y) = \dfrac{3}{1+(x-2)^2+(y-3)^2} - \dfrac{4}{1 + x^2 + y^2}\]
../_images/contour-dæmi.jpg
def f(x,y):
  f1 = 3/(1+(x-2)**2+4*(y-3)**2)
  f2 = 4/(1+x**2+y**2)
  return f1 - f2

x = np.linspace(-2,4)
y = np.linspace(-1,4)
(X,Y) = np.meshgrid(x,y)
Z = f(X,Y)
plt.set_cmap('rainbow')
plt.contour(X, Y, Z, linewidths=3)
plt.colorbar()
plt.grid('True')

Notkun contour og annarra skipana til að teikna tvívíð föll er nánar lýst í Viðauka A.

1.4  Diffrun tvívíðra falla

Hægt er að útvíkka einvíða diffrun yfir í tvíða með ýmsu móti. Við byrjum á að skilgreina diffrun sem fæst með því að halda annarri breytu tvívíðs falls fastri og skoða það sem einvítt fall af hinni breytunni.

Skilgreining: Hlutafleiða

Ef \(f(x,y)\) er fall af \(x\) og \(y\) þá skilgreinum við hlutafleiðu (partial derivative) \(f\) með tilliti til (m.t.t.) \(x\) í punktinum \((a,b)\) sem markgildið (limit)

\[f_x(a,b)=\lim_{h\to 0}\frac{f(a+h,b)-f(a,b)}{h}\]

og hlutafleiðu \(f\) m.t.t. \(y\) í \((a,b)\) sem

\[f_y(a,b)=\lim_{k\to 0}\frac{f(a,b+k)-f(a,b)}{k}\]

(ef þessi markgildi eru til).

Skilgreiningin þýðir að hlutafleiða m.t.t. annarrar breytunnar er eins og venjuleg afleiða (derivative) af þverskurðarfallinu (cross section function) sem fæst með því að halda hinni breytunni fastri: Ef \(g(x) = f(x,b)\) þá gildir

\[f_x(a,b) = g'(b)\]

Skilgreining: Diffranleiki

Ef markgildin sem skilgreina hlutafleiðurnar eru bæði til er sagt að \(f\)diffranlegt (differentiable) í \((a,b)\), en annars er það ódiffranlegt þar.

Hlutafleiðurnar tvær af \(f\) skilgreina tvö ný föll, \(f_x\colon A \to \Bbb{R}\) og \(f_y\colon A \to \Bbb{R}\). Gera þarf greinarmun á því að reikna hlutafleiðu \(f\), sem felur í sér að finna formúlur þessara falla fyrir almenn \(x\) og \(y\), og að reikna hlutafleiðu í tilteknum punkti, en þá er svarið tiltekin tala eða gildi.

Hlutafleiður koma víða við sögu í stærðfræði og stærðfræðilegum greinum. Í fyrsta lagi má nota þær í stærðfræðigreiningu til að finna lággildi og hágildi, normalvigra (sem eru hornréttir á yfirborð), snertiplön og Taylor-nálganir, og svo eru þær grunnurinn í svonefndum hlutafleiðujöfnum, sem eru mikið notaðar í til að smíða stærðfræðileg líkön t.d. í eðlisfræði, verkfræði, jarðeðlisfræði og hagfræði.

Sýnidæmi: Reikningur hlutafleiða

Látum \(f(x,y) = x^2y + 2y\). Þá er

\[f_x(x,y) = 2xy + 0 = 2xy\]

(þar sem \(y\) er fasti virkar þetta eins og við séum að diffra t.d. \(x^2\cdot 3 + 2\cdot 3\)). Á sama hátt er

\[f_y(x,y) = x^2 + 2.\]

Hlutafleiðan af \(f\) m.t.t. \(x\) í punktinum \((3,5)\) fæst svo með því að stinga inn: \(f_x(3,5) = 2\cdot 3\cdot 5 = 30\).

Athugasemd: Einvíðar diffrunarreglur

\[\begin{split}\begin{align} & D (af(x)) = af'(x) \\ & D x^n = nx^{n-1} \\ & D \sqrt{x} = \frac{1}{2\sqrt{x}} \\ & D \sin x = \cos x\textrm{ og } D \cos x = -\!\sin x \\ & D \ln x = \frac{1}{x} \\ & D e^x = e^x \textrm{ (ath. }e^x\textrm{ er stundum táknað }\exp(x)\textrm{)} \\ & D a^x = a^x \ln a \\ & D f(g(x)) = f'(g(x))g'(x) \\ & D (uv) = u'v + uv' \textrm{ þ.e. } D(f(x)g(x)) = f'(x)g(x) + f(x)g'(x) \\ & D \frac{u}{v} = \frac{u'v - uv'}{v^2} \end{align}\end{split}\]

Æfing: Hlutafleiður þriggja falla

  1. Reiknið bæði \(f_x\) og \(f_y\) ef \(f(x,y) = x^2 + y\).

  2. Diffrið fallið \(x \sin(y)\) bæði með tilliti til \(x\) og \(y\).

  3. Lát \(f(x,y) = (1-x)^2 + (y-x^2)^2\). Ákvarðið fallið \(f_x(x,y)\) og gildið \(f_y(1,2)\).

1.5  Aðrir rithættir fyrir hlutafleiðu

Stundum viljum við diffra fall sem ekki hefur verið gefið nafn, í raun að diffra formúlu. Ef diffra skal formúlu m.t.t. \(x\) má setja \(D_x\) framan við hana, t.d.

\[D_x (x^2(y-1)^2 + x) = 2x(y-1)^2 + 1\]

Ef það er gert má setja lóðrétt strik með lágvísi aftan við til að sýna að reikna eigi hlutafleiðuna í tilteknum punkti:

\[D_x (x^2y^2 + x)\big|_{x=1,y=2} = 2xy^2 + 1\big|_{x=1,y=2} = 2\cdot 1 \cdot 2^2 + 1 = 9.\]

Annar algengur ritháttur er að nota „rúnnað d“ (stundum borið fram del), t.d.

\[\frac{\partial}{\partial x}(x^2y^2 + x) \text{ eða} \frac{\partial (x^2y^2 + x)}{\partial x}\]

Slíkan rithátt má auðvitað líka nota þótt fallið hafi fengið nafn. Þannig er \(D_y f(x,y) = f_y(x,y)\). Ef ritað hefur verið \(z = \text{formúla}\), t.d. \(z = xy\) þá er oft litið svo á, þegar tekin er hlutafleiða, að \(z\) sé jafngild formúlunni, sem sé:

\[\frac{\partial z}{\partial x} = \frac{\partial (xy)}{\partial x} = y\]

Æfing: Nokkrar hlutafleiður

Finnið eftirfarandi hlutafleiður:

\[\begin{split}\begin{align} &\textrm{1. } D_x \sin(xy) \\ &\textrm{2. } D_y \sqrt{x + 2y} \\ &\textrm{3. } \frac{\partial \ln(ax)}{\partial x} \\ &\textrm{4. } \frac{\partial z}{\partial x} \textrm{ ef }z = \ln(x^2y^2) \\ &\textrm{5. } \frac{\partial f(1,2)}{\partial y} \textrm{ ef }f(a,y) = \ln(ay) \\ &\textrm{6. } D_x \sqrt{xy\vphantom{b}} \big |_{x=2,y=2} \\ &\textrm{7. } D_x \exp(ax^2 + bx + 3. \\ \end{align}\end{split}\]

Æfing

Látum \(d\) vera drægni fallbyssu eins og í æfingunni aftast í grein 1.2,

\(d = \dfrac{\normalsize{v^2}}{\normalsize{g}} \sin 2\theta\)

þar sem \(v\) er skothraðinn, \(\theta\) er horn miðað við láréttan flöt og \(g\) er þyngdarhröðunin (við notum \(g = 10 \text{m/s}^2\)).

  1. Ákvarðið \(\dfrac{\partial\normalsize{d}}{\partial\normalsize{v}\vphantom{\theta}}\) og \(\dfrac{\partial\normalsize{d}}{\partial\normalsize{\theta}}\)

  2. Fyrir gefinn hraða \(v\) verður drægnin að einvíðu falli, \(d = f(\theta)\), og hlutafleiðan m.t.t. \(\theta\) verður jöfn venjulegu afleiðunni \(f'(\theta)\). Þá má finna hámarksdrægni fallbyssunnar með því að leysa \(f'(\theta) = 0\). Finnið \(d_\text{max}\) ef \(v = 150 \text{ m/s}\).

1.6  Stigull

Venjuleg afleiða af einvíðu falli í tilteknum punkti er hallatala (slope) snertils (tangent) í punktinum. Til að útvíkka þessa skilgreiningu fyrir tvítt fall þarf að taka tillit til þess að í hverjum punkti eru margir snertlar. Til að höggva á hnútinn er valinn sá snertill sem hefur mestan bratta. Þannig er afleiða tvíðvíða fallsins eða stigull (gradient) þess látinn vera vigur en ekki tala eins og afleiða einvíða fallsins, stefna hans sýnir í hvaða átt bratinn er mestur og lengd hans gefur brattann.

Skilgreining: Stigull

Stigull falls \(f\) í punkti \((a,b)\) er vigur sem stefnir í þá átt sem fallið vex hraðast, og lengd hans er jöfn hallatölu snertils við graf fallsins sem stefnir í sömu átt.

Stigullinn mælir sem sé hve bratt graf fallsins er og átt mesta bratta. Hægt er að skoða þverskurðarfall eftir línu sem liggur í bröttustu stefnuna og lengd stigulsins verður afleiða þess falls. Ef fallið hefur engan halla er stigullinn núll.

Hér er mynd sem varpar ljósi á hugtakið stigul, og í Wikipediugreininni um stigla má skoða fleiri myndir.

../_images/stigull.jpg

Mynd 1.7: Gráa yfirborðið er graf fallsins \(f\) og ljósbláa örin er í \((x,y)\)-planinu og sýnir stigul \(f\) í punktinum \((a,b)\). Dökkblái snertillinn liggur upp bröttustu brekkuna. Stigullinn er í ofanvarpi þessa snertils á \((x,y)\)-planið og lengd hans er halli fallsins í þá átt.

Ritháttur og orðanotkun

Stigullinn af \(f\) er oftast táknaður með \(\nabla f\) en stundum með \(f'\), og stigull í \((x,y)\) er þá

\[\nabla f(x,y)\,\,\text{ eða }\,\, f'(x,y)\]

Stigullinn er dæmi um svonefnt vigursvið (vector field), en það er fall \(\Bbb R^2 \to \Bbb R^2\) sem sendir sem sé punkta í planinu yfir í vigra. Venjuleg tvívíð föll eru líka stundum kölluð skalarsvið (scalar field), en skalar er annað orð yfir tölu. Þetta orðfæri er einkum notað í eðlisfræði, en líka í stærðfræðigreiningu sem er einmitt oft beitt í eðlisfræði. Stundum er líka talað um vigurgilt fall á \(\Bbb R^2\) (vector-valued function on \(\Bbb R^2\))

Tvívíð keðjuregla og tengsl stiguls og hlutafleiða

Einvíða keðjureglan segir að afleiða \(f(g(x))\)\(f'(g(x))g'(x)\) (sjá athugasemd aftarlega í kafla 1.4). Þessi regla er sönnuð í stærðfræðigreiningu, sjá t.d. hér. Á Khan Academy eru frekari útskýringar og þar er líka fín umfjöllun um tvívíðu keðjuregluna, þar með talið sönnun á henni.

Regla: Tvívíð keðjuregla

\[D_t f(x(t),y(t)) = f_x(x(t),y(t))x'(t) + f_y(x(t),y(t))y'(t)\]

Stigull er síðan nátengdur hlutafleiðum eins og þessi regla segir:

Regla: Stigull er vigur af hlutafleiðum

Stigull diffranlegs falls \(f\) í \((a,b)\) er vigurinn með hlutafleiðum \(f\), þ.e.a.s.

\[\begin{split}\nabla f(a,b) = \begin{pmatrix}f_x(a,b) \\ f_y(a,b)\end{pmatrix}\end{split}\]

Við bregðum svo út af vananum, að sleppa flestum sönnunum, og sönnum þessa reglu. Með sönnuninni fylgir líka skýringarmynd.

Sönnun reglu

Látum \(p = (a,b)\) og \(u\) vera almennan vigur útfrá \(p\) með lengd 1. Svo skoðum við þverskurð af fallinu í stefnu \(u\). Látum \(g\) vera fallið í þeim þverskurði, sem sé \(g(t) = f(p+tu)\). Hallatala snertils í þessa stefnu er g‘(0) og með því að nota tvívíðu keðjuregluna fæst:

\[\begin{split}g'(t) &= D_t f(p + tu)\\ &= D_t f(a + u_1 t, b + u_2 t) \\ &= f_x(p + tu) u_1 + f_y(p + tu) u_2\\ g'(0) &= (f_x(p), f_y(p)) \cdot u \\ &= h \cdot u\end{split}\]

þar sem \(h = (f_x(p), f_y(p))\) og \(h \cdot u\) táknar innfeldi \(h\) og \(u\) (sbr. kafla 10.3 í Fyrirlestrarnótum um Python.

../_images/sönnun-stigulsetningar.png

Næst er notuð regla um innfeldi sem margir kannast við, nefnilega að innfeldi tveggja vigra fáist með því að margfalda saman lengdir þeirra og kósínus af horninu milli þeirra. Reglan verður sönnuð í kaflanum um línulega algebru, en hún segir sem sé:

\[x\cdot y = |x| \cdot |y| \cos \theta\]

Þetta gefur okkur að snertilhallinn er \(g'(0)\) = \(|h|\cdot |u|\cos \theta\) = \(|h|\cdot 1\cdot \cos\theta\) = \(|h|\cos \theta\) þar sem \(\theta\) er hornið á milli \(h\) og \(u\). Þessi halli verður stærstur þegar \(\theta\) = 0 (því þá er kósínusinn 1, en annars er hann minni), það er að segja þegar \(u\) stefnir í sömu átt og \(h\). En sú mesta bratta stefna er einmitt stefna stigulsins, og svo gildir auk þess að stigullinn hefur lengd sem er þessi mesti bratti, og niðurstaðan er að stigullinn hlýtur að vera jafn \(h\), eins og sanna átti.

Stigull og hæðarlínur

Eins og útskýrt var að framan er stigull vigur sem stefnir upp bröttustu brekkuna, og hann er því lengri sem brattinn er meiri. Ein afleiðing þessa er eftirfarandi regla.

Regla: Stiglar eru hornréttir á hæðarlínur

Stigull falls í gefnum punkti er hornréttur á hæðarlínu fallsins í gegn um punktinn

Sýnidæmi: Stigull fundinn

Finnum stigul fallsins

\[f(x,y) = x^2 + xy + y^2 - 3x\]

fyrst í almennum punkti \((x,y)\) og síðan í punktinum \((2,1)\). Hlutafleiður \(f\) eru \(f_x = 2x+y-3\) og \(f_y = x + 2y\) og almenni stigullinn er því

\[\begin{split}\nabla f(x,y) = \begin{pmatrix}2x + y - 3\\ x + 2y\end{pmatrix}\end{split}\]

Ef við látum \(x=2\) og \(y=1\) fæst:

\[\begin{split}\nabla f(2,1) = \begin{pmatrix}2\cdot 2 + 1 - 3\\2 + 2\cdot 1\end{pmatrix} = \begin{pmatrix}2\\4\end{pmatrix}\end{split}\]

Python: Örvarit

../_images/örvamælir.jpg

Mynd 1.8: Örvamælir (quiver)

Matplotlib fallið quiver má nota til að teikna örvarit: örvar í rétthyrndu neti sem sýna vigursvið. Örvarnar hafa rétta stefnu, en lengdir þeirra eru skalaðar sjálfkrafa, þó þannig að hlutfallslegar lengdir haldi sér. Þetta fall má nota til að teikna stigla falls, eins og sýnt er með dæmi í Viðauka A.

1.7  Stefnuafleiða

Snertilhallinn sem kom við sögu í sönnuninni hér á undan hefur nafn, og er kallaður stefnuafleiða. Hana má skilgreina þótt \(u\) hafi ekki lengd 1, nefnilega:

Skilgreining: Stefnuafleiða

Stefnuafleiða diffranlegs falls \(f\) í stefnu vigurs \(u\) í punkti \(p\) er hallatalan sem fæst ef farið er frá \(p\) úteftir \(u\), nánar tiltiltekið afleiða fallsins \(g(t) = f(p + tu)\) í 0.

Og ef \(u\) hefur lengd 1 þá er stefnuafleiðan hallatala snertils við graf fallsins í \(p\) sem stefnir í sömu átt og \(u\). Bláa línan \(T\) á eftirfarandi mynd sýnir umræddan snertil.

../_images/stefnuafleiða.png

Stefnuafleiðan er táknuð með \(f'(p; u)\). Svo er líka hægt að skilgreina stefnuafleiðuna með formúlu, sem minnir á formúluna sem venjuleg afleiða er skilgreind með:

\[f'(p; u) = \lim_{h \to 0} \frac{f(p + hu) - f(p)}{h}\]

Næsta setning gefur okkur aðferð til að reikna stefnuafleiðu og sönnun hennar er í raun þegar komin, sem hluti af sönnuninni hér á undan (í grein 1.6). Hún er nefnilega innfeldi stigulsins í \(p\) og stefnuvigursins \(u\):

Regla: Tengsl stefnuafleiðu við stigul

\(f'(p;u) = \nabla f(p) \cdot u\)

Stefnuafleiðan er sem sé innfeldi. Ein afleiðing af þessari setningu er að hlutafleiður \(f\) eru stefnuafleiður í stefnu einingavigranna, \((1,0)\) og \((0,1)\), en um einingavigra verður fjallað nánar í kaflanum um línulega algebru.

Sýnidæmi: Stefnuafleiða falls

Finnum stefnuafleiðu fallsins

\[f(x,y) = x^2 + xy + y^2 - 3x\]

út eftir \(u = (1, 3)\) í punktinum \(p = (2,1)\). Skv. síðasta sýnidæmi er \(\nabla f(2,1) = (2,4)\) og stefnuafleiðan er þess vegna

\[f'(p; u) = (2,4) \cdot (1,3) = 2\cdot 1 + 4\cdot 3 = 2 + 12 = 14\]

Æfing: Stefnuafleiða

Lát \(f(x, y) = x^2 + 2xy\), \(p=(1,2)\) og \(u=(1,1)\). Reiknið \(f'(p; u)\).

1.8  Annars stigs hlutafleiður Hesse-fylki og tvívíðar ákveður

Eftirfarandi skilgreining er fengin að láni úr fyrirlestrarnótum um Stærðfræðigreiningu II:

Skilgreining:

Ritum \(z=f(x,y)\). Annars stigs hlutafleiður f eru skilgreindar með formúlunum

\[ \begin{align}\begin{aligned}\displaystyle \frac{\partial^2 z}{\partial x^2}= \frac{\partial}{\partial x} \frac{\partial z}{\partial x} =f_{11}(x,y)=f_{xx}(x,y),\\\displaystyle \frac{\partial^2 z}{\partial y^2}= \frac{\partial}{\partial y} \frac{\partial z}{\partial y} =f_{22}(x,y)=f_{yy}(x,y),\\\displaystyle \frac{\partial^2 z}{\partial x\partial y}= \frac{\partial}{\partial x} \frac{\partial z}{\partial y} =f_{21}(x,y)=f_{yx}(x,y),\\\displaystyle \frac{\partial^2 z}{\partial y\partial x}= \frac{\partial}{\partial y} \frac{\partial z}{\partial x} =f_{12}(x,y)=f_{xy}(x,y).\end{aligned}\end{align} \]

Þar er líka sannað að \(f_{xy}(x,y) = f_{yx}(x,y)\) ef \(f\) uppfyllir tiltekin samfelldniskilyrði, sem flest föll sem við fáumst við gera.

Annars stigs hlutafleiður eru oft settar fram í fylki sem stundum er táknað með \(\nabla^2 f\):

Skilgreining: Hesse-fylki

Hesse-fylki (Hessian matrix) tvívíðs falls \(f\) í punkti \(p = (x,y)\) er fylkið

\[\begin{split}H(p)=\nabla^2 f(p) = \begin{bmatrix} f_{xx}(x,y)&f_{xy}(x,y) \\ f_{yx}(x,y)&f_{yy}(x,y) \end{bmatrix}\end{split}\]

Skv. framansögðu er Hesse-fylkið (yfirleitt) samhverft.

Ákveða (determinant) er hugtak sem oft er notað í línulegri algebru. Ákveður verða notaðar í næsta undirkafla til að flokka útgildi og í kafla 2.13 er setning sem tengir ákveður og andhverfanleg fylki. Fyrir \(2 \times 2\) fylki er skilgreining ákveðunnar einföld:

Skilgreining: Tvívíð ákveða

Ákveða \(2 \times 2\) fylkis \(A = \begin{pmatrix}a & b\\c & d\end{pmatrix}\) er

\[\det(A) = ad - bc\]

Ákveður má skilgreina fyrir almenn ferningslaga fylki, en skilgreiningin er dálítið flókin og við látum duga að vísa í Wikipedíugreinina um ákveður.

Python: Ákveða

Fallið la.det má nota til að reikna ákveðu ferningslaga fylkis. Til að virkja það þarf að flytja NumPy pakka fyrir línulega inn með import numpy.linalg as la.

1.9  Útgildi tvívíðra falla

Hágildi og lággildi

Tvívítt fall \(f\colon A\to \Bbb R\) er sagt hafa víðvært hágildi (global maximum) í punkti \(p = (x_0, y_0)\) ef gildi fallsins þar er stærra en eða jafnt og gildi þess í öllum öðrum punktum formengisins \(A\), og á sama hátt hefur \(f\) víðvært lággildi (minimum) í \(p\) ef gildið þar er minna en eða jafnt og gildið allsstaðar annarsstaðar. Ef til er grennd um \(p\) þannig að \(f(p) \geq f(x,y)\) fyrir alla punkta \((x,y)\) í grenndinni þá er hágildið staðbundið (local). Staðbundið lággildi er skilgreint á samsvarandi hátt. Ef gildi falls er hvergi (í \(A\) eða grenndinni) jafn hátt (lágt) og í \(p\) er hágildið (lággildið) kallað strangt (strict). Samheiti yfir há- og lágildi er útgildi (extremum).

Við höfum þegar séð ýmsar hæðarlínumyndir með há- og lággildum, t.d. í myndum 1.2, 1 og 5.

Ákvörðun útgilda falla hefur margskonar hagnýtingu, og sérstök undirgrein hagnýtrar stærðfræði, töluleg bestunarfræði (numerical optimization), fjallar um aðferðir til þess að finna þau. Stundum snýst verkefnið um að hámarka hagnað eða lágmarka kostnað, en stundum er markmiðið að finna stika líkans sem nálga gögn vel.

Útgildi fundin með því að leysa jöfnur

Á sama hátt og útgildi einvíðra falla einkennast af því að afleiðan þar er núll, þá einkennast útgildi tvívíðra falla af því að stigullinn þar er núll. Lausnir jöfnunnar

\[\nabla f(x,y) = (0,0)\]

gefa þá útgildin en auk þess söðulpunkta (saddle points) sem sum föll hafa. Það eru punktar þar sem stigullinn er núll, og þannig að til er leið frá þeim með vaxandi \(f\)-gildum og önnur með minnkandi \(f\)-gildum. Sérstöðupunktur er samheiti yfir hágildis-, lággildis- og söðulpunkta.

Dæmi um fall með söðulpunkt er \(f(x,y) = 10 + x^2 - y^2\) sem sýnt er á eftirfarandi mynd:

../_images/söðulpunktur.jpg

Mynd 1.9: Fall með söðulpunkti

Þar sem báðar hliðar í jöfnunni að ofan eru vigur felur lausn hennar í sér að leysa saman tvær jöfnur í tveimur óþekktum (\(x\) og \(y\)):

\[\begin{split}f_x(x,y) &= 0 \\ f_y(x,y) &= 0\end{split}\]

Stundum er hægt að leysa þessar jöfnur með algebru/stærðfræðigreiningu, en oftar en ekki þarf að beita tölulegum aðferðum. Eftir að lausnirnar eru fundnar þarf svo að flokka þær í hágildi, lággildi og söðulpunkta.

Sýnidæmi: Sérstöðupunktar

Ákvörðum sérstöðupunkta fallsins

\[f(x,y) = x^2 + xy + y^2 - 3x\]

Stigullinn er \(\nabla f = (2x + y - 3, x + 2y)\) svo við þurfum að leysa jöfnurnar:

\[\begin{split}2x + y = 3\\ x + 2y = 0\end{split}\]

Smá útreikningar gefa nú \(x = 2\) og \(y = -1\). En er þetta lággildi, hágildi eða söðulpunktur? Svarið er lággildi, og það er m.a. hægt að sjá útfrá því að þetta er eina lausnin, og að fallið vex upp úr öllu valdi ef \(x\) og \(y\) eru látin stefna á óendanlegt.

../_images/synidaemi.jpg

Mynd 1.10: Graf fallsins f og lággildispunkturinn p

Flokkun útgilda

Hér að framan skoðuðum við hvað gerist fyrir stór \(x\) og \(y\) til að sjá að um lággildi væri að ræða, en önnur aðferð til að sjá hvort hvort núllstöð stiguls tvíðs falls sé hágildis-, lággildis- eða söðulpunktur er að reikna Hesse-fylki fallsins í núllstöðinni, í framhaldi ákveðu þess, og nota svo eftirfarandi reglu:

Regla: Hesse-fylki og útgildi

Gerum ráð fyrir að \(\nabla f(x,y) = 0\), \(H = \nabla ^2 f(x,y)\) og \(a = h_{11} = f_{xx}(x,y)\). Þá gildir:

  1. Ef \(\det(H) > 0\) og \(a > 0\) þá hefur \(f\) staðbundið lággildi í \((x,y)\)

  2. Ef \(\det(H) > 0\) og \(a < 0\) þá hefur \(f\) staðbundið hágildi í \((x,y)\)

  3. Ef \(\det(H) < 0\) þá hefur \(f\) söðulpunkt í \((x,y)\)

  4. Ef \(\det(H) = 0\) þá er ekkert hægt að segja.

Sýnidæmi: Útgildispunktar, framhald

Hesse-fylki fallsins \(f\) fæst með því að diffra aftur:

\[\begin{split}\nabla^2 f(x,y) = \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix}\end{split}\]

(t.d. fæst stakið efst til vinstri með því að diffra \(f_x(x,y) = 2x + y - 3\) með tilliti til \(x\)). Fylkið er sem sé fasti og því:

\[\begin{split}H = \nabla^2 f(2,-1) = \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix}\end{split}\]

Svo fæst \(\det(H) = 2 \cdot 2 - 1 \cdot 1 = 3\) og \(a = h_{11} = 2\). Skv. síðustu reglu er því punkturinn \((2,-1)\) lággildispunktur.

Æfing: Loklaus kassi

Smíða skal loklausan kassa sem tekur 500 \(\text{cm}^3\) (sem sé hálfan lítra) úr blikkplötum þannig að sem minnst blikk sé notað. Ákvarðið hæð hans, lengd og breidd með eftirfarandi aðferð: Kallið lengdina \(x\) og breiddina \(y\). Þá verður hæðin \(h = 500/(xy)\). Látið nú \(f(x,y)\) = flatarmál blikksins sem þarf, finnið formúlu fyrir \(f\) og lágmarkið með því að leysa jöfnurnar sem fást þegar hlutafleiður \(f\) eru settar núll.

../_images/loklauskassi.png

Athugið

Fyrirlestrarnótur í Stærðfræðigreiningu 2 eru með ýmislegt efni og myndir sem gæti gagnast við að skilja tvívíð föll, hlutafleiður og stigla betur

Sýnidæmi: Jafna bestu línu

../_images/hæð-trjáa-eftir-aldri.jpg

Aðferð minnstu kvaðrata (linear least squares method) til að finna jöfnu bestu línu snýst um að lágmarka kvaðratsummu fjarlægða milli línunnar og gefins punktasafns. Ef punktarnir eru \((x_1,y_1),\ldots,(x_n,y_n)\) og jafna línunnar er:

\[y = ax + b\]

og þá er þessi kvaðratsumma gefin með tvívíða fallinu:

\[S(a,b) = \sum_{i=1}^{n}(ax_i + b - y_i)^2\]

(sjá á wikipedíu). Því minni sem þessi summa er, því betur fylgir línan punktasafninu. Jöfnu bestu línu má þannig ákvarða með því að reikna stigla fallsins \(S\) og leysa jöfnurnar sem fást með því að setja þá jafna núll. Þetta gefur:

\[\begin{split}\nabla S = \begin{pmatrix} \sum_{i=1}^{n}2(ax_i + b - y_i)x_i \\ \sum_{i=1}^{n}2(ax_i + b - y_i) \\ \end{pmatrix} = 0\end{split}\]

Þetta eru tvær jöfnur í óþekktu stærðunum \(a\) og \(b\) og það eru einmitt þær sem eru leystar í NumPy fallinu polyfit í kafla 13.6 í Fyrirlestrarnótum um Python.

1.10  Margvíð föll

Skilgreining og dæmi

Rifjum upp að tvívítt fall er fall \(f\colon A \to \Bbb{R}\) þar sem \(A \subseteq \mathbb{R}^2\). Á sama hátt er \(n\)-vítt fall fall:

\[f\colon A \to \Bbb{R}\textrm{ þar sem }A \subseteq \mathbb{R}^n\]

Við getum tekið dæmi um hitastigfallið H á mynd 1.4. Það væri hægt að hugsa sér fall til að tákna meðalhita ekki bara við yfirborð, heldur líka ofar, t.d. í 10 m hæð (eða 1 km). Almennt mætti skilgreina þrívítt fall:

\[H(l,b,h) =\textrm{ meðalhiti á stað með lengd }l\textrm{, breidd }h\textrm{ í hæð }h\]

(þó það væri líklega ansi erfitt að ákvarða gildi \(H\) allsstaðar). Við gætum líka hugsað okkur að ákvarða jöfnu bestu parabólu með því að lágmarka fallið

\[S(a,b,c) = \sum_{i=1}^{50}(ax_i^2 + bx_i + c - y_i)^2\]

(þá er gildir \(S\colon \mathbb{R}^3 \to \mathbb{R}\)). Það er mun erfiðara að búa til myndir af margvíðum föllum en tvívíðum. Helsta aðferðin er að sýna nokkur þverskurðarföll: Við gætum t.d. sýnt sérstaka mynd af meðalhitanum við yfirborð, í 100 m hæð, 200 m hæð o.s.frv. Veðurfræðingar skoða stundum veðurkort í jafnþrýstiflötum, t.d. 500 millibara fletinum.

Viðfang skrifað sem vigur

Stakið \(x\) í formenginu sem margvítt fall varpar úr er vigur með \(n\) stökum:

\[x = (x_1, x_2,\ldots, x_n)\]

og ef þetta stak varpast t.d. í 5 má rita viðföng þess annaðhvort sem margar tölur (stökin í vigrinum) eða einn vigur, sem sé

\[\begin{split}&f(x_1, x_2,\ldots, x_n) = 5\\ \textrm{eða: }&f(x) = 5\end{split}\]

Á eftirfarandi mynd væri \(X \subseteq \mathbb{R}^n\), \(Y = \mathbb{R}\) og \(f(x) = 5\).

../_images/fall.png

Þegar unnið er samhliða með stærðfræði og Python getur líka verið þægilegt að byrja að telja í 0. Svona vigur-ritháttur fyrir viðfangið er því algengari sem \(n\) er stærra. Ef \(n\) er 2 eða 3 er oft ritað \(f(x,y)\) eða \(f(x,y,z)\) en fyrir math:n geq 4 er algengast að nota \(f(x)\) og láta \(x\) vera vigur, og það er reyndar oft gert líka fyrir \(n=2\textrm{ eða }3\). Reyndar höfum við nú þegar nýtt okkur þennan möguleika, í sönnuninni í kafla 1.6 þar sem við skrifuðum \(p\) í stað \((a,b)\).

Margvíðir stiglar

Stigull af \(n\)-víðu falli er \(n\)-vigur:

\[\]
\[\begin{split}f'(x) = \nabla f(x) = \begin{pmatrix} \dfrac{\partial f(x)}{\partial x_1}\\ \vdots\\ \dfrac{\partial f(x)}{\partial x_n} \end{pmatrix}\end{split}\]

Eins og fyrir tvívíð föll segir stigullinn okkur í hvaða átt fallið vex hraðast. Við getum hugsað okkur fugl á flugi sem er kalt, hann gæti e.t.v. haft vit á að fljúga í stefnu stiguls þrívíða fallsins \(H\) sem talað var um í greinininn hér á undan. Margvíðir stiglar verða aftur á dagskrá þegar fjallað verður um Taylor-nálgun í kaflanum um línulega algebru.