$x=(x_1,\dotsc, x_n)\in K^n$ idR platzsparender als Zeilenvektor geschrieben, \emph{aber} bei Matrix-Multiplikation $x$ Spalten-Vektor, $x^T$ Zeilenvektor, d.h. \begin{align*}
x^T \cdot y &= \langle x,y\rangle, &&\text{falls $m=n$}\\
x \cdot y^T &= x \otimes y\in K^{m\times n}, &&\text{sog. \begriff{Tensorprodukt}}
\end{align*}
\end{hint}
\end{itemize}
\item\mathsymbol{L}{$L(K^n, K^m)$}$=\{ A: K^n \to K^m, \text{$A$ linear}\}$ (Menge der linearen Abbildung, ist normierter Raum)
\begin{itemize}
\item\mathsymbol{|A|}{$\Vert A \Vert$}$=\sup\{\vert Ax\vert\mid\vert x \vert\le1\}$ (\begriff{Operatornorm}, $\Vert A \Vert$ hängt i.A. von Normen auf $K^n, K^m$ ab)
\item$L(K^n, K^m)$ ist isomorph zu $K^{m\times n}$ als \gls{vr}\\
$\Rightarrow$$L(K^n, K^m)$ ist $m\cdot n$-dim. \gls{vr} ($\Rightarrow$ alle Normen äquivalent, $\Rightarrow$ Konvergenz von $\{A_n\}$ von linearer Abbildungen in $L(K^n, K^m)$ ist normunabhängig)
Nehmen idR statt $\Vert A \Vert$\person{euklidische} Norm $\vert A \vert=\sqrt{\sum_{k,l}\vert A_{k,l}\vert^2}$.\\
Es gilt: \[\vert Ax \vert\le\Vert A \Vert\vert x \vert\text{ und }\vert Ax\vert\le\vert A \vert\vert x \vert\]
Wegen $o(1)= o(\vert x-x_0\vert^0)$ (d.h. $k=0$) sagt man auch, \propref{chap15specialCase} ist die Approximation 0. Ordnung der Funktion $f$ in der Nähe von $x_0$.
\end{example}
\begin{example}
Sei $f:D\subset\mathbb{R}^n\to\mathbb{R}$, $x_0\in D$, $D$ offen. Was bedeutet \begin{align}
&\rho(t) := \sup\limits_{\vert x - x_0\vert\le t}\vert r(x)\vert\xrightarrow{t\to\infty} 0
\end{flalign*}
Der Graph von $f$ liegt in der Nähe von $x_0$ in immer flacheren, kegelförmigen Mengen\\
$\Rightarrow$ Graph "`schmiegt sich"' an eine horizontale Ebene an den Punkt $(x_0, f(x_0))$ an.
\item\emph{Beobachtung:} horizontale Ebene ist Graph einer affin linearen Funktion $\tilde{A}: \mathbb{R}^n\to\mathbb{R}^n$, daher\\
\emph{Zentrale Frage:} Existiert zu gesuchter Funktion $f: D\subset\mathbb{R}^n \to K^m$, $x_0\in\mathbb{R}$ eine affin lineare Funktion $\tilde{A}:K^n\to K^m$, sodass sich in der Nähe von $x_0$ der Graph von $f$ an den Graph von $\tilde{A}$ "`anschmiegt"'?
Wegen $f(x_0)=\tilde{A}(x_0)$ folgt $\tilde{A}(x)= A(x-x_0)+ f(x_0)$. Was heißt "`anschmiegen"'? $f(x)+\underbrace{f(x_0)+ A(x-x_0)}_{\tilde{A}(x)}= o(\vert x-x_0\vert)$, d.h. die Abweichung wird schneller klein als $\vert x-x_0\vert$!