Diferenciabilidade em \(\mathbb R^n\)

Ana Moura Santos / IEEE-IST Student Branch

A derivada a  várias variáveis também é muito diferente da derivada a uma variável: para funções diferenciáveis a derivada é uma matriz, por vezes denominada jacobiana, com entradas que são as derivadas parciais.

Derivadas parciais em \(\mathbb R^n\)

Para funções de várias variáveis, a derivada parcial em ordem a uma das variáveis é dada pela definição de limite da variação da função sobre a variação da coordenada que se está a variar, mantendo-se todas as outras variáveis constantes.  Podem assim usar-se as regras habituais de derivação em \(\mathbb R^\), olhando para as outras variáveis como constantes. Para funções com valores em \(\mathbb R^m\), o resultado da derivada parcial é um vetor de \(\mathbb R^m\), em que cada coordenada é a derivada parcial em ordem a uma dada variável das \(m\) funções coordenadas.

No caso duma função dada por ramos, em que um dos ramos tem um ponto isolado, tem que se ter o cuidado de calcular as derivadas parciais, usando a definição de limite.



A matriz jacobiana

Construção da matriz jacobiana \(m \times n \) para uma função definida num aberto de \(\mathbb R^n\) com valores em \(\mathbb R^m\): em cada coluna coloca-se a derivada parcial em ordem a uma variável das várias funções coordenadas. Dá-se um exemplo.



Diferenciabilidade de funções vetoriais

Questão: Quando é que a matriz jacobiana duma função vetorial \({\bf f}\) é a sua derivada?

Sendo a matriz jacobiana, a matriz cujas entradas são as derivadas parciais de \({\bf f}\), gostaríamos de a ter como a “matriz derivada de \({\bf f}\)”. No entanto, o melhor que conseguimos afirmar é:

Teorema (jacobiana e derivada)

Seja \(U\) um conjunto aberto de \(\mathbb{R}^n\), \({\bf f}:U\subset {\mathbb{R}}^n \rightarrow {\mathbb{R}}^m\) e \({\bf a}\) um ponto de \(U\). Quando para um pequeno incremento \(\vec{\bf h}\) relativamente à variável tivermos \[\lim_{{\vec{\bf h}}\rightarrow {\vec{\bf 0}}} \frac{({\bf f}({\bf a}+{\vec{\bf h})-{\bf f}({\bf a}))-L({\vec{{\bf h}})}}}{\|\vec{{\bf h}}\|}=\vec{\bf 0} \] em que \(L\) é uma transformação linear \(L:{\mathbb{R}}^n \rightarrow {\mathbb{R}}^m\), então todas as derivadas parciais de \({\bf f}\) em \({\bf a}\) existem e a matriz jacobiana \(\left[J{\bf f}({\bf a})\right]\) é a matriz que representa \(L\) que aparece no limite.

No caso do limite \(\vec{\bf 0}\) do teorema existir, \({\bf f}\) diz-se {\bf diferenciável} em \({\bf a}\) e a matriz jacobiana \(\left[J{\bf f}({\bf a})\right]\) representa a derivada de \({\bf f}\) em \({\bf a}\), passando a escrever-se \(\left[{\bf D}{\bf f}({\bf a})\right]\).

Estas são as principais regras para derivar funções definidas por uma expressão algébrica, à exceção da regra da composta que aparece diretamente no video:

Regras para calcular derivadas:

Seja \(U\) um conjunto aberto de \(\mathbb{R}^n\).

  1. Se \({\bf f}:U \rightarrow \mathbb{R}^m\) é uma função constante, então \({\bf f}\) é diferenciável e a sua derivada é a transformação linear zero representada pela matriz nula \(m\times n\).
  2. Se \({\bf f}:\mathbb{R}^n \rightarrow \mathbb{R}^m\) é linear, então \({\bf f}\) é diferenciável e a sua derivada em todos os pontos \(\bf{a}\) é \({\bf f}\), i.e. \(\left[{\bf D}{\bf f}({\bf a})\right]{\vec{\bf v}}={\bf f}({\vec{\bf v}})\).
  3. Sejam \(f_1, f_2,\ldots,f_m: U\rightarrow \mathbb{R}\) \(m\) funções escalares diferenciáveis em \(\bf{a}\), então a função vetorial \({\bf f}({\bf x})=\begin{bmatrix} f_1 \\ f_2 \\ \vdots \\ f_m \end{bmatrix}\) é diferenciável em \(\bf{a}\) com derivada \[\left[{\bf D}{\bf f}({\bf a})\right]\vec{\bf v} =\begin{bmatrix} \left[{\bf D}{ f_1}({\bf a})\right]\vec{\bf v}\\ \vdots\\ \left[{\bf D}{ f_m}({\bf a})\right]\vec{\bf v}\end{bmatrix}.\] e vice-versa, se \({\bf f}\) é diferenciável em \(\bf{a}\), cada função coordenada \(f_i\) é diferenciável em \(\bf{a}\) com derivada \(\left[{\bf D}{ f_i}({\bf a})\right]=\begin{bmatrix} {{ D}_1{ f_i}}({\bf a})&{{ D}_2{ f_i}}({\bf a})&\ldots;&{{ D}_n{ f_i}}({\bf a}) \end{bmatrix}.\)
  4. Se \({\bf f}, {\bf g}:U \rightarrow \mathbb{R}^m\) são diferenciáveis em \({\bf a}\), então a soma \({\bf f}+{\bf g}\) também o é e \[\left[{\bf D}({\bf f}+{\bf g})({\bf a})\right]=\left[{\bf D}{\bf f}({\bf a})\right]+\left[{\bf D}{\bf g}({\bf a})\right].\]
  5. Se a função escalar \({f}:U \rightarrow \mathbb{R}\) e a função vetorial \({\bf g}:U \rightarrow \mathbb{R}^m\) são diferenciáveis em \({\bf a}\), então o produto \(f{\bf g}\) também é diferenciável e a derivada é dada por \[ \left[{\bf D}({f}{\bf g})({\bf a})\right]\vec{\bf v}=f({\bf a})\left[{\bf D}{\bf g}({\bf a})\right]\vec{\bf v}+(\left[{\bf D}{f}({\bf a})\right]\vec{\bf v}){\bf g}({\bf a}). \]
  6. Se \({\bf f}, {\bf g}:U \rightarrow \mathbb{R}^m\) são diferenciáveis em \({\bf a}\), então a soma \({\bf f}+{\bf g}\) também o é e \[ \left[{\bf D}({\bf f}+{\bf g})({\bf a})\right]=\left[{\bf D}{\bf f}({\bf a})\right]+\left[{\bf D}{\bf g}({\bf a})\right]. \]
  7. Se a função escalar \({f}:U \rightarrow \mathbb{R}\) e a função vetorial \({\bf g}:U \rightarrow \mathbb{R}^m\) são diferenciáveis em \({\bf a}\), e \(f({\bf a})\neq 0\), então o cociente \({\bf g}/f\) também é diferenciável e a derivada é dada por \[ \left[{\bf D}\left(\frac{{\bf g}}{f}\right)({\bf a})\right]\vec{\bf v}=\frac{\left[{\bf D}{\bf g}({\bf a})\right]\vec{\bf v}}{f({\bf a})}-\frac{(\left[{\bf D}{f}({\bf a})\right]\vec{\bf v}){\bf g}({\bf a})}{f({\bf a})^2} .\]


Derivadas direcionais em \(\mathbb R^n\)

Para funções com valores em \(\mathbb R^m\), o resultado da derivada parcial é um vetor de \(\mathbb R^m\), em que cada coordenada é a derivada parcial em ordem a uma dada variável das \(m\) funções coordenadas. Quando estudamos a variação noutra direção que não a canónica, p. ex. em \(\mathbb R^2\) podemos estudar a variação na direção \(y=x\), ou seja na direção do vetor \((1,1)\). Para funções continuamente diferenciáveis, a derivada direcional num ponto pode obter-se através dum cálculo mais simples, como o produto da jacobiana no ponto (à esquerda) pelo vetor direção (multiplicado como um vetor coluna do lado direito).



Diferenciabilidade e funções patológicas

Neste módulo estuda-se a diferenciabilidade duma função patológica, que apesar de contínua e com derivadas parciais em todos os pontos, inclusivé na origem, não é diferenciável na origem. Apesar da matriz jacobiana estar bem definida na origem, seguindo a definição de diferenciabilidade, quando tentamos verificar o limite \({\rm lim}_{{\vec{\bf h}}\rightarrow {\vec{\bf 0}}} \frac{({\bf f}({\bf 0}+{\vec{\bf h})-{\bf f}({\bf 0}))-\left[{ J}{\bf f}({\bf 0})\right]{\vec{{\bf h}}}}}{\|\vec{{\bf h}}\|}=0\) que devia dar zero, concluímos que o limite nem sequer existe!

Conclusão: a jacobiana não representa a derivada da função.



Critério para a diferenciabilidade

Neste módulo, estabelece-se um critério para a diferenciabilidade duma função: a função tem que ser continuamente diferenciável, ou seja, com derivadas parciais de primeira ordem contínuas (também se diz, que a função tem de ser de classe \(C^1\)).



Regras das derivadas

Enunciam-se aqui as principais regras de derivação para funções de várias variáveis com valores em \(\mathbb R^m\).



Derivada da função composta

Neste módulo, enunciam-se a regra da derivação da função composta no caso vetorial. Esta regra que se pode resumir do seguinte modo: a derivada da composta é a composta das derivadas também é conhecida como a regra da cadeia, é de seguida aplicado a um caso em que as contas saem menos complicadas do que compor primeiro e derivar depois.



O teorema do valor médio e a diferenciabilidade

Usamos o Teorema do valor médio para calcular a “constante” de Lipschitz duma função diferenciável.



Diferenciável implica contínua

Neste módulo, estudam-se três exemplos de funções escalares dadas por ramos, em que um dos ramos tem um ponto isolado, quanto à continuidade e diferenciabilidade.