Bon, l'idée de la composition de fonction est assez simple. Si tu as deux fonctions $f$ et $g$ de $\mathbb R$ dans $\mathbb R$, la composée de $g$ par $f$ est la fonction $f\circ g\colon x\mapsto f(g(x))$. L'idée est donc simple, la composée de $g$ par $f$ est la fonction que l'on obtient en appliquant d'abord $g$ puis $f$ sur le résultat obtenu. Par exemple, si on compose $f:x\mapsto 2x-1$ et $g:x\mapsto e^x$, on a $f\circ g:x\mapsto 2e^x-1$. On peut aussi composer dans l'autre sens en appliquant d'abord $f$ puis $g$ : $g\circ f:x\mapsto e^{2x-1}$.
Ici j'ai pris des fonctions de $\mathbb R$ dans $\mathbb R$, mais évidemment, tu peux prendre n'importe quels ensembles de définition et d'arrivé pour tes fonctions, il faut juste faire gaffe ensuite que $g(x)$ soit dans l'ensemble de définition de $f$.
Dériver une fonction composée, donc calculer la fonction $\dfrac{\mathrm d(f\circ g)}{\mathrm d x}$, se fait assez facilement en la multipliant par une fonction valant identiquement $1$ : $\dfrac{\mathrm dg}{\mathrm dg}$.
Ça donne
$$\dfrac{\mathrm d(f\circ g)}{\mathrm d x}=\dfrac{\mathrm d(f\circ g)}{\mathrm d g}\times\dfrac{\mathrm dg}{\mathrm dx},$$
qui n'est autre que
$$\left(\dfrac{\mathrm df}{\mathrm d x}\circ g\right)\times\dfrac{\mathrm dg}{\mathrm dx}.$$
Maintenant, si l'on prend les deux fonctions $\varphi:t\mapsto\varphi (t)$ et $\cos:a\mapsto\cos (a)$, je pense qu'il est assez facile de voir que la fonction $\cos(\varphi)$ (qui n'est qu'un abus d'écriture pour $\cos\circ\varphi$ puisque en physique on mélange allègrement les fonctions et les scalaires issus de leur application) est la fonction $t\mapsto\cos(\varphi(t))$. La dériver par rapport au temps donne donc ce que j'avais écris dans mon précédent message.