提示 :此條目頁的主題不是
倒數 。
一個實值函數的圖像曲線。函數在一點的導數等於它的圖像上這一點處之切線 的斜率 。
導數 (英語:derivative )是微積分 學中的一個概念。函數 在某一點的導數是指這個函數在這一點附近的變化率(即函數在這一點的切線斜率)。導數的本質是通過極限 的概念對函數進行局部的線性逼近。當函數
f
{\displaystyle f}
的自變量在一點
x
0
{\displaystyle x_{0}}
上產生一個增量
h
{\displaystyle h}
時,函數輸出值的增量與自變量增量
h
{\displaystyle h}
的比值在
h
{\displaystyle h}
趨於0時的極限如果存在,即為
f
{\displaystyle f}
在
x
0
{\displaystyle x_{0}}
處的導數,記作
f
′
(
x
0
)
{\displaystyle f'(x_{0})}
、
d
f
d
x
(
x
0
)
{\displaystyle {\frac {\mathrm {d} f}{\mathrm {d} x}}(x_{0})}
或
d
f
d
x
|
x
=
x
0
{\displaystyle \left.{\frac {\mathrm {d} f}{\mathrm {d} x}}\right|_{x=x_{0}}}
。例如在運動學 中,物體的位移 對於時間 的導數就是物體的瞬時速度 [ 1] :155 。
導數是函數的局部性質。不是所有的函數都有導數,一個函數也不一定在所有的點上都有導數。若某函數在某一點導數存在,則稱其在這一點可導(可微分),否則稱為不可導(不可微分)。如果函數的自變量和取值都是實數的話,那麼函數在某一點的導數就是該函數所代表的曲線在這一點上的切線 斜率 。
對於可導的函數
f
{\displaystyle f}
,
x
↦
f
′
(
x
)
{\displaystyle x\mapsto f'(x)}
也是一個函數,稱作
f
{\displaystyle f}
的導函數 。尋找已知的函數在某點的導數或其導函數的過程稱為求導 (英語:differentiation )。反之,已知導函數也可以倒過來求原來的函數,即不定積分 。微積分基本定理 說明了求原函數與積分 是等價的[ 1] :372 。求導和積分是一對互逆的操作,它們都是微積分學中最為基礎的概念。
定義
一般定義
一個動畫,給出了一個直觀的導數概念,因為參數變化時函數的「擺動」會改變。
直觀上
f
(
x
)
−
f
(
a
)
{\displaystyle f(x)-f(a)}
代表函數值從
a
{\displaystyle a}
到
x
{\displaystyle x}
的變化量,那這樣,
f
(
x
)
−
f
(
a
)
x
−
a
{\displaystyle {\frac {f(x)-f(a)}{x-a}}}
代表的是從
a
{\displaystyle a}
到
x
{\displaystyle x}
的平均變化率,如果把
x
{\displaystyle x}
趨近於
a
{\displaystyle a}
,似乎就可以更能貼切的描述函數值在
a
{\displaystyle a}
附近的變化。
以此為動機,若實函數
f
{\displaystyle f}
於實數
a
{\displaystyle a}
有定義,且以下極限(注意這個表達式所定義的函數定義域不含
a
{\displaystyle a}
)
lim
x
→
a
f
(
x
)
−
f
(
a
)
x
−
a
{\displaystyle \lim _{x\to a}{\frac {f(x)-f(a)}{x-a}}}
存在則稱
f
{\displaystyle f}
於
a
{\displaystyle a}
處可導 ,並稱這個極限為
f
{\displaystyle f}
於
a
{\displaystyle a}
處的導數[ 2] :117-118 ,記為
f
′
(
a
)
{\displaystyle f^{\prime }(a)}
也可記作
d
f
d
x
|
x
=
a
{\displaystyle \left.{\frac {\mathrm {d} f}{\mathrm {d} x}}\right|_{x=a}}
或
d
f
d
x
(
a
)
{\displaystyle {\frac {\mathrm {d} f}{\mathrm {d} x}}(a)}
[ 1] :154 。
根據函數極限的定義 ,導數定義部分的 "存在
δ
>
0
{\displaystyle \delta >0}
使所有的
x
∈
D
f
{\displaystyle x\in D_{f}}
,只要
0
<
|
x
−
a
|
<
δ
{\displaystyle 0<|x-a|<\delta }
都有...." 可以直觀的理解為 "當
h
=
x
−
a
{\displaystyle h=x-a}
趨近於
0
{\displaystyle 0}
都有....",但要把它寫成嚴謹的定義,會碰到 "存在
δ
>
0
{\displaystyle \delta >0}
對所有的實數
h
{\displaystyle h}
,只要
a
+
h
∈
D
f
{\displaystyle a+h\in D_{f}}
且
0
<
|
h
|
<
δ
{\displaystyle 0<|h|<\delta }
都有...."這段敘述無法直接套入極限定義的問題,對此必須把以下的表達式
lim
h
→
0
f
(
a
+
h
)
−
f
(
a
)
h
{\displaystyle \lim _{h\to 0}{\frac {f(a+h)-f(a)}{h}}}
定義為導數原始極限表達式的簡記 ,而非另一種自動合法的導數定義。但如果存在
r
>
0
{\displaystyle r>0}
,使
f
{\displaystyle f}
在
(
a
−
r
,
a
+
r
)
{\displaystyle (a-r,\,a+r)}
裏都有定義,那定義
F
{\displaystyle F}
為以
{
h
∈
R
|
(
h
≠
0
)
∧
(
|
h
|
<
r
)
}
{\displaystyle \{h\in \mathbb {R} \,|\,(h\neq 0)\wedge (|h|<r)\}}
為定義域,然後以
F
(
h
)
=
f
(
a
+
h
)
−
f
(
a
)
h
{\displaystyle F(h)={\frac {f(a+h)-f(a)}{h}}}
為對應規則的函數,那以下的極限式
lim
h
→
0
F
(
h
)
=
f
′
(
a
)
{\displaystyle \lim _{h\to 0}F(h)=f^{\prime }(a)}
就可以把以
h
{\displaystyle h}
為自變量的偏差,將之趨近於零求導數的想法納入正式的運算裏。
幾何意義
當函數定義域和取值都在實數 域中的時候,導數可以表示函數的曲線上的切線斜率。如右圖所示,設
P
0
{\displaystyle P_{0}}
為曲線上的一個定點,
P
{\displaystyle P}
為曲線上的一個動點。當
P
{\displaystyle P}
沿曲線逐漸趨向於點
P
0
{\displaystyle P_{0}}
時,並且割線
P
P
0
{\displaystyle PP_{0}}
的極限位置
P
0
T
{\displaystyle P_{0}T}
存在,則稱
P
0
T
{\displaystyle P_{0}T}
為曲線在
P
0
{\displaystyle P_{0}}
處的切線。
若曲線為一函數
y
=
f
(
x
)
{\displaystyle y=f(x)}
的圖像,那麼割線
P
P
0
{\displaystyle PP_{0}}
(粉紅色)的斜率為:
tan
φ
=
Δ
y
Δ
x
=
f
(
x
0
+
Δ
x
)
−
f
(
x
0
)
Δ
x
{\displaystyle \tan \varphi ={\frac {\Delta y}{\Delta x}}={\frac {f(x_{0}+\Delta x)-f(x_{0})}{\Delta x}}}
當
P
0
{\displaystyle P_{0}}
處的切線
P
0
T
{\displaystyle P_{0}T}
(橘紅色),即
P
P
0
{\displaystyle PP_{0}}
的極限位置存在時,此時
Δ
x
→
0
{\displaystyle \Delta x\to 0}
,
φ
→
α
{\displaystyle \varphi \to \alpha }
,則
P
0
T
{\displaystyle P_{0}T}
的斜率
tan
α
{\displaystyle \tan \alpha }
為:
tan
α
=
lim
Δ
x
→
0
tan
φ
=
lim
Δ
x
→
0
f
(
x
0
+
Δ
x
)
−
f
(
x
0
)
Δ
x
{\displaystyle \tan \alpha =\lim _{\Delta x\to 0}\tan \varphi =\lim _{\Delta x\to 0}{\frac {f(x_{0}+\Delta x)-f(x_{0})}{\Delta x}}}
上式與一般定義中的導數定義完全相同,也就是說
f
′
(
x
0
)
=
tan
α
{\displaystyle f'(x_{0})=\tan \alpha }
,因此,導數的幾何意義即曲線
y
=
f
(
x
)
{\displaystyle y=f(x)}
在點
P
0
(
x
0
,
f
(
x
0
)
)
{\displaystyle P_{0}(x_{0},f(x_{0}))}
處切線的斜率。[ 2] :117 [ 1] :153
導數、導函數與微分算子
若函數
f
(
x
)
{\displaystyle \;f(x)\;}
在其定義域包含的某區間
I
{\displaystyle \;I\;}
內每一個點都可導,那麼也可以說函數
f
(
x
)
{\displaystyle \;f(x)\;}
在區間
I
{\displaystyle \;I\;}
內可導,這時對於
I
{\displaystyle \;I\;}
內每一個確定的
x
{\displaystyle \;x\;}
值,都對應着
f
{\displaystyle \;f\;}
的一個確定的導數值,如此一來就構成了一個新的函數
x
↦
f
′
(
x
)
{\displaystyle x\mapsto f'(x)}
,這個函數稱作原來函數
f
(
x
)
{\displaystyle \;f(x)\;}
的導函數 [ 1] :155 ,記作:
y
′
{\displaystyle \;y'\;}
、
f
′
(
x
)
{\displaystyle f'(x)\;}
或者
d
f
d
x
(
x
)
{\displaystyle {\tfrac {\mathrm {d} f}{\mathrm {d} x}}(x)}
。值得注意的是,導數是一個數,是指函數
f
(
x
)
{\displaystyle f(x)\;}
在點
x
0
{\displaystyle x_{0}\;}
處導函數的函數值 。但在不至於混淆的情況下,通常也可以說導函數為導數。
由於對每一個可導的函數
f
(
x
)
{\displaystyle \;f(x)\;}
,都有它的導函數
f
′
(
x
)
{\displaystyle f'(x)\;}
存在,我們還可以定義將函數映射到其導函數的算子 。這個算子稱為微分算子,一般記作
D
{\displaystyle D}
或
d
d
x
{\displaystyle {\tfrac {\mathrm {d} }{\mathrm {d} x}}}
[ 3] 。例如:
D
(
x
↦
1
)
=
(
x
↦
0
)
D
(
x
↦
x
)
=
(
x
↦
1
)
D
(
x
↦
x
2
)
=
(
x
↦
2
⋅
x
)
{\displaystyle {\begin{aligned}D(x\mapsto 1)&=(x\mapsto 0)\\D(x\mapsto x)&=(x\mapsto 1)\\D(x\mapsto x^{2})&=(x\mapsto 2\cdot x)\end{aligned}}}
由於微分算子的輸出值仍然是函數,可以繼續求出它在某一點的取值。比如說對於函數
f
(
x
)
=
x
2
{\displaystyle \;f(x)=x^{2}\;}
,
D
(
f
)
=
(
x
↦
2
⋅
x
)
{\displaystyle D(f)=(x\mapsto 2\cdot x)}
所以
D
(
f
)
(
x
)
=
2
x
{\displaystyle D(f)(x)=2x}
,
D
(
f
)
(
1.4
)
=
2
×
1.4
=
2.8
{\displaystyle D(f)(1.4)=2\times 1.4=2.8}
。
導數與微分
微分 也是一種線性描述函數在一點附近變化的方式。微分和導數是兩個不同的概念。但是,對一元函數來說,可微與可導是完全等價的。可微的函數,其微分等於導數乘以自變量的微分
d
x
{\displaystyle \mathrm {d} x}
,換句話說,函數的微分與自變量的微分之商等於該函數的導數。因此,導數也叫做微商 。函數
y
=
f
(
x
)
{\displaystyle y=f(x)}
的微分又可記作
d
y
=
f
′
(
x
)
d
x
{\displaystyle \mathrm {d} y=f'(x)\mathrm {d} x}
[ 4] 。
歷史
導數和積分 的發現是微積分 發明的關鍵一步。17世紀以來,光學透鏡 的設計以及炮彈彈道 軌跡的計算促使歐洲的數學家對曲線的切線進行研究。1630年代,法國數學家吉爾·德·羅伯瓦爾 作出了最初的嘗試[ 5] 。與此同時,同是法國人的費馬 在計算切線時已經使用了無窮小量 的概念[ 註 1] [ 6] :52 。
如右圖,費馬考慮曲線
f
(
x
)
{\displaystyle f(x)}
在
x
{\displaystyle x}
處的切線。他聲稱,對於切線,有以下的關係成立:
s
s
+
h
=
f
(
x
)
f
(
x
+
h
)
{\displaystyle {\frac {s}{s+h}}={\frac {f(x)}{f(x+h)}}}
對上式變形後得到:
s
=
f
(
x
)
f
(
x
+
h
)
−
f
(
x
)
h
{\displaystyle s={\frac {f(x)}{\frac {f(x+h)-f(x)}{h}}}}
對於具體的函數
f
(
x
)
{\displaystyle f(x)}
,比如
f
(
x
)
=
x
3
{\displaystyle f(x)=x^{3}}
,費馬計算
f
(
x
+
h
)
−
f
(
x
)
h
{\displaystyle {\frac {f(x+h)-f(x)}{h}}}
的值,並將
h
{\displaystyle h}
設為0,就得到
s
{\displaystyle s}
,從而確定切線的斜率。可以看出,費馬的方法實質上已經是求導。費馬還給出了
f
(
x
)
{\displaystyle f(x)}
為多項式 時切線的公式。英國的巴羅 、荷蘭的於德 (Johnann Van Waveren Hudde)和瓦隆 的斯盧茲 (René Francoiss Walther de Sluze)繼續了費馬的工作[ 7] 。然而,費馬和巴羅等人並沒有將求導歸納為一種獨立的工具,只是給出了具體的計算技巧[ 5] 。
1660年代,英國人伊薩克·牛頓 提出了「流數」的概念。牛頓在寫於1671年的《流數法與無窮級數》中對流數的解釋是:「我把時間看作是連續的流動或增長,而其他的量則隨着時間而連續增長。我從時間流動性出發,把所有其他量的增長速度稱為流數。」也就是說,流數就是導數。牛頓將無窮小的時間間隔定義為「瞬間」(moment),而一個量的增量則是流數與瞬間的乘積。求導數時,牛頓將自變量和應變量兩邊展開,同時除以瞬間,再將剩下的項中含有瞬間的項忽略掉[ 6] :72 。而在他的第三篇微積分論文中,牛頓使用了新的概念:最初比和最後比。他說:
“
隨我們的意願,流數可以任意地接近於在儘可能小的等間隔時段中產生的增量,精確地說,它們是最初增量的最初的比,它們也能用和它們成比例的任何線段來表示。[ 6] :74
”
相比於牛頓,德國數學家萊布尼茲 使用了更清晰的記號來描述導數(見導數的記法 一節)。他利用了巴羅的「微分三角形」概念,將自變量和應變量的增量記為
d
x
{\displaystyle dx}
和
d
y
{\displaystyle dy}
。他把
d
x
{\displaystyle dx}
理解為「比任何給定的長度都要小」,而
d
y
{\displaystyle dy}
則是
x
{\displaystyle x}
移動時
y
{\displaystyle y}
「瞬刻的增長」[ 6] :89 。而導數則是兩者之間的比例。他還研究了函數之和、差、積、商的求導法則。
伊薩克·牛頓爵士
牛頓和萊布尼茲的差別在於,牛頓將無窮小量作為求流數或導數的工具,而萊布尼茲則用無窮小量的比值來表示導數。這與二人的哲學思想差異有關[ 6] :92 。
微積分的理論面世後,遭到了有關無窮小量定義的攻擊與質疑。導數的定義自然也包括在內。萊布尼茲和牛頓對無窮小量的認識都是模糊的。不僅如此,萊布尼茲甚至引入了
(
d
)
x
{\displaystyle (d)x}
和
(
d
)
y
{\displaystyle (d)y}
,稱其為「未消失的量」,用以進行求導前部的計算。在完成計算後再用「消失的量」
d
x
{\displaystyle dx}
和
d
y
{\displaystyle dy}
來代替它們,並假定前兩者之比等於後兩者之比,認為這是一個不容置疑的真理[ 6] :102 。
許多數學家,包括伯努利兄弟、泰勒 、麥克勞林 、達朗貝爾 、拉格朗日 和歐拉 都想要對微積分的嚴密性辯護或將微積分嚴密化。但受限於對無窮小量的認識,十八世紀的數學家並沒有做出太大的成果。微積分的強烈抨擊者,英國的喬治·貝克萊 主教在攻擊無窮小量時認為,流數實際上是「消失的量的鬼魂」,是0與0之比。歐拉承認後者,並認為0與0之比可以是有限值。拉格朗日則假定函數都可以展開為冪級數 ,並在此基礎上定義導數[ 6] :154-156 。
十九世紀後,隨着對函數連續性和極限的更深刻認識,微積分終於趨於嚴謹。波爾查諾 是首先將導數定義為函數值的改變量與自變量增量之比在自變量增量無限接近0時趨向的量。波爾查諾強調導數不是0與0之比,而是前面的比值趨向的數[ 8] :10 。柯西 在他的著作《無窮小分析教程概論》中也使用了同樣的定義,並定義
d
y
{\displaystyle dy}
為導數與
d
x
{\displaystyle dx}
的乘積。這樣,導數和微分的概念得到了統一[ 8] :11 。
導數的記法
從微積分發軔至如今,不同的數學家都曾使用過不同的記號來表示函數的導數。部分記號至今仍然使用,成為現代的通用記法。
牛頓的記法
作為微積分的發明人之一,牛頓 在1704年著作中將導數用函數符號上方的點來表示。例如
y
=
f
(
x
)
{\displaystyle y=f(x)}
的導數就記作
y
˙
{\displaystyle {\dot {y}}}
,而二階導數則記為
y
¨
{\displaystyle {\ddot {y}}}
[ 9] :193-196 。他以後的數學家也會將
y
˙
{\displaystyle {\dot {y}}}
用來表示函數的微分 。牛頓的記法中沒有明確自變量,因此
y
{\displaystyle y}
對
x
{\displaystyle x}
的導數在牛頓的著作中也會被記成
y
′
:
x
′
{\displaystyle y':x'}
,因為這可以理解為兩個函數
y
{\displaystyle y}
和
x
{\displaystyle x}
對於另一個變量
t
{\displaystyle t}
的導數比[ 9] :196 。而這個導數比(使用萊布尼茲的記號):
y
′
:
x
′
=
d
y
d
t
:
d
x
d
t
=
d
y
d
x
{\displaystyle y':x'={\frac {dy}{dt}}:{\frac {dx}{dt}}={\frac {dy}{dx}}}
牛頓的記號多見於物理學或與之有關的方面,如微分方程 中。以及直到現在,使用函數符號上加一點來表示某一變量的變化率(即對時間的導數)依然常見於各類物理學教材中(如使用
v
˙
{\displaystyle {\dot {v}}}
來表示加速度 等)。注意到對於高階的導數,這種記法就無法表示了。
萊布尼茲的記法
戈特弗里德·威廉·萊布尼茨
萊布尼茲 在他的研究中分別使用
Δ
x
{\displaystyle \Delta x}
和
Δ
y
{\displaystyle \Delta y}
來表示函數自變量和應變量(輸出值)的有限變化量,而使用
d
x
{\displaystyle dx}
和
d
y
{\displaystyle dy}
來表示「無限小」的變化量(即所謂的「無窮小量 」)[ 10] 。如果將函數記為
y
=
f
(
x
)
{\displaystyle y=f(x)}
的話,那麼在萊布尼茲的記法下,其導數記為:
d
y
d
x
{\displaystyle {\frac {dy}{dx}}}
、
d
f
d
x
(
x
)
{\displaystyle {\frac {df}{dx}}(x)}
、
d
d
x
f
(
x
)
{\displaystyle {\frac {d}{dx}}f(x)}
或
d
(
f
(
x
)
)
d
x
,
{\displaystyle {\frac {d\left(f(x)\right)}{dx}},}
這個記法最早出現在萊布尼茲1684年的論文中[ 9] :204 ,萊布尼茲在之前的文章中會將
d
x
{\displaystyle dx}
記成
x
d
{\displaystyle {\tfrac {x}{d}}}
,把
d
y
d
x
{\displaystyle {\tfrac {dy}{dx}}}
記成
d
y
x
{\displaystyle d{\tfrac {y}{x}}}
。萊布尼茲記法的好處是明確了自變量和應變量[ 11] 。要注意的是記號
d
x
{\displaystyle dx}
是一個整體,
d
y
{\displaystyle dy}
也是,而
d
y
d
x
{\displaystyle {\frac {dy}{dx}}}
可以看成一個整體,也可以不嚴謹地看成
d
y
{\displaystyle dy}
和
d
x
{\displaystyle dx}
的比值[ 10] 。此外,
d
y
d
x
{\displaystyle {\frac {dy}{dx}}}
表示的是導函數,在某一點
x
=
a
{\displaystyle x=a}
的導數則記為:
d
y
d
x
|
x
=
a
{\displaystyle \left.{\frac {dy}{dx}}\right|_{x=a}}
對於更高階的導數(比如說n 階,見高階導數 一節),萊布尼茲的記法是:
d
n
y
d
x
n
{\displaystyle {\frac {d^{n}y}{dx^{n}}}}
、
d
n
f
d
x
n
(
x
)
{\displaystyle {\frac {d^{n}f}{dx^{n}}}(x)}
或
d
n
[
f
(
x
)
]
d
x
n
,
{\displaystyle {\frac {d^{n}\left[f(x)\right]}{dx^{n}}},}
這種記法是在1695年出現的[ 9] :205 。這裏的分子和分母不再具有單獨的意義。萊布尼茲的記法中使用
d
d
x
{\displaystyle {\frac {d}{dx}}}
來表示微分算子,比如說二階的導數
d
2
y
d
x
2
{\displaystyle {\frac {d^{2}y}{dx^{2}}}}
就可以看成:
d
2
y
d
x
2
=
d
d
x
(
d
y
d
x
)
{\displaystyle {\frac {d^{2}y}{dx^{2}}}={\frac {d}{dx}}\left({\frac {dy}{dx}}\right)}
[ 11]
萊布尼茲記法的另一個好處是便於記憶導數計算的法則。例如連鎖律 (見導數的計算 一節)應用萊布尼茲的記法就是:
d
y
d
x
=
d
y
d
u
⋅
d
u
d
x
{\displaystyle {\frac {dy}{dx}}={\frac {dy}{du}}\cdot {\frac {du}{dx}}}
可以想像為右邊是兩個分式的乘積,消去
d
u
{\displaystyle du}
之後就變成左邊[ 11] 。
由於牛頓和萊布尼茲之間關於微積分創始人稱號的持久糾紛,在十八世紀早期的很長時間裏,英國數學界與歐洲大陸的數學界分別採用牛頓和萊布尼茲的記號,涇渭分明。這種情況直到十八世紀後期才開始改變,隨着拉格朗日記法的出現而變得多樣化起來[ 9] :197-200 。
拉格朗日的記法
另一種現今常見的記法是十八世紀拉格朗日 於1797年率先使用的,以在函數的右上角加上一短撇作為導數的記號。函數
y
=
f
(
x
)
{\displaystyle y=f(x)}
的導數就記作
f
′
(
x
)
{\displaystyle f'(x)}
或
y
′
{\displaystyle y'}
[ 12] 。二階和三階導數記為
f
″
(
x
)
{\displaystyle f''(x)}
、
y
″
{\displaystyle y''}
和
f
‴
(
x
)
{\displaystyle f'''(x)}
、
y
‴
{\displaystyle y'''}
[ 9] :207 。如果需要處理更高階的導數,則用括號內的求導階數n 來代替短撇,記為:
f
(
n
)
(
x
)
{\displaystyle f^{(n)}(x)}
、
y
(
n
)
{\displaystyle y^{(n)}}
。當十九世紀的數學家柯西 處理微分學時,他認為萊布尼茲的記法「模糊不便」,而採用更為「緊湊」的記法,將
d
y
d
x
{\displaystyle {\frac {dy}{dx}}}
記為
y
x
′
{\displaystyle y'_{x}}
。這種記法可說是拉格朗日記法的變種[ 9] :218 。後來這種記法曾繼續被精簡為
y
x
{\displaystyle y_{x}}
[ 13] 。
其它記法
十九世紀以前,儘管大部分數學家會選擇採用牛頓、萊布尼茲或拉格朗日的記號來表示導數,但也有很多的數學家希望使用自己的方法來記錄。在不同數學家的著作中可以看到各種主流記法的混合或變體。數學家之間關於什麼樣的記法最為簡便和嚴謹也是各執一詞。同時,由於函數的微分、導數、偏導數以及無窮小量等概念尚未成熟,記號的不統一更增加了數學家之間相互理解的難度[ 9] :214-234 。十九世紀初期的德國數學家馬爾丹·歐姆 採用
∂
f
(
x
)
{\displaystyle \partial f(x)}
來表示導數,而同時期的雅可比 則採用
∂
f
∂
x
{\displaystyle {\frac {\partial f}{\partial x}}}
來表示偏導數。同時許多數學家採用
d
f
d
x
{\displaystyle {\frac {df}{dx}}}
[ 14] 、
d
x
f
{\displaystyle {\frac {d}{x}}f}
[ 15] 或
δ
f
δ
x
{\displaystyle {\frac {\delta f}{\delta x}}}
[ 16] 表示偏導數。
用大寫字母
D
{\displaystyle D}
表示導數從十八世紀末就開始。1800年,法國數學家路易斯·弗朗索瓦·安托內·阿伯加斯特 (Louis François Antoine Arbogast )使用
D
m
f
{\displaystyle D^{m}f}
表示函數
f
{\displaystyle f}
的m階導數或全微分 [ 17] 。而其後本傑明·佩爾斯 也使用
D
f
⋅
x
{\displaystyle Df\cdot x}
表示
f
{\displaystyle f}
對
x
{\displaystyle x}
的導數[ 18] 。而柯西也採用類似的記號,用
D
x
m
f
{\displaystyle D_{x}^{m}f}
表示函數
f
{\displaystyle f}
對
x
{\displaystyle x}
的m階偏導數 [ 19] 。
函數可導的條件
如果一個函數 的定義域 為全體實數 ,即函數在
(
−
∞
,
+
∞
)
{\displaystyle (-\infty ,+\infty )}
上都有定義,那麼該函數是不是在定義域上處處可導呢?答案是否定的。函數在定義域中一點可導需要一定的條件。首先,要使函數
f
{\displaystyle f}
在一點可導,那麼函數一定要在這一點處連續。換言之,函數若在某點可導,則必然在該點處連續。這個結論來自於連續性的定義。
符號函數 (sgn函數)是一個不連續的函數在斷點處不可導的例子:
符號函數
首先注意到這個函數在
x
0
=
0
{\displaystyle x_{0}=0}
處不連續。作為驗證,可以求出函數在
x
=
0
{\displaystyle x=0}
處附近的變化率,根據函數可導的條件再進行判斷:
該函數在
x
0
=
0
{\displaystyle x_{0}=0}
左側附近的變化率為:
f
(
x
)
−
f
(
x
0
)
x
−
x
0
=
−
1
−
0
x
−
0
=
−
1
x
{\displaystyle {\frac {f(x)-f(x_{0})}{x-x_{0}}}={\frac {-1-0}{x-0}}=-{\frac {1}{x}}}
當
x
→
0
−
{\displaystyle x\to 0^{-}}
時,上面的比值趨於正無窮大發散,不存在,故這個符號函數在
x
0
=
0
{\displaystyle x_{0}=0}
處不可導。
然而,連續性並不能保證可導性。即使函數在一點上連續,也不一定就在這一點可導。事實上,存在着在每一點都連續,但又在每一點都不可導的「病態函數」。1931年,斯特凡·巴拿赫 甚至證明,事實上「絕大多數 」的連續函數都屬於這種病態函數(至少在一點可導的連續函數在所有連續函數中是貧集 )[ 20] 。在連續而不可導的函數裏,一種常見的情況是,函數在某一點連續,並且可以定義它的左導數和右導數:
左導數:
f
−
′
(
x
0
)
=
lim
Δ
x
→
0
−
f
(
x
0
+
Δ
x
)
−
f
(
x
0
)
Δ
x
{\displaystyle f'_{-}(x_{0})=\lim _{\Delta x\to 0^{-}}{\frac {f(x_{0}+\Delta x)-f(x_{0})}{\Delta x}}}
[ 2] :118 [ 1] :155
右導數:
f
+
′
(
x
0
)
=
lim
Δ
x
→
0
+
f
(
x
0
+
Δ
x
)
−
f
(
x
0
)
Δ
x
{\displaystyle f'_{+}(x_{0})=\lim _{\Delta x\to 0^{+}}{\frac {f(x_{0}+\Delta x)-f(x_{0})}{\Delta x}}}
[ 2] :118 [ 1] :155
然而左導數和右導數並不相等,因而函數在該處不可導。實際上,若函數導數存在,則必然可以推出左右導數相等,這是由極限的性質(極限存在則左右極限相等)得來:
lim
Δ
x
→
0
f
(
x
0
+
Δ
x
)
−
f
(
x
0
)
Δ
x
=
lim
Δ
x
→
0
−
f
(
x
0
+
Δ
x
)
−
f
(
x
0
)
Δ
x
=
lim
Δ
x
→
0
+
f
(
x
0
+
Δ
x
)
−
f
(
x
0
)
Δ
x
{\displaystyle \lim _{\Delta x\to 0}{\frac {f(x_{0}+\Delta x)-f(x_{0})}{\Delta x}}=\lim _{\Delta x\to 0^{-}}{\frac {f(x_{0}+\Delta x)-f(x_{0})}{\Delta x}}=\lim _{\Delta x\to 0^{+}}{\frac {f(x_{0}+\Delta x)-f(x_{0})}{\Delta x}}}
下面以絕對值函數作為例子:
絕對值函數
該函數在
x
=
0
{\displaystyle x=0}
處的左導數為:
f
−
′
(
0
)
=
lim
x
→
0
−
f
(
x
)
−
f
(
0
)
x
−
0
=
lim
x
→
0
−
−
x
−
0
x
−
0
=
−
1
{\displaystyle f'_{-}(0)=\lim _{x\to 0^{-}}{\frac {f(x)-f(0)}{x-0}}=\lim _{x\to 0^{-}}{\frac {-x-0}{x-0}}=-1}
該函數在
x
=
0
{\displaystyle x=0}
處的右導數為:
f
+
′
(
0
)
=
lim
x
→
0
+
f
(
x
)
−
f
(
0
)
x
−
0
=
lim
x
→
0
+
x
−
0
x
−
0
=
1
{\displaystyle f'_{+}(0)=\lim _{x\to 0^{+}}{\frac {f(x)-f(0)}{x-0}}=\lim _{x\to 0^{+}}{\frac {x-0}{x-0}}=1}
絕對值函數在
x
=
0
{\displaystyle x=0}
處的左右導數皆存在,但由於左右導數不相等,故絕對值函數在
x
=
0
{\displaystyle x=0}
處不可導。[ 2] :118-119
如果函數在一點的左右導數都存在並且相等,那麼函數在該處可導。[ 1] :155
導數與函數的性質
通過認識可導函數的導數,可以推斷出不少函數本身的性質。
單調性
x變化時函數
f
(
x
)
=
1
+
x
sin
(
x
2
)
{\displaystyle \scriptstyle f(x)=1+x\sin(x^{2})}
(藍色曲線)的切線變化。函數的導數值就是切線的斜率,綠色代表其值為正,紅色代表其值為負,黑色代表值為零。
根據微積分基本定理 ,對於可導的函數
f
{\displaystyle f}
,有:
f
(
b
)
−
f
(
a
)
=
∫
a
b
f
′
(
t
)
d
t
{\displaystyle f(b)-f(a)=\int _{a}^{b}f'(t)\mathrm {d} t}
如果函數的導函數在某一區間內恆大於零(或恆小於零),那麼函數在這一區間內單調遞增(或單調遞減),這種區間也稱為函數的單調區間。導函數等於零的點稱為函數的駐點 (或極值可疑點),在這類點上函數可能會取得極大值或極小值。進一步判斷則需要知道導函數在附近的符號。對於滿足
f
′
(
x
0
)
=
0
{\displaystyle f'(x_{0})=0}
的一點
x
0
{\displaystyle x_{0}}
,如果存在
δ
>
0
{\displaystyle \delta >0}
使得
f
′
{\displaystyle f'}
在區間
(
x
0
−
δ
,
x
0
]
{\displaystyle (x_{0}-\delta ,x_{0}]}
上都大於等於零,而在區間
[
x
0
,
x
0
+
δ
)
{\displaystyle [x_{0},x_{0}+\delta )}
上都小於等於零,那麼
x
0
{\displaystyle x_{0}}
是一個極大值點,反之則為極小值點[ 2] :170 。如果
f
″
(
x
0
)
=
0
{\displaystyle f''(x_{0})=0}
並且
f
″
(
x
)
{\displaystyle f''(x)}
在
x
0
{\displaystyle x_{0}}
改變加減號,則稱這個點是拐點 ;否則這個點不是拐點 。[ 21] :200
如果函數在
x
0
{\displaystyle x_{0}}
處的二階導數
f
″
(
x
0
)
{\displaystyle f''(x_{0})}
存在,極值點也可以用它的正負性判斷(已確定
f
′
(
x
0
)
=
0
{\displaystyle f'(x_{0})=0}
)。如果
f
″
(
x
0
)
>
0
{\displaystyle f''(x_{0})>0}
,那麼
x
0
{\displaystyle x_{0}}
是一個極小值點,反之為極大值點[ 2] :170-171 。
凹凸性
可導函數的凹凸性與其導數的單調性有關。如果函數的導函數在某個區間上單調遞增,那麼這個區間上函數是向下凸的,反之則是向上凸的。如果二階導函數存在,也可以用它的正負性判斷,如果在某個區間上
f
″
{\displaystyle f''}
恆大於零,則這個區間上函數是向下凸的,反之這個區間上函數是向上凸的[ 2] :176-178 。
導數的計算
原則上,函數的導數可以通過考慮差商 和計算其極限 來從定義計算。在實踐中,一旦知道了一些簡單函數的導數,就可以使用從更簡單的函數獲得更複雜函數的導數的規則,來更容易地計算其他函數的導數。
基本函數的導數
所謂基本函數是指一些形式簡單並且容易求出導數的函數。這些基本函數的導函數可以通過定義直接求出。
f
(
x
)
=
x
r
,
{\displaystyle f(x)=x^{r},}
其中
r
{\displaystyle r}
是任意實數,那麼
f
′
(
x
)
=
r
x
r
−
1
,
{\displaystyle f'(x)=rx^{r-1},}
函數
f
{\displaystyle f}
的定義域可以是整個實數 域,但導函數的定義域 則不一定與之相同。例如當
r
=
1
2
{\displaystyle r={\frac {1}{2}}}
時:
f
′
(
x
)
=
1
2
x
−
1
2
{\displaystyle f'(x)={\frac {1}{2}}x^{-{\tfrac {1}{2}}}\,}
[ 2] :119
導函數的定義域只限所有正實數而不包括0。需要注意的是,不會有多項式函數的導數為
x
−
1
{\displaystyle \scriptstyle x^{-1}}
。當
r
=
0
{\displaystyle r=0}
時,常函數的導數是0。
底數為
e
{\displaystyle e}
的指數函數
y
=
e
x
{\displaystyle \scriptstyle y=e^{x}}
的導數還是自身:
d
d
x
e
x
=
e
x
.
{\displaystyle \scriptstyle {\frac {\mathrm {d} }{\mathrm {d} x}}e^{x}=e^{x}.}
而一般的指數函數
y
=
a
x
{\displaystyle y=a^{x}}
的導數還需要乘以一個系數:
d
d
x
a
x
=
ln
(
a
)
a
x
.
{\displaystyle \scriptstyle {\frac {\mathrm {d} }{\mathrm {d} x}}a^{x}=\ln(a)a^{x}.}
[ 2] :122
自然對數函數 的導數則是
x
−
1
{\displaystyle x^{-1}}
:
d
d
x
ln
(
x
)
=
1
x
,
x
>
0.
{\displaystyle \scriptstyle {\frac {\mathrm {d} }{\mathrm {d} x}}\ln(x)={\frac {1}{x}},\qquad x>0.}
[ 2] :123 同樣的,一般的對數函數導數則還需要乘以一個系數:
d
d
x
log
a
(
x
)
=
1
x
ln
(
a
)
{\displaystyle \scriptstyle {\frac {\mathrm {d} }{\mathrm {d} x}}\log _{a}(x)={\frac {1}{x\ln(a)}}}
d
d
x
sin
(
x
)
=
cos
(
x
)
.
{\displaystyle {\frac {d}{dx}}\sin(x)=\cos(x).}
d
d
x
cos
(
x
)
=
−
sin
(
x
)
.
{\displaystyle {\frac {d}{dx}}\cos(x)=-\sin(x).}
d
d
x
tan
(
x
)
=
sec
2
(
x
)
=
1
cos
2
(
x
)
=
1
+
tan
2
(
x
)
.
{\displaystyle {\frac {d}{dx}}\tan(x)=\sec ^{2}(x)={\frac {1}{\cos ^{2}(x)}}=1+\tan ^{2}(x).}
d
d
x
cot
(
x
)
=
−
csc
2
(
x
)
=
−
1
sin
2
(
x
)
.
{\displaystyle {\frac {\mathrm {d} }{\mathrm {d} x}}\cot(x)=-\csc ^{2}(x)=-{\frac {1}{\sin ^{2}(x)}}.}
d
d
x
arcsin
(
x
)
=
1
1
−
x
2
,
−
1
<
x
<
1.
{\displaystyle {\frac {d}{dx}}\arcsin(x)={\frac {1}{\sqrt {1-x^{2}}}},\qquad -1<x<1.}
d
d
x
arccos
(
x
)
=
−
1
1
−
x
2
,
−
1
<
x
<
1.
{\displaystyle {\frac {d}{dx}}\arccos(x)=-{\frac {1}{\sqrt {1-x^{2}}}},\qquad -1<x<1.}
d
d
x
arctan
(
x
)
=
1
1
+
x
2
{\displaystyle {\frac {d}{dx}}\arctan(x)={\frac {1}{1+x^{2}}}}
導數的求導法則
由基本函數的和、差、積、商或相互複合構成的函數的導函數則可以通過函數的求導法則來推導。基本的求導法則如下:
求導的線性性:對函數的線性組合求導,等於先對其中每個部分求導後再取線性組合。
(
a
f
+
b
g
)
′
=
a
f
′
+
b
g
′
{\displaystyle (af+bg)'=af'+bg'\,}
(其中
a
,
b
{\displaystyle a,b}
為常數)[ 2] :121
兩個函數的乘積的導函數,等於其中一個的導函數乘以另一者,加上另一者的導函數與其的乘積
(
f
g
)
′
=
f
′
g
+
f
g
′
{\displaystyle (fg)'=f'g+fg'\,}
[ 2] :125
兩個函數的商的導函數也是一個分式。其中分子是分子函數的導函數乘以分母函數減去分母函數的導函數乘以分子函數後的差,而其分母是分母函數的平方。
(
f
g
)
′
=
f
′
g
−
f
g
′
g
2
{\displaystyle \left({\frac {f}{g}}\right)'={\frac {f'g-fg'}{g^{2}}}}
(在
g
(
x
)
≠
0
{\displaystyle g(x)\neq 0}
處方有意義)[ 2] :126
複合函數的求導法則 :如果有複合函數
f
(
x
)
=
h
[
g
(
x
)
]
{\displaystyle f(x)=h[g(x)]}
,那麼
f
′
(
x
)
=
h
′
[
g
(
x
)
]
⋅
g
′
(
x
)
.
{\displaystyle f'(x)=h'[g(x)]\cdot g'(x).\,}
[ 2] :128
若要求某個函數在某一點的導數,可以先運用以上方法求出這個函數的導函數,再看導函數在這一點的值。
例子
欲求函數
f
(
x
)
=
x
4
+
sin
(
x
2
)
−
ln
(
x
)
e
x
+
7
{\displaystyle f(x)=x^{4}+\sin(x^{2})-\ln(x)e^{x}+7\,}
在
x
=
3
{\displaystyle x=3}
處的導數。可以先求出其導函數:
f
′
(
x
)
=
4
x
(
4
−
1
)
+
d
(
x
2
)
d
x
cos
(
x
2
)
−
[
d
(
ln
x
)
d
x
e
x
+
ln
x
d
(
e
x
)
d
x
]
+
0
=
4
x
3
+
2
x
cos
(
x
2
)
−
1
x
e
x
−
ln
(
x
)
e
x
.
{\displaystyle {\begin{aligned}f'(x)&=4x^{(4-1)}+{\frac {\mathrm {d} \left(x^{2}\right)}{\mathrm {d} x}}\cos(x^{2})-\left[{\frac {\mathrm {d} \left(\ln {x}\right)}{\mathrm {d} x}}e^{x}+\ln {x}{\frac {\mathrm {d} \left(e^{x}\right)}{\mathrm {d} x}}\right]+0\\&=4x^{3}+2x\cos(x^{2})-{\frac {1}{x}}e^{x}-\ln(x)e^{x}.\end{aligned}}}
其中第二項使用了複合函數的求導法則,而第三項則使用了乘積的求導法則。求出導函數後,再將
x
=
3
{\displaystyle x=3}
代入,得到導數為:
f
′
(
3
)
=
108
+
6
cos
(
9
)
−
e
3
3
−
ln
(
3
)
e
3
{\displaystyle f'(3)=108+6\cos(9)-{\frac {e^{3}}{3}}-\ln(3)e^{3}\,}
高階導數
二階導數
如果函數的導數
f
′
(
x
)
{\displaystyle f'(x)\,}
在
x
{\displaystyle x\,}
處可導,則稱
[
f
′
(
x
)
]
′
{\displaystyle [f'(x)]'\,}
為
x
{\displaystyle x\,}
的二階導數。記做:
f
″
(
x
)
{\displaystyle f''(x)\,}
,
y
″
{\displaystyle y''\,}
,
d
2
y
d
x
2
{\displaystyle {\frac {{\rm {d}}^{2}y}{{\rm {d}}x^{2}}}}
或
d
2
f
(
x
)
d
x
2
{\displaystyle {\frac {{\rm {d}}^{2}f(x)}{{\rm {d}}x^{2}}}}
[ 2] :132 、
二階導數可用於求解函數凹凸性問題。
f
″
(
x
)
>
0
{\displaystyle f''(x)>0}
函數在x上凹。
f
″
(
x
)
<
0
{\displaystyle f''(x)<0}
函數在x下凹。
高階導數
二階導數的導數稱為三階導數,記做
f
‴
(
x
)
{\displaystyle f'''(x)\,}
,
y
‴
{\displaystyle y'''\,}
,
d
3
y
d
x
3
{\displaystyle {\frac {{\rm {d}}^{3}y}{{\rm {d}}x^{3}}}}
或
d
3
f
(
x
)
d
x
3
{\displaystyle {\frac {{\rm {d}}^{3}f(x)}{{\rm {d}}x^{3}}}}
三階導數的導數稱為四階導數,記做
f
(
4
)
(
x
)
{\displaystyle f^{(4)}(x)\,}
,
y
(
4
)
{\displaystyle y^{(4)}\,}
,
d
4
y
d
x
4
{\displaystyle {\frac {{\rm {d}}^{4}y}{{\rm {d}}x^{4}}}}
或
d
4
f
(
x
)
d
x
4
{\displaystyle {\frac {{\rm {d}}^{4}f(x)}{{\rm {d}}x^{4}}}}
一般的
f
(
x
)
{\displaystyle f(x)\,}
的
n
−
1
{\displaystyle n-1\,}
階導數的導數稱為
f
(
x
)
{\displaystyle f(x)\,}
的
n
{\displaystyle n\,}
階導數,記為
f
(
n
)
(
x
)
{\displaystyle f^{(n)}(x)\,}
,
y
(
n
)
{\displaystyle y^{(n)}\,}
,
d
n
y
d
x
n
{\displaystyle {\frac {{\rm {d}}^{n}y}{{\rm {d}}x^{n}}}}
或
d
n
f
(
x
)
d
x
n
{\displaystyle {\frac {{\rm {d}}^{n}f(x)}{{\rm {d}}x^{n}}}}
[ 2] :133
高階導數的求法
一般來說,高階導數的計算和導數一樣,可以按照定義逐步求出。同時,高階導數也有求導法則:
d
n
d
x
n
(
u
±
v
)
=
d
n
d
x
n
u
±
d
n
d
x
n
v
{\displaystyle {\frac {{\rm {d}}^{n}}{{\rm {d}}x^{n}}}(u\pm v)={\frac {{\rm {d}}^{n}}{{\rm {d}}x^{n}}}u\pm {\frac {{\rm {d}}^{n}}{{\rm {d}}x^{n}}}v}
d
n
d
x
n
(
C
u
)
=
C
d
n
d
x
n
u
{\displaystyle {\frac {{\rm {d}}^{n}}{{\rm {d}}x^{n}}}(Cu)=C{\frac {{\rm {d}}^{n}}{{\rm {d}}x^{n}}}u\ }
d
n
d
x
n
(
u
⋅
v
)
=
∑
k
=
0
n
C
k
n
d
n
−
k
d
x
n
−
k
u
d
k
d
x
k
v
{\displaystyle {\frac {{\rm {d}}^{n}}{{\rm {d}}x^{n}}}(u\cdot v)=\sum _{k=0}^{n}C_{k}^{n}{\frac {{\rm {d}}^{n-k}}{{\rm {d}}x^{n-k}}}u{\frac {{\rm {d}}^{k}}{{\rm {d}}x^{k}}}v}
(萊布尼茲公式 )[ 2] :134
因此,可以利用已知的高階導數求導法則,通過四則運算, 變量代換等方法,求出
n
{\displaystyle n\ }
階導數。一些常見的有規律的高階導數的公式如下[ 2] :133 :
d
n
d
x
n
x
α
=
x
α
−
n
∏
k
=
0
n
−
1
(
α
−
k
)
{\displaystyle {\frac {{\rm {d}}^{n}}{{\rm {d}}x^{n}}}x^{\alpha }=x^{\alpha -n}\prod _{k=0}^{n-1}(\alpha -k)}
d
n
d
x
n
1
x
=
(
−
1
)
n
n
!
x
n
+
1
{\displaystyle {\frac {{\rm {d}}^{n}}{{\rm {d}}x^{n}}}{\frac {1}{x}}=(-1)^{n}{\frac {n!}{x^{n+1}}}}
d
n
d
x
n
ln
x
=
(
−
1
)
n
−
1
(
n
−
1
)
!
x
n
{\displaystyle {\frac {{\rm {d}}^{n}}{{\rm {d}}x^{n}}}\ln x=(-1)^{n-1}{\frac {(n-1)!}{x^{n}}}}
{\displaystyle \!}
d
n
d
x
n
e
x
=
e
x
{\displaystyle {\frac {{\rm {d}}^{n}}{{\rm {d}}x^{n}}}e^{x}=e^{x}\ }
d
n
d
x
n
a
x
=
a
x
⋅
ln
n
a
{\displaystyle {\frac {{\rm {d}}^{n}}{{\rm {d}}x^{n}}}a^{x}=a^{x}\cdot \ln ^{n}a}
(
a
>
0
)
{\displaystyle (a>0)\ }
{\displaystyle \!}
d
n
d
x
n
sin
(
k
x
+
b
)
=
k
n
sin
(
k
x
+
b
+
n
π
2
)
{\displaystyle {\frac {{\rm {d}}^{n}}{{\rm {d}}x^{n}}}\sin \left(kx+b\right)=k^{n}\sin \left(kx+b+{\frac {n\pi }{2}}\right)}
d
n
d
x
n
cos
(
k
x
+
b
)
=
k
n
cos
(
k
x
+
b
+
n
π
2
)
{\displaystyle {\frac {{\rm {d}}^{n}}{{\rm {d}}x^{n}}}\cos \left(kx+b\right)=k^{n}\cos \left(kx+b+{\frac {n\pi }{2}}\right)}
多元函數的導數
向量值函數的導數
當函數
y
{\displaystyle y}
的取值不再是實數,而是一般的
R
n
{\displaystyle \mathbf {R} ^{n}}
中的向量 時,仍然可能對其求導。這時的函數值是:
y
=
(
y
1
(
x
)
,
y
2
(
x
)
,
⋯
,
y
n
(
x
)
)
{\displaystyle y=\left(y_{1}(x),y_{2}(x),\cdots ,y_{n}(x)\right)}
。每個
y
i
(
x
)
,
1
⩽
i
⩽
n
{\displaystyle y_{i}(x),\;\;1\leqslant i\leqslant n}
都是一個實數值的函數。具體的例子如二維或者三維空間裏的參數方程 。因此,對
y
=
f
(
x
)
{\displaystyle y=f(x)}
求導實際上是對每個分量函數
y
i
(
x
)
{\displaystyle y_{i}(x)}
求導。
y
′
(
t
)
=
(
y
1
′
(
t
)
,
⋯
,
y
n
′
(
t
)
)
.
{\displaystyle \mathbf {y} '(t)=(y'_{1}(t),\cdots ,y'_{n}(t)).}
[ 2] :191
這也符合定義
y
′
(
t
)
=
lim
h
→
0
y
(
t
+
h
)
−
y
(
t
)
h
,
{\displaystyle \mathbf {y} '(t)=\lim _{h\to 0}{\frac {\mathbf {y} (t+h)-\mathbf {y} (t)}{h}},}
設
(
e
1
,
e
2
,
⋯
e
n
)
{\displaystyle \left(e_{1},e_{2},\cdots e_{n}\right)}
為
R
n
{\displaystyle \mathbf {R} ^{n}}
的一組基 ,那麼對函數:
y
:
t
↦
y
1
(
t
)
e
1
+
y
2
(
t
)
e
2
+
⋯
y
n
(
t
)
e
n
,
{\displaystyle y\,:t\,\mapsto \,y_{1}(t)e_{1}+y_{2}(t)e_{2}+\cdots y_{n}(t)e_{n},}
其導函數為:
y
′
(
t
)
=
y
1
′
(
t
)
e
1
+
y
2
′
(
t
)
e
2
+
⋯
y
n
′
(
t
)
e
n
{\displaystyle y'(t)=y'_{1}(t)e_{1}+y'_{2}(t)e_{2}+\cdots y'_{n}(t)e_{n}}
偏導數
如果有函數
f
{\displaystyle f}
其自變量不是單個實數,而是多於一個元素,例如:
f
(
x
,
y
)
=
x
2
+
x
y
+
y
2
.
{\displaystyle f(x,y)=x^{2}+xy+y^{2}.\,}
這時可以把其中一個元素(比如
x
{\displaystyle x}
)看做參數,那麼
f
{\displaystyle f}
可以看做是關於另一個元素的參數函數:
f
(
x
,
y
)
=
f
x
(
y
)
=
x
2
+
x
y
+
y
2
.
{\displaystyle f(x,y)=f_{x}(y)=x^{2}+xy+y^{2}.\,}
也就是說,對於某個確定的
x
{\displaystyle x}
,函數
f
x
{\displaystyle f_{x}}
就是一個關於
y
{\displaystyle y}
的函數。在
x
=
a
{\displaystyle x=a}
固定的情況下,可以計算這個函數
f
x
{\displaystyle f_{x}}
關於
y
{\displaystyle y}
的導數。
f
a
′
(
y
)
=
a
+
2
y
{\displaystyle f_{a}'(y)=a+2y\,}
這個表達式對於所有的
a
{\displaystyle a}
都對。這種導數稱為偏導數,一般記作:
∂
f
∂
y
(
x
,
y
)
=
x
+
2
y
{\displaystyle {\frac {\partial f}{\partial y}}(x,y)=x+2y}
這裏的符號 ∂ 是字母
d
{\displaystyle d}
的圓體變體,一般讀作
δ
{\displaystyle \delta }
的首音節或讀「偏」,以便與
d
{\displaystyle d}
區別。
更一般地來說,一個多元函數
f
(
x
1
,
x
2
,
⋯
,
x
n
)
{\displaystyle f\left(x_{1},x_{2},\cdots ,x_{n}\right)}
在點
(
a
1
,
a
2
,
⋯
,
a
n
)
{\displaystyle \left(a_{1},a_{2},\cdots ,a_{n}\right)}
處對
x
i
{\displaystyle x_{i}}
的偏導數定義為:
∂
f
∂
x
i
(
a
1
,
…
,
a
n
)
=
lim
h
→
0
f
(
a
1
,
…
,
a
i
+
h
,
…
,
a
n
)
−
f
(
a
1
,
…
,
a
n
)
h
.
{\displaystyle {\frac {\partial f}{\partial x_{i}}}(a_{1},\ldots ,a_{n})=\lim _{h\to 0}{\frac {f(a_{1},\ldots ,a_{i}+h,\ldots ,a_{n})-f(a_{1},\ldots ,a_{n})}{h}}.}
上面的極限中,除了
x
i
{\displaystyle x_{i}}
外所有的自變元都是固定的,這就確定了一個一元函數:
f
a
1
,
…
,
a
i
−
1
,
a
i
+
1
,
…
,
a
n
(
x
i
)
=
f
(
a
1
,
…
,
a
i
−
1
,
x
i
,
a
i
+
1
,
…
,
a
n
)
{\displaystyle f_{a_{1},\ldots ,a_{i-1},a_{i+1},\ldots ,a_{n}}(x_{i})=f(a_{1},\ldots ,a_{i-1},x_{i},a_{i+1},\ldots ,a_{n})}
因此,按定義有:
d
f
a
1
,
…
,
a
i
−
1
,
a
i
+
1
,
…
,
a
n
d
x
i
(
a
i
)
=
∂
f
∂
x
i
(
a
1
,
…
,
a
n
)
.
{\displaystyle {\frac {df_{a_{1},\ldots ,a_{i-1},a_{i+1},\ldots ,a_{n}}}{dx_{i}}}(a_{i})={\frac {\partial f}{\partial x_{i}}}(a_{1},\ldots ,a_{n}).}
偏導數的實質仍然是一元函數的導數。[ 22] :56
多變量函數的一個重要的例子,是從
R
n
{\displaystyle \mathbf {R} ^{n}}
(例如
R
2
{\displaystyle \mathbf {R} ^{2}}
或
R
3
{\displaystyle \mathbf {R} ^{3}}
)映射到
R
{\displaystyle \mathbf {R} }
上的純量值函數
f
(
x
1
,
x
2
,
⋯
,
x
n
)
{\displaystyle f\left(x_{1},x_{2},\cdots ,x_{n}\right)}
。在這種情況下,
f
{\displaystyle f}
關於每一個變量
x
i
{\displaystyle x_{i}}
都有偏導數
∂
f
∂
x
i
{\displaystyle {\frac {\partial f}{\partial x_{i}}}}
。在點
x
=
a
{\displaystyle x={\boldsymbol {a}}}
,這些偏導數定義了一個向量:
∇
f
(
a
)
=
[
∂
f
∂
x
1
(
a
)
,
…
,
∂
f
∂
x
n
(
a
)
]
{\displaystyle \nabla f({\boldsymbol {a}})=\left[{\frac {\partial f}{\partial x_{1}}}({\boldsymbol {a}}),\ldots ,{\frac {\partial f}{\partial x_{n}}}({\boldsymbol {a}})\right]}
。
這個向量稱為
f
{\displaystyle f}
在點
a
{\displaystyle {\boldsymbol {a}}}
的梯度 。如果
f
{\displaystyle f}
在定義域中的每一個點都是可微的,那麼梯度便是一個向量值函數
∇
f
{\displaystyle \nabla f}
,它把點
a
{\displaystyle a}
映射到向量
∇
f
(
a
)
{\displaystyle \nabla f(a)}
。這樣,梯度便決定了一個向量場 。
方向導數
方向導數是比偏導數更加廣泛的概念。導數的本質是函數值增量與自變量增量之比的極限。在多元函數
f
{\displaystyle f}
中,可以選定一個確定的方向(以這個方向上的單位向量
δ
{\displaystyle {\boldsymbol {\delta }}}
表示),並考慮函數在這個方向上的增量:
f
(
x
0
+
t
δ
)
−
f
(
x
0
)
{\displaystyle f({\boldsymbol {x}}_{0}+t{\boldsymbol {\delta }})-f({\boldsymbol {x}}_{0})}
這個增量為關於
t
{\displaystyle t}
的一元函數。函數
f
{\displaystyle f}
的方向導數定義為這個增量與
t
{\displaystyle t}
的比值在
t
{\displaystyle t}
趨於0時的極限,記為
∂
f
∂
δ
(
x
0
)
{\displaystyle {\frac {\partial f}{\partial {\boldsymbol {\delta }}}}({\boldsymbol {x}}_{0})}
。
∂
f
∂
δ
(
x
0
)
=
lim
t
→
0
f
(
x
0
+
t
δ
)
−
f
(
x
0
)
t
{\displaystyle {\frac {\partial f}{\partial {\boldsymbol {\delta }}}}({\boldsymbol {x}}_{0})=\lim _{t\to 0}{\frac {f({\boldsymbol {x}}_{0}+t{\boldsymbol {\delta }})-f({\boldsymbol {x}}_{0})}{t}}}
方向導數表示了函數從某點開始在某個方向上的變化率。[ 22] :55-56
在
R
n
{\displaystyle \mathbf {R} ^{n}}
中,如果將向量
δ
{\displaystyle {\boldsymbol {\delta }}}
選為正規基
(
e
1
,
e
2
,
⋯
,
e
n
)
{\displaystyle \left({\boldsymbol {e}}_{1},{\boldsymbol {e}}_{2},\cdots ,{\boldsymbol {e}}_{n}\right)}
之中的一個,如
e
i
{\displaystyle {\boldsymbol {e}}_{i}}
,那麼方向導數就是關於
x
i
{\displaystyle {\boldsymbol {x}}_{i}}
的偏導數。[ 22] :55-56
推廣
導數的概念建立在變量為實數之上,但也可以推廣到更加廣泛的意義上。推廣的導數本質上仍舊是函數在局部一點上的線性逼近。
復變量導數
對於變量為複數的函數,也可以定義導數的概念。假設有複變函數
f
:
Ω
∈
C
→
C
{\displaystyle f:\Omega \in \mathbb {C} \to \mathbb {C} }
。如果
f
{\displaystyle f}
在某一點
z
0
{\displaystyle z_{0}}
及附近有定義,並且極限:
lim
z
→
z
0
f
(
z
)
−
f
(
z
0
)
z
−
z
0
{\displaystyle \lim _{z\to z_{0}}{\frac {f(z)-f(z_{0})}{z-z_{0}}}}
存在,那麼就說函數
f
{\displaystyle f}
在
z
0
{\displaystyle z_{0}}
可導。其中
z
→
z
0
{\displaystyle z\to z_{0}}
表示
z
−
z
0
{\displaystyle z-z_{0}}
的模長 趨向於0。如果將復變量
z
{\displaystyle z}
視作
x
+
i
y
{\displaystyle x+iy}
,那麼
f
{\displaystyle f}
可以視作一個
R
2
{\displaystyle \mathbb {R} ^{2}}
上的函數。如果作為複變函數的
f
{\displaystyle f}
可導,那麼作為
R
2
{\displaystyle \mathbb {R} ^{2}}
上函數的
f
{\displaystyle f}
的偏導數也存在,但反之則不然。只有當柯西-黎曼條件 滿足的時候才能保證複變函數的復可導性[ 23] 。
弱微分
在分佈理論 里,弱微分的概念使得對更多嚴格意義上無法求導的函數也可以定義導函數。設
u
{\displaystyle u}
是一個局部勒貝格可積(比如說在
L
l
o
c
1
(
R
)
{\displaystyle L_{loc}^{1}(\mathbb {R} )\ }
中)的函數,稱
v
∈
L
l
o
c
1
(
R
)
{\displaystyle v\in L_{loc}^{1}(\mathbb {R} )}
是
u
{\displaystyle u}
的一個弱微分,如果對所有的測試函數
φ
{\displaystyle \varphi }
,都有:
∫
R
u
(
t
)
φ
′
(
t
)
d
t
=
−
∫
R
v
(
t
)
φ
(
t
)
d
t
{\displaystyle \int _{\mathbb {R} }u(t)\varphi '(t)dt=-\int _{\mathbb {R} }v(t)\varphi (t)dt}
成立。其中測試函數是指緊支撐 的光滑函數 [ 24] 。弱微分包括了強微分,也就是通常意義上的導數。
次導數
過
x
0
{\displaystyle x_{0}}
的直線(紅)在函數(藍)下方,它的斜率是函數的次導數
在凸分析 ,也就是對凸函數 的研究中,可以定義凸函數的次導數。次導數的概念是導數的幾何意義的推廣。由於函數是凸的,過它的圖像上每一點總可以作一條直線,使得函數的圖像在直線上方。這種直線的斜率稱為函數在這點的次導數。如果函數在某點可導,那麼次導數只有一個,等於其導數。如果函數像絕對值函數一樣在零點有突然的轉折,那麼次導數可能不止一個。比如過零點而斜率在
(
−
1
,
1
)
{\displaystyle (-1,1)}
之間的直線都在絕對值函數下方,因此
(
−
1
,
1
)
{\displaystyle (-1,1)}
之間的每個數都是絕對值函數在零點的次導數。[ 25]
非整數階導數
早在十九世紀,在數學家明確了求導與積分的互逆關係以後,就出現了負階次導數的記號:
D
−
n
=
∫
n
{\displaystyle D^{-n}=\int ^{n}}
(表示求n次積分)[ 9] :208 。而非整數階導數的概念則進一步將其推廣。比如,半微分算子
H
=
D
1
2
{\displaystyle H=D^{\frac {1}{2}}}
表示其作用於函數上兩次以後的效果將等於一次求導:
H
2
(
f
)
(
x
)
=
H
[
H
(
f
)
]
(
x
)
=
D
(
f
)
(
x
)
=
f
′
(
x
)
{\displaystyle H^{2}(f)(x)=H[H(f)](x)=D(f)(x)=f'(x)}
定義非整數階導數的方法不止一種,最常用的非整數階導數定義為黎曼-萊歐維爾定義:
設
0
<
s
<
1
{\displaystyle 0<s<1}
,函數
f
{\displaystyle f}
的s階積分為:
D
t
−
s
f
(
t
)
=
1
Γ
(
s
)
∫
a
t
(
t
−
u
)
s
−
1
f
(
u
)
d
(
u
)
{\displaystyle D_{t}^{-s}f(t)={\frac {1}{\Gamma (s)}}\int _{a}^{t}(t-u)^{s-1}f(u)d(u)}
而對
n
−
1
<
β
<
n
{\displaystyle n-1<\beta <n}
,函數
f
{\displaystyle f}
的
β
{\displaystyle \beta }
階導數為:
D
t
β
f
(
t
)
=
d
n
d
t
n
[
D
t
−
n
−
β
f
(
t
)
]
{\displaystyle D_{t}^{\beta }f(t)={\frac {d^{n}}{dt^{n}}}\left[D_{t}^{-n-\beta }f(t)\right]}
[ 26] [ 27]
加托導數和弗雷歇導數
方向導數在無窮維向量空間如巴拿赫空間 和弗雷歇空間 上可以推廣為加托導數 和弗雷歇導數 。二者都經常用於形式化泛函導數 的概念,常見於物理學,特別是量子場論 [ 28] 。
導子
微分代數 中有導子的概念。導子是具備了微分算子的某些特徵的運算子,例如向量場的李導數 ,或非交換代數中的交換子 [ 29] 。給定一個環或域
R
{\displaystyle \mathbf {R} }
上的一個代數
A
{\displaystyle {\mathcal {A}}}
,
A
{\displaystyle {\mathcal {A}}}
上的一個
R
{\displaystyle \mathbf {R} }
-導子
δ
{\displaystyle \delta }
是一個從
A
{\displaystyle {\mathcal {A}}}
射到自身的
R
{\displaystyle \mathbf {R} }
-線性映射 (線性自同態),並滿足導數的乘積法則:
δ
(
a
b
)
=
(
δ
a
)
b
+
a
(
δ
b
)
{\displaystyle \delta (ab)=(\delta a)b+a(\delta b)}
所有
R
{\displaystyle \mathbf {R} }
-導子構成了
A
{\displaystyle {\mathcal {A}}}
上線性自同態集
End
A
{\displaystyle \operatorname {End} {\mathcal {A}}}
的子空間[ 30] 。
導數的應用
物理學 、幾何學 、工程科學 、經濟學 等學科中的一些重要概念都可以用導數來表示。如,導數可以表示運動物體的瞬時速度 和加速度 ,也可以表示曲線在一點的斜率 。
邊際和彈性
經濟學中,所謂邊際 和彈性 的概念與導數緊密相關。比如邊際成本就是產量增加一個單位所帶來的成本的增加,若將其連續化,得到的便是成本函數的導數。又如需求 的彈性是指價格變化一個單位時,需求量的變化,連續化後相應的也是需求函數關於價格的導數。[ 31]
參見
註釋
參考文獻
^ 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 徐森林; 薛春華. 《数学分析(第一册)》. 清華大學出版社. 2005. ISBN 978-7-302-11746-9 .
^ 2.00 2.01 2.02 2.03 2.04 2.05 2.06 2.07 2.08 2.09 2.10 2.11 2.12 2.13 2.14 2.15 2.16 2.17 2.18 2.19 2.20 2.21 歐陽光中; 姚允龍; 周淵 (編). O.305. 《数学分析(上册)》. 復旦大學出版社. 2003. ISBN 7-309-03570-4 .
^ 朝嵩金, 正敏段, 漢明王. 《线性代数》. 清華大學出版社. 2006. ISBN 7-302-12350-0 .
^ 梁子傑. 「可微」還是「可導」? (PDF) . 數學教育. [永久失效連結 ]
^ 5.0 5.1 (英文) Dan Ginsburg, Brian Groose, Josh Taylor, Bogdan Vernescu. History of the Differential from the 17th Century . [2011-02-10 ] . (原始內容存檔 於2021-02-18).
^ 6.0 6.1 6.2 6.3 6.4 6.5 6.6 (中文) 莫里斯·克萊因 . 《古今数学思想》第二卷 . 由張理京、張錦炎、江澤涵 翻譯. 上海科學技術出版社. 2002. ISBN 7-5323-6172-1 .
^ (英文) W. W. Rouse Ball. Isaac Barrow . [2011-02-10 ] . (原始內容存檔 於2012-05-03).
^ 8.0 8.1 (中文) 莫里斯·克萊因 . 《古今数学思想》第四卷 . 由張理京、張錦炎、江澤涵 翻譯. 上海科學技術出版社. 2002. ISBN 7-5323-6172-1 .
^ 9.0 9.1 9.2 9.3 9.4 9.5 9.6 9.7 9.8 Florian Cajori. A History of Mathematical Notations 第2卷 . Dover Publications. 1993年12月. ISBN 978-0486677668 .
^ 10.0 10.1 Stewart, James. Calculus: Early Transcendentals 6th. Brooks/Cole . 2008. ISBN 0-495-01166-5 .
^ 11.0 11.1 11.2 Mary Barnes. More about Functions and Differentiation. Curriculum Press. 1993. 第40-43頁
^ (英文) The Notation of Differentiation . 1998-08-24 [2011-02-10 ] . (原始內容存檔 於2017-12-05).
^ George Shoobridge Carr. A Synopsis of Elementary Results in Pure and Applied Mathematics . C. F. Hodgson. 1880. 第258頁.
^ M.Fontaine, Mémoires donnés à l'académie royale des sciences, non imprimés dans leur temps ,1764.
^ A. L. Crelle, Rechnungmit veranderlichcn GriJsscn , Vol. I (Gottingen, 1813).
^ Hamilton, Philosophical Transactions of the Royal Society ,(London, 1834), p.249
^ Louis François Antoine Arbogast, Calcul des Derivations , (1800), p.89
^ Benjamin Peirce, Elementary Treatise on Curves, Functions, and Forces (new ed. Boston and Cambridge), Vol I (1852)
^ (法文) A.L.Cauchy, Exercices d'analyse et de physique mathematique , (1844), p.12-17.
^ Banach, S., Uber die Baire'sche Kategorie gewisser Funktionenmengen, Studia. Math., 1931, (3): 174–179.
^ Jon Rogawski. Single Variable Calculus. W. H. Freeman. 11 June 2007. ISBN 978-1-4292-1071-3 .
^ 22.0 22.1 22.2 徐森林; 薛春華. 《数学分析(第二册)》. 清華大學出版社. 2005. ISBN 978-7-302-13141-0 .
^ 鄭建華. 《复变函数》. 清華大學出版社. 2005. ISBN 978-7302096931 . 第17-19頁.
^ Evans, Lawrence C. Partial differential equations . Providence, R.I.: American Mathematical Society. 1998: 242 . ISBN 0-8218-0772-2 .
^ (英文) Jean-Baptiste Hiriart-Urruty, Claude Lemaréchal. Fundamentals of Convex Analysis . Springer. 2001. ISBN 3-540-42205-6 . p.163-166
^ (中文) 薛定宇,陳陽泉. 《高等应用数学问题的MATLAB求解》. 清華大學出版社. 2004. ISBN 978-7302186182 . 第384-385頁.
^
Igor Podlubny. Fractional Differential Equations. An Introduction to Fractional Derivatives, Fractional Differential Equations, Some Methods of Their Solution and Some of Their Applications. , (Mathematics in Science and Engineering, vol. 198). Academic Press. 1998年10月. ISBN 0-12-558840-2 .
^ (法文) R Gâteaux. Sur les fonctionnelles continues et les fonctionnelles analytiques (PDF) . Bulletin de la S.M.F, tome 50 (1922). [2011-02-11 ] . (原始內容存檔 (PDF) 於2013-10-20).
^ Nicolas Bourbaki. Algebra I. Springer-Verlag. 1989. ISBN 3-540-64243-9 .
^ Nathan Jacobson. Lie algebras . Dover Publications. 1979. ISBN 978-0486638324 . p.7-8
^ 翁秉仁. 經濟學應用:邊際與彈性 . EpisteMath,改寫自同作者的《微積分講義》. [2011-02-10 ] . (原始內容存檔 於2020-12-21).
外部連結