曲線擬合 - 分析兩變量之間關(guān)系的方法
實(shí)際工作中,變量間未必都有線性關(guān)系,如服藥后血藥濃度與時(shí)間的關(guān)系;疾病療效與療程長(zhǎng)短的關(guān)系;毒物劑量與致死率的關(guān)系等常呈曲線關(guān)系。曲線擬合(curve fitting)是指選擇適當(dāng)?shù)那€類型來(lái)擬合觀測(cè)數(shù)據(jù),并用擬合的曲線方程分析兩變量間的關(guān)系。
簡(jiǎn)介
用連續(xù)曲線近似地刻畫或比擬平面上離散點(diǎn)組所表示的坐標(biāo)之間的函數(shù)關(guān)系的一種數(shù)據(jù)處理方法。用解析表達(dá)式逼近離散數(shù)據(jù)的一種方法。在科學(xué)實(shí)驗(yàn)或社會(huì)活動(dòng)中,通過(guò)實(shí)驗(yàn)或觀測(cè)得到量x與y的一組數(shù)據(jù)對(duì) - xi,yi - i=1,2,…m,其中各xi是彼此不同的。
人們希望用一類與數(shù)據(jù)的背景材料規(guī)律相適應(yīng)的解析表達(dá)式,y=f - x,c來(lái)反映量x與y之間的依賴關(guān)系,即在一定意義下"最佳"地逼近或擬合已知數(shù)據(jù)。f - x,c常稱作擬合模型,式中c= - c1,c2,…cn是一些待定參數(shù)。當(dāng)c在f中線性出現(xiàn)時(shí),稱為線性模型,否則稱為非線性模型。
有許多衡量擬合優(yōu)度的標(biāo)準(zhǔn),最常用的一種做法是選擇參數(shù)c使得擬合模型與實(shí)際觀測(cè)值在各點(diǎn)的殘差 - 或離差ek=yk-f - xk,c的加權(quán)平方和達(dá)到最小,此時(shí)所求曲線稱作在加權(quán)最小二乘意義下對(duì)數(shù)據(jù)的擬合曲線。有許多求解擬合曲線的成功方法,對(duì)于線性模型一般通 過(guò)建立和求解方程組來(lái)確定參數(shù),從而求得擬合曲線。
至于非線性模型,則要借助求解非線性方程組或用最優(yōu)化方法求得所需參數(shù)才能得到擬合曲線,有時(shí)稱之為非線性最小二乘擬合。曲線擬合:貝塞爾曲線與路徑轉(zhuǎn)化時(shí)的誤差。值越大,誤差越大;值越小,越精確。
常用函數(shù)
指數(shù)函數(shù)
指數(shù)函數(shù) - exponential function的標(biāo)準(zhǔn)式形式為:Y=aebX - 12.29對(duì)式(12.29)兩邊取對(duì)數(shù),得lnY=lna+bX
b>0時(shí),Y隨X增大而增大;b<0時(shí),Y隨X增大而減少。當(dāng)以lnY和X繪制的散點(diǎn)圖呈直線趨勢(shì)時(shí),可考慮采用指數(shù)函數(shù)來(lái)描述Y與X間的非線性關(guān)系,lna和b分別為截距和斜率。
更一般的指數(shù)函數(shù):Y=aebX+k,式中k為一常量,往往未知,應(yīng)用時(shí)可試用不同的值。
對(duì)數(shù)函數(shù)
對(duì)數(shù)函數(shù)(lograrithmic function)的標(biāo)準(zhǔn)式形式為:Y=a+blnX, - X>0,b>0時(shí),Y隨X增大而增大,先快后慢;b<0時(shí),Y隨X增大而減少,先快后慢,見圖12.4 - c、 - d。當(dāng)以Y和lnX繪制的散點(diǎn)圖呈直線趨勢(shì)時(shí),可考慮采用對(duì)數(shù)函數(shù)描述Y與X之間的非線性關(guān)系,式中的b和a分別為斜率和截距。
更一般的對(duì)數(shù)函數(shù):Y=a+bln - X+k,式中k為一常量,往往未知。 - alnY=lna+bX - blnY=lna-bX - cY=a+blnX - dY=a-blnX
冪函數(shù)
冪函數(shù)(power function)的標(biāo)準(zhǔn)式形式為:Y=aXb - a>0,X>0,式中b>0時(shí),Y隨X增大而增大;b<0時(shí),Y隨X增大而減少。對(duì)兩邊取對(duì)數(shù),得lnY=lna+blnX所以,當(dāng)以lnY和lnX繪制的散點(diǎn)圖呈直線趨勢(shì)時(shí),可考慮采用冪函數(shù)來(lái)描述Y和X間的非線性關(guān)系,lna和b分別是截距和斜率。
更一般的冪函數(shù):Y=aXb+k,式中k為一常量,往往未知。
步驟
1、繪制散點(diǎn)圖,選擇合適的曲線類型,一般根據(jù)資料性質(zhì)結(jié)合專業(yè)知識(shí)便可確定資料的曲線類型,不能確定時(shí),可在方格坐標(biāo)紙上繪制散點(diǎn)圖,根據(jù)散點(diǎn)的分布,選擇接近的、合適的曲線類型。
2、進(jìn)行變量變換:Y’=f - Y,X’=g - X,使變換后的兩個(gè)變量呈直線關(guān)系。
3、按最小二乘法原理求線性方程和方差分析
4、將直線化方程轉(zhuǎn)換為關(guān)于原變量X、Y的函數(shù)表達(dá)式
應(yīng)用
重力波參數(shù)氣候特征是確定大氣模式中重力波參數(shù)化方案的重要條件之一,高垂直分辨率探空資料擾動(dòng)場(chǎng)是獲取重力波參數(shù)氣候特征的基礎(chǔ)數(shù)據(jù);目前,獲取擾動(dòng)場(chǎng)的方法較多,但基于不同方法計(jì)算的擾動(dòng)場(chǎng)對(duì)重力波參數(shù)氣候特征影響的研究較少。
基于2014—2017年山西太原氣象臺(tái)高垂直分辨率探空資料,利用2—4階曲線擬合方法獲取下平流層 - 17—24km高度溫度擾動(dòng)場(chǎng)、緯向風(fēng)擾動(dòng)場(chǎng)和經(jīng)向風(fēng)擾動(dòng)場(chǎng),經(jīng)統(tǒng)計(jì)發(fā)現(xiàn)2階與3階曲線擬合方法的擾動(dòng)場(chǎng)相似程度較高;在此選取相似度較高的2階、3階曲線擬合方法的擾動(dòng)場(chǎng)分別計(jì)算大氣重力波參數(shù),并對(duì)大氣重力波參數(shù)間的氣候差異特征進(jìn)行研究。
結(jié)果表明: - 1不同階曲線擬合方法擾動(dòng)場(chǎng)的變化振幅及隨高度變化趨勢(shì)存在差異,且擾動(dòng)場(chǎng)間的相關(guān)較弱; - 22階、3階曲線擬合方法擾動(dòng)場(chǎng)得到的重力波參數(shù)大小、年內(nèi)變化趨勢(shì)及在不同區(qū)間范圍內(nèi)占有率均存在差異,且相關(guān)較弱; - 31—12月,相對(duì)3階曲線擬合方法的擾動(dòng)場(chǎng),基于2階曲線擬合方法的擾動(dòng)場(chǎng)得到的重力波群速、水平波長(zhǎng)、垂直波長(zhǎng)、周期、固有相速均較大,而重力波能量上傳百分比在某些月份較大。
因此,不同階曲線擬合方法擾動(dòng)場(chǎng)間存在差異,會(huì)導(dǎo)致計(jì)算得到的大氣重力波參數(shù)氣候特征存在差異,最終對(duì)研制大氣模式中的大氣重力波參數(shù)化方案產(chǎn)生影響。
