1/39ページ
ダウンロード(1.4Mb)
多変数のデータを可視化する
■掲載内容
・主成分分析
・多変量スペクトル分解法
・各回帰式の考え方
・3Dデータの取扱い
・トレーニングセミナーのご案内
◆詳細はカタログをダウンロードしてご覧ください。
関連メディア
このカタログについて
ドキュメント名 | 多変量統計解析とは |
---|---|
ドキュメント種別 | ホワイトペーパー |
ファイルサイズ | 1.4Mb |
登録カテゴリ | |
取り扱い企業 | 株式会社クオリティデザイン (この企業の取り扱いカタログ一覧) |
この企業の関連カタログ
このカタログの内容
Page1
株式会社クオリティデザイン: 多変量統計解析とは
多変量統計解析とは
株式会社クオリティデザイン
〒612‐8374 京都市伏見区治部町105番地 301
TEL: 075‐605‐3270 / FAX: 075‐320‐3678
E‐mail: ask@q‐dsn.co.jp
http://www.q‐dsn.co.jp
1
1
Page2
株式会社クオリティデザイン: 多変量統計解析とは
AGENDA
01 主成分分析
02 多変量スペクトル分解法
03 各回帰式の考え方
04 3Dデータの取扱い
05 トレーニングセミナーのご案内
2
2
Page3
株式会社クオリティデザイン: 多変量統計解析とは
主成分分析
(PCA: Principal Component Analysis)
01
3
3
Page4
株式会社クオリティデザイン: 多変量統計解析とは
多変数のデータを可視化する
データは多くの変数を持つために数値を眺めて直接的に解釈することは極めて困難である
プロット、グラフ等を使って可視化すれば解釈は非常に容易になる
説明変数 成分B(mg)
製品4
成分A 成分B
(mg) (mg)
製品1 0.19 0.12
製品3 製品2
試料
製品2 0.21 0.14
製品3 0.18 0.13 製品1
成分A(mg)
製品4 0.20 0.24
• どの製品が特徴的か? ⇒ 製品4は他よりも離れた位置にある
• どうして特徴的なのか? ⇒ 縦軸の値(成分B)の量が他よりも多い
4
4
Page5
株式会社クオリティデザイン: 多変量統計解析とは
スペクトルのように変数が膨大なデータでは・・・
スペクトル
802 nm
800 801 ‐‐‐‐‐‐ 2500
nm nm nm ???
製品1
製品2
製品3 800 nm 801 nm
製品4
• スペクトルのように説明変数の数が多いデータでは可視化することが困難
⇒情報を失わないように変数の数を少なくすることが必要
5
5
Page6
株式会社クオリティデザイン: 多変量統計解析とは
情報を失わないように変数の数を減らすには?
説明変数を数学的に変換して別の説明変数(主成分)にしてしまう
説明変数 主成分 説明変数
P
試料 X 試料 T
T:スコア 試料間の関係を表す
P:ローディング スコアの値がどのような説明変数に関連しているのかを表す
主成分:変換によって新しく作られた説明変数
6
6
Page7
株式会社クオリティデザイン: 多変量統計解析とは
主成分とは?
互いに似たような情報をもつ変数を「新しい変数」にまとめてしまう
変数x2
新しい変数t
(主成分)
この距離がスコア(類似度)
変数x1
x1の値が増えればx2の値も増える。これらの変数は互いに同じような情報を持つ
⇒2つの軸でなくても1の軸(赤の直線)を引けばサンプル間の関係は十分に表現できる
• 主成分とは同じ情報を持つ説明変数をまとめた「新しい変数」
• このために主成分の数は元の説明変数の数よりもはるかに少ない
• 主成分間には情報の重複がない
7
7
Page8
株式会社クオリティデザイン: 多変量統計解析とは
主成分を使って可視化
説明変数
試料 X ???
主成分 第二主成分t2
第一主成分t1
試料 T
データの情報が縮約され、主成分の数が十分に少なくなれば各試料のスコアの
値を使って可視化が可能になる
8
8
Page9
株式会社クオリティデザイン: 多変量統計解析とは
ローディングの考え方
PC1
[ プロセスA ] [ プロセスB ]
X2(pH) X2(pH)
PC1
θ’ PC2
θ’
θ θ
X1(温度) X1(温度)
PC2
▲第一主成分軸(PC1)に ▲ 第一主成分軸(PC1)に
対して温度が高寄与度 対してpHが高寄与度
第一主成分軸(PC1)
に対するローディング
X1(温度) X2(pH) (寄与重み) X1(温度) X2(pH)
寄与度=ローディング(重み)は角度θより計算される。
9
9
Page10
株式会社クオリティデザイン: 多変量統計解析とは
主成分分析(PCA)用語集
主成分
データの変化を記述する因子 ”latent variables”、”factors”、 ”eigen vectors”
スコア, T
サンプルの写像: 元の変数空間から,主成分によって表現される新しい空間上に
サンプルをプロット
ローディング, P
変数の写像: 主成分に寄与する変数
残差, E
主成分によって表現することが出来ない要素: X = Xstruct + E
分散
残差分散 – Eに残る分散(情報)
因子寄与 – Xstructによって記述された分散
モデル式: X = TPT + E
structure residual
10
10
Page11
株式会社クオリティデザイン: 多変量統計解析とは
多変量スペクトル分解法
(MCR: Multivariate Curve Resolution)
02
11
11
Page12
株式会社クオリティデザイン: 多変量統計解析とは
多変量スペクトル分解法
目的:
重なりあったスペクトルのピークを分離する。
ソフトウェアクロマトグラフ。
どの成分
(化学種)が?
どれだけ?
12
12
Page13
株式会社クオリティデザイン: 多変量統計解析とは
主成分分析 vs多変量スペクトル分解
主成分分析
スコアT
サンプル間の類似度
P
X T ローディングP
変数の化学的寄与
多変量スペクトル分解 濃度プロファイルC
サンプル間の相対濃度
S
X C 純成分スペクトルS
各化学成分の純スペクトル
13
13
Page14
株式会社クオリティデザイン: 多変量統計解析とは
計算手順
X = C St
適当な濃度CかスペクトルSの情報を
与えて、何度も繰り返し計算をすれ
ばC、Sは近似解に収束。
C = X S (St S)-1
S = Xt C (Ct C)-1
C、Sの初期値は主成分分析等から
Alternating Least-Squares 計算できるが、既知のスペクトルや
(ALS) 濃度情報を導入する方がよい。
14
14
Page15
株式会社クオリティデザイン: 多変量統計解析とは
多変量スペクトル分解
化学種
試料の中に含まれる化学成分
濃度プロファイル, C
化学種の量
純成分スペクトル, S
化学種が単一ではかられた時の純スペクトル
残差, E
モデルによって表現することが出来ない要素: X = Xstruct + E
モデル式: X = CST + E
structure residual
15
15
Page16
株式会社クオリティデザイン: 多変量統計解析とは
MCR事例: オレイン酸-エタノール
混合溶液のモニタリング 1/4
赤外スペクトル
エタノール
オレイン酸+エタノール
赤外光
揮発によってエタノールの濃度は減少する,オレイン酸の濃度は増加する
⇒測定中にオレイン酸とエタノールの量がどのように変化するのか?
16
16
Page17
株式会社クオリティデザイン: 多変量統計解析とは
MCR事例: オレイン酸-エタノール
混合溶液のモニタリング 2/4
オレイン酸‐エタノール溶液の時間変化をATR‐IRで測定
時間の経過に伴いエタノールが揮発し、オレイン酸濃度が高くなる
0.5
3340 cm‐1
1 ‐‐‐ 22 seconds
‐‐‐ 319 seconds
0.8 オレイン酸 0 50 100 150 200 250 300
エタノール 1
0.6
0.8
0.4 0.6 2922 cm
‐1
50 100 150 200 250 300
0.2 Time/sec.
0 これらのバンド強度の変化はエタノールとオレイ
3600 3400 3200 3000 2800 2600 ン酸の大まかな量的変化を表している
⇒初期値として適している
Wavenumber/cm‐1
17
17
Intensity
Intensity Intensity
Page18
株式会社クオリティデザイン: 多変量統計解析とは
MCR事例: オレイン酸-エタノール
混合溶液のモニタリング 3/4
3340 cm‐1 2922 cm‐1 3340 cm‐1 2922 cm‐1
データシートの
0.439446 0.503756
2列の値だけを 0.445404 0.515698
取り出す 0.444961 0.524694
X 0.438475 0.539110.42484 0.55565
0.407304 0.58275
0.389819 0.606698
0.375 0.627466
0.355164 0.653967
0.322372 0.690764
0.285562 0.737861
0.236851 0.780861
0.173458 0.841757
0.112871 0.878212
0.086219 0.903949
0.069348 0.915652
0.057299 0.928937
0.049136 0.93209
結晶多形の転移などピークシフトが起こる際の
変局点考察、存在比考察、プロセス終点考察な
どへの応用が可能。
18
18
Page19
株式会社クオリティデザイン: 多変量統計解析とは
MCR事例: オレイン酸-エタノール
混合溶液のモニタリング 4/4
純成分スペクトル 濃度プロファイル
赤はオレイン酸のスペクトルと一致
オレイン酸量の時間変化
青はエタノールのス
ペクトルと一致
エタノール量の時間変化
• この2つのスペクトルはオレイン酸とエタノールの純スペクトルに非常によく一致。
• 濃度プロファイルを見ると、測定開始t直後にエタノールの蒸発が急激に始まり30秒程度
で大部分が蒸発してしまっていることが分かる。
19
19
Page20
株式会社クオリティデザイン: 多変量統計解析とは
MCR事例:シリングの酵素分解 1/2
シリングに酵素を加えて分解
分解では中間体を経て最終生成物に
⇒反応途中でどのような成分が発生しているか?
20
20