プラズマを用いた薄膜作成・ドライエッチング技術は、減圧下で薄膜を作成・加工するために必要不可欠な技術として幅広く利用されている。基板の大型化と加工寸法の微細化に伴い、装置開発に伴う開発コスト及び開発期間の増大は非常に大きな課題となっている。そのため、予測を可能にする手段としてシミュレーションが注目されている(1)。プラズマのシミュレーションモデルは、粒子モデル、流体モデル、ハイブリッドモデルの3つに大きく分類される。産業分野においては、実用的な計算時間内に装置開発の指針となる結果を得ることが大切であるため、プラズマの基本的な特徴、すなわち電子密度や電子温度などが流体モデルから求められるが、考慮するガスの種類や計算セル数が増加すると、流体モデルの計算時間も膨大になる。
サロゲートモデルは代理モデルとも呼ばれ、数値シミュレーション(CAE)の代わりにニューラルネットワークなどの機械学習を活用して現象を計算・予測する手法のことである。事前に計算したさまざまな条件に対する結果(学習データ)を学習させサロゲートモデルを構築すれば、CAE計算の工程を省け、複雑なメッシング・条件設定を一から実行する必要がなくなり、処理時間を短縮できる。
本例題では、COMSOL Multiphysics(以下、COMSOLと略称)を用いて、誘導結合プラズマ(ICP)解析用のサロゲートモデルを構築する。深層学習(DNN、ディープラーニング)手法により予想された電子密度、電子温度、電位およびイオンと化学種の密度分布はCAE計算結果と比較して、サロゲートモデルの有効性を検証する。
図1に誘導結合プラズマ($\mathrm{ICP}$)の解析モデルを示す。 誘導結合プラズマ($\mathrm{ICP}$)は、石英窓の上部にあるコイルによって13.56 MHzで生成される(2) (3)。ガスは$\mathrm{Ar}/\mathrm{N2}$、圧力は$\mathrm{20 mTorr}$である。ガス温度は$\mathrm{300 K}$ と仮定される。学習データとするプラズマシミュレーション結果をCOMSOL Multiphysicsのプラズマモジュールによって取得する。$\mathrm{N_2}$ 比(0.3-0.7)と電力(700-1200 W)のプラズマパラメータを入力データ、電子密度、電子温度、電位、$\mathrm{Ar}^{+}$、$\mathrm{Ar}^{*}$、$\mathrm{N_2}^{+}$の密度分布を出力データとしてトレーニングする。$\mathrm{Ar}^{*}$は準安定状態の$\mathrm{Ar}$と定義される。計算する化学種および化学反応は表1と2に示される(4)-(6)。ここでは、モデルを簡略化にするため、文献(3)に示した$\mathrm{N}^{+}$と$\mathrm{N}$に関して化学種およびそれらからの化学反応を割愛した。
深層学習(DNN)モデルは、入力層、中間層(隠れ層)および出力層で構成される。各層は、多数のノード、つまりニューロンで構成される。図2に5層のニューラルネットワークを示す。
本例題のサロゲートモデルのトレーニングは、COMSOLのパラメトリックスイープを用いたCAE計算からの出力データに基づいている。このパラメトリックスイープを効率的にするには、「実験デザイン」法が使用される。COMSOLの専用のサロゲートモデルトレーニングスタディは過度のCAE計算を必要とせずに入力空間を均一にカバーするデータセットを生成する「実験デザイン」法と呼ばれるラテンハイパーキューブサンプリング(Latin hypercube sampling、LHS)法を採用している。
本書では、解析モデルおよびサロゲートモデルの構築、2章以後に図7の解析結果を作成する手順を示す。
図3はCOMSOLの専用のサロゲートモデルトレーニングスタディの設定画面であり、その中で入力データは$\mathrm{N_2}$ 比と電力とする。学習データの出力の設定画面を図4に示す。$\mathrm{N_2}$ 比と電力の入力データ以外は電子密度、電子温度、電位、$\mathrm{Ar}^{+}$、$\mathrm{Ar}^{*}$、$\mathrm{N_2}^{+}$の密度分布の出力データを追加した。
COMSOLのDNNのサロゲートモデルは図4に示した学習データを出力してDNNモデルに導入することである。図5はDNNモデルの設定画面である。4つの隠れ層にそれぞれ50、40、30、20ノードがある。学習データのトレーニングにおけるサロゲートモデルとCAEモデル間の誤差を最小限に抑える。図5にトレーニングおよび検証のセクションにハイパーパラメーターを示している。最も重要なパラメーターは学習率、バッチサイズおよびエポック数である。学習率は最適化プロセス中のステップサイズを決める。学習率が小さすぎるとモデルが局所最小値に詰まることがある。一方、学習率が大きすぎると最小値をオーバーシュートして収束を低下させる。バッチサイズは最適化プロセス中に学習データがどのようにサブセットに分割される。バッチサイズが小さすぎると勾配更新にノイズが多くなり、トレーニング時間が長くなる。一方、バッチサイズが大きすぎると一般化が不十分になり、計算リソースが非効率的に使用される。エポック数はデータセット全体を通過する完全なパスの数を定義し、重要な役割を果たす。エポックが少なすぎるとモデルが学習データから適切に学習していないため、アンダーフィッティング(学習不足)が発生する。一方、エポックが多すぎるとモデルが学習データ内のノイズを学習し、新しい未知のデータに対するパフォーマンスが低下になり,オーバーフィッティング(過学習)が発生する。本例題の学習におけるトレーニング損失と検証損失の進行状況を図6 に示す。ここにエポック数を10000 とした。
ハイパーパラメーターはトレーニングと検証の両方の損失が最小限に抑えられるバランスを得るために調整される。ここにはトレーニング損失と検証損失によってモデルが十分に学習され、新しいデータにも適切に一般化できることを示す。
図7は流体モデルとサロゲートモデルの比較計算結果である。両者はよく一致したことを示した。入力パワーは1000 W、N2比の初期値は0.5とした。エポック数が少ない場合は、サロゲートモデルによる反応器の中心軸上の電子温度がCAE結果より離れて、学習不足になったと考えられる。本例題ではエポック数を10000以上にする必要であると検証した。
サロゲートモデルによって提供するモデル評価の高速化により、アプリのユーザーはよりインタラクティブなユーザーエクスペリエンスを提供し、社内(学内)でのシミュレーションの使用を容易に広めることができる。COMSOLによるアプリの作成は本書の内容から離れるため、アプリケーションビルダーのマニュアルを参照されたい。
参考文献
- 池田圭,奥村智洋,Vladimir KOLOBOV, 真空 50 (6): 424-428 (2007).
- Sang-Bin Lee, Ji-Hoon Kim, Gwan Kim , Jun-Woo Park , Byung-Kwan Chae , and Hee-Hwan Choe, Appl. Sci. Converg. Technol. 32(5): 122-126 (2023).
- Lizhu Tong, Cent. Eur. J. Phys. 10(4): 888- 897 (2012).
- Dimitris P. Lymberopoulos and Demetre J. Economou, J. Res. Natl. Inst. Stand. Technol. 100(4): 473-494 (1995).
- https://nl.lxcat.net/home/
- Annemie Bogaerts, Spectrochim. Acta, Part B: At. Spectrosc. 64(2): 126-140 (2009).
*該当のCOMSOLモデルファイルをご要望のお客様は以下よりダウンロードいただけます。