半導体エンジニアリングに掲載: 元の記事を見るにはここをクリック
著者:アン・マイクスナー
検査画像や計測データからの爆発的なデータ増加は、半導体メーカーとその装置ベンダーに複雑な要求を生み出している。一方でAI/MLベースのモデルを活用するにはクラウドの大規模なストレージと演算リソースが必要だが、他方で装置レベルでの調整を行うにはエッジの高速な応答時間も必要となる。
これらの要件のバランスを取ることは、膨大かつコストのかかる課題である。上流と下流の両方のデータへのアクセスと、洗練された機械学習モデルが必要となる。 目標は、高品質なデータのみをクラウドに送信することである。クラウドでは、膨大なデータを機械学習アルゴリズムを用いて効率的に処理できる。これにより、高速検査や計測用途に必要な精度と正確性を決断モデルが提供できるようになる。同時に、検査/計測ツールレベル、工場レベル、そして施設横断レベルにおいて、データストレージと計算リソースへの投資拡大も求められる。
機械学習はここ数年、検査と計測技術に浸透しつつあるが、クラウドとエッジデータの統合は新たな進展である。機械学習は、光学検査、電子ビーム検査、X線検査、赤外線検査、音響検査を含む様々な半導体プロセスにおいて、複数の基板の計測と検査に効果的であることが実証されている。
「当社の検査システムは、ウェーハ、レチクル、パッケージ、IC基板、PCB上の欠陥を捕捉・識別します」とKLAの広報担当者は述べた。「これらの検査装置はAIを活用し、周囲のパターンやプロセスノイズから微細な欠陥信号を識別し、進化する検査要件に適応します。統合されたAIにより、検査システムは重大な欠陥に関する詳細な知見を提供し、メーカーが開発を加速し、生産を最適化し、革新的な電子デバイスの市場投入期間を短縮することを支援します」
より多くの測定角度と異なる被写界深度を活用することで、より豊かな文脈に基づく評価が可能となり、検出感度が向上する。
マイクロトロニックのライナー・フェンスケ社長は次のように述べた。「マクロ欠陥向けの自動光学検査(AOI)では、特定の角度でのオンアクシスおよびオフアクシス照明を組み合わせて、幅広い欠陥を捕捉します。コンピューター処理能力の継続的な向上、オーバーレイ精度向上のための精密ハードウェア、機械学習、ソフトウェアアルゴリズムが、その検出能力に多大な影響を与えています。」
機械学習ベースの決定は検査段階で下される一方、クラウドベースの機械学習アルゴリズムがエッジコンピューティングアルゴリズムを導出する。
「半導体検査・計測におけるAIと機械学習の活用は、もはや導入の是非ではなく、いかに活用すべきかという段階にあります」と、ノードソン・テスト&インスペクションの先進技術ソリューション製品エンジニアリング上級ディレクター、チャーリー・チューは述べた。「他社と同様、当社もより多くのデータをクラウドへ移行しています。 確かに、クラウドとエッジコンピューティングの間にはトレードオフが存在します。検査と計測は、特に当社の製品が提供するインライン100%検査において、今後もエッジコンピューティングで実行され続けるでしょう。エッジでの計算処理は依然として高速です。モデルトレーニングにはGPUの計算能力が必要であるため、クラウドでの実施が望ましいでしょう。しかし、一度トレーニングが完了すれば、推論に必要な計算能力はそれほど高くないのです。」
クラウドとエッジにおけるコンピューティングのバランスは、測定と意思決定の目標によって決まる。
「私の経験では、装置ベンダーは常に、装置のレシピなどのトラブルシューティングを支援するため、データをクラウド上で利用可能にすることを望んできました」と、yieldWerxのCEOであるアフターカー・アスラム氏は述べた。「IDM(垂直統合型半導体メーカー)は、クロスファブリケーション相関分析や根本原因分析を実行できるクラウド上でデータを利用可能にする必要性を示唆しています。 推奨されるのはハイブリッドアプローチです。特定の問題(早期技術導入、NPIライフサイクル段階の製品で重複が著しい場合、またはプロセス歩留まりとの相関性など)に関する重要データについては、エッジではなくクラウド上に保持する方が合理的です。」
他の専門家も、ハイブリッドなアーキテクチャアプローチがほとんどのコンピューティングニーズに適していると認めている。そのニーズは、データ量やアプリケーションによって異なる可能性がある。
「万能なアプローチは存在しません」とPDF Solutionsの技術製品管理ディレクター、スティーブ・ザメックは述べた。 「モデルをエッジに展開できる全社的なプラットフォームを備えたハイブリッドアーキテクチャが、あらゆる面で最良の選択肢となる可能性があります。こうした考慮点はAL/MLモデルに限ったことではありません。当社の顧客の多くは、何年も前にルールベースモデルを展開する際にも同様のアプローチを採用していました。しかし、モデルサイズは拡大を続けており、大規模なモデルのトレーニングはスケーラブルで集中化されたインフラ、つまりクラウド環境でしか実現できません」

表1:異なる導入オプションの長所と短所。緑は良好、黄色は許容範囲、赤は不良を示す。出典:PDF Solutions
クラウド上で
困難な画像分析課題において、高度な機械学習アルゴリズムにより欠陥検出能力が大幅に向上します。機械学習モデルの開発には数十万枚もの関連画像が必要であり、この点でクラウドコンピューティングが真価を発揮します。膨大なデータ量を処理するための効率的なGPUベースの計算環境を提供するのです。
検査・計測データと上流・下流工程で収集されたデータを統合し、微細な欠陥を明らかにする傾向も高まっている。これによりクラウドへの処理負荷が増大し、複数のデータソースから情報を収集するデータインフラストラクチャプラットフォームの必要性が浮き彫りとなっている。ここでデータ品質が最も重要となる。
「機械学習ベースの検査は、ライブラリに保存された事前学習済み欠陥モデルに依存して欠陥を認識します。パターンの反復に依存する従来手法とは異なり、機械学習アルゴリズムは多様なトレーニング画像から特徴を分析するため、ダイの一部やウエハー端部の検査に最適です」と、Onto Innovationのプロダクトマーケティングディレクター、ウー・ヨンハン氏は述べた。 「さらに、MLモデルは特定の欠陥タイプを認識するよう訓練されているため、欠陥分類が検査プロセスと同時に実行され、効率性と精度が向上します」
高度な機械学習を構築するために必要な画像をすべて集めることは、コスト意識の高い製造施設にとって膨大な投資となる。このデータインフラの複雑さは、複数のファブからダイを調達するチップレットベースの製品ではさらに増大する。
「現在、顧客がAIを導入する上で最大の障壁は初期費用です」とノードソンの朱氏は述べた。「金銭的なコストではなく、全データを収集する労力を指しています。これらのモデルを訓練するには膨大なデータが必要です。数十万から数百万枚の画像データが必要なモデルもあります。当社はこの課題を汎用モデルを提供することで解決しています。入手可能なデータでモデルを訓練するという重労働を当社が担うのです。 ただし、全てのモデル開発がこの方法で可能とは限りません。用途によって異なります。例えば、PCB基板は部品タイプにおいて類似していることが判明しました。IPC規格に準拠したパッケージタイプ(QFP、QFNなど)の使用数は限られています。当社ではこれらのPCB部品画像データを全て収集し、あらゆるPCB基板のセグメンテーションが可能な汎用モデルを訓練しています。」[1]

図1:AIを用いたAOI PCBセグメンテーション(画像内の特徴の分割・ラベル付け)。出典:ノードソン・テスト・アンド・インスペクション
検査画像データと電気試験データを組み合わせることは、モデル構築における標準的な手法となっている。この追加情報は、影響の少ない欠陥と重大な欠陥を区別するためのモデル入力を提供する。
「画像分類という単純なタスクを考えてみましょう」とPDFのザメックは述べた。「モデル訓練では、欠陥が致命的なものか軽微なものかを判断する『真値』として電気的試験を用いることができます。そのためには、ウェーハ選別、パッケージレベル試験、バーンインなど、様々な工程から電気的試験データを収集する必要があります。 そしてこれらのデータは複数のサイトから収集する必要があり、理想的には使いやすさのためにクラウド上で収集されるべきです。トレーニングには、異なるプロセス技術、検査方法と装置、検査レシピなどを網羅する大量の画像が必要です。これはスケーラブルな計算リソースへのアクセスを必要とし、再びクラウドソリューションへと導きます。」
モデル構築後は、エッジコンピューター上の検査ポイントで適用可能となる。ただし、継続的な改善が求められる。モデルは複数の検査/計測ツール(多くの場合、複数の製造施設から)のデータを基に、時折更新が必要となる。そのデータはクラウドにフィードバックされ、モデルが修正された後、現場のツールに展開される。
より多くのデータを接続する
複数のソースからデータを取得できるため、エンジニアリングチームは高度な機械学習モデルを開発し、上流の設備パラメータと下流の画像データ・電気試験データ間の関係を解明できます。これにより異常を特定し、工場内での根本原因分析を迅速化できます。
「インライン計測・検査(ファブおよびファウンドリ内)における主な課題は、装置上で訓練・展開されるモデルが、その装置で利用可能なデータタイプに限定される点です。これは非常に制約が大きい」とPDFのザメック氏は指摘する。 「当社は、あらゆる拠点の全工程から得られる全データを一元管理できるプラットフォームを提供してきました。そして、計測データをPCM(相変化材料)と関連付けたり、インライン検査を歩留まりと連動させたりするモデルを構築・展開するユースケースが着実に増加しているのを確認しています」

図2:工場横断的なモデル構築のためにクラウドへ供給される典型的な製造データパイプライン。出典:PDF Solutions
端的に言えば、工場内および工場間で複数のソースからのデータを統合することには、実証済みの利点がある。
「基本的に、データ分析手法はAIと機械学習モデルの登場により大きく進化しました」と、Onto Innovationのエンタープライズソフトウェア分野アプリケーション担当ディレクター、Melvin Lee Wei Heng氏は述べた。 「これらのモデルはトレーサビリティを大幅に向上させ、マクロ欠陥の検出と是正措置において極めて重要な要素となった。バックエンドからフロントエンドプロセスまでの情報を連携・接続する能力により、工場では部品がバックエンド工程に到達する前段階から予測モデルを導入できるようになった。この統合により対応時間と意思決定精度が向上し、より効率的かつ効果的な欠陥管理が実現している」
エッジで
モデルはクラウド上で構築され、エッジで適用される。検査・計測システムからクラウドへデータを移動し、そこで判断を下してシステムへ戻すという方法は、単に非現実的である。迅速な是正措置のためには、検査・計測の判断を、可能な限りリアルタイムに近い形で上流工程のデータと連動させる必要がある。
「検査および計測データに基づく迅速な意思決定は常に必要です。ループを素早く閉じて、どの工程ステップが欠陥を引き起こしているかを特定し、手直しが必要かどうかを判断し、現在の仕掛品への影響を評価する必要があります」と、yieldWerxのアスラム氏は述べた。 「クラウドのみに依存することの懸念点は明らかだ——セキュリティ、ネットワーク遅延、そしてアクセス不能の可能性がある。データが利用不能になれば、ロットや設備はアクセスが復旧するまで停止を余儀なくされ、多くの場合、多大なコストを伴うことになる」
試験システムがATEの横にコンピューティングボックスを追加したように、検査・計測機器ベンダーは現在、独立したローカルGPUコンピューティングリソースを提供している。
「高いスループットを維持するため、機械学習ベースの検査には専用のグラフィックス処理装置(GPU)が必要であり、これは従来の検査技術と並行して動作します」とオント社のハン氏は述べた。「この並列処理アプローチにより、機械学習の使用がスループットに悪影響を与えることなく、欠陥検出と分類能力を強化することが保証されます」
GPUは、局所的な意思決定を支援するために不可欠なものとなった。 「当社の製品ポートフォリオにおいて、AIは画像処理やデータ抽出に関連するワークロードをGPUに移行させ、イメージコンピュータの効率性と性能を向上させています」とKLAの広報担当者は述べた。「これらのGPUベースのイメージコンピュータアーキテクチャは『エッジ』コンピューティングシステムであり、リアルタイムデータ処理とAIアルゴリズムの活用を支援します。これにより、インラインモニタリング向けに即時アクセス可能なデータストリームを生成し、半導体メーカーの『結果到達時間』と『歩留まり向上』に貢献します」
結論
検査アプリケーションへのAI/MLの成功した適用には、クラウドとエッジの両方のコンピューティングリソースと蓄積された画像が必要です。モデル構築には、クラウドで少なくとも10万枚の画像を使用し、多くの場合100万枚以上を必要とします。
製造プロセス全体(例:電気試験)において検査データを他の装置データと統合する傾向は、スケーラブルなクラウドコンピューティングリソースにアクセス可能な集中型データレイクを必要とする。これにより生成されるAI/MLモデルは重大な欠陥の検出精度を向上させる。その後、検査システムはモデルをエッジに展開し、近隣のGPUリソースを活用して工場の歩留まり管理システムにフィードバックする。
製造施設における歩留まりと品質改善へのプラスの影響は疑いようがない。「究極的には、計測と検査のための機械学習駆動型分析技術は、測定レベルにおいて常に大きく異なるだろう」と、Onto Innovationの主任プロダクトマネージャー、ショーン・キングは述べた。 「しかし、プロセスの複雑性とデータ量が急増する中、AIと機械学習を用いてパターンを識別し、文脈に沿って結果をより知的に分析する手法が各方法間で共通化しつつある。歩留まりは、欠陥や工程ステップの個別最適化から、相互に絡み合った(必ずしも明確に相関しない)要因の総合的な『歩留まり空間』の観点で捉えられるようになってきている」