計測エンジニアリングシステム株式会社

PRODUCT SMART UQ

データサンプリング

実験計画法(DOE)は通常、システムから新しいデータを収集するために使用されます。一方で十分なデータがすでに収集されている場合もあります。このようなシナリオでは、収集されたデータが長期間にわたって蓄積されており、解析が困難なほど十分なデータがあることがよくあります。
例えば、現場で使用されている部品のセンサーからのヘルスモニタリングデータは、その部品の動作寿命全体にわたって継続的に計測データを取得している場合があります。SmartUQのデータサンプリングツールは、データを分割し、全データセットのサブセットで構成される空間充填型のDOEを模倣することができます。
データ収集前に作成されるDOEとは異なり、サブサンプリングやスライスサンプリングのようなデータサンプリングでは、既存の入出力データペアを使用して、設計空間をよりよく表すポイントを選択することができます。

データサンプリングのワークフロー図

データサンプリングツールのワークフローは、シミュレーションや計測データから収集したデータセットが起点となります。データセットは大規模なものになる傾向があり、データセット全体を使って解析を行うのは計算負荷が高い場合があります。SmartUQのデータサンプリングツールは、データセットを、設計空間をよく表す小さなサブセットに分割することができます。

サブサンプリングアルゴリズム

サブサンプリングのアルゴリズムは、元のデータセットを適切に表現するために、既存の大規模データセットからユーザーが指定した数のポイントをサンプリングします。恣意的にデータセットを2分割するのとは異なり、サブサンプリングツールは空間充填型DOEを模倣するポイントを考慮するため、サブサンプルされたデータセットの潜在的なバイアスを軽減することができます。
初期データのサブセットのみを使用することで、計算負荷が大幅に軽減される一方で、インテリジェントな選択プロセスにより高度な分析を正確に実行する能力が維持されます。
残った大規模なサブサンプルデータは、モデルの検証に使用することができるため、予測精度に自信を持ちつつ、シミュレーションとテストのリソースを節約することができます。

スライスサンプリングのプロセス

既存のデータセットをサブサンプリング(再分割)することで、空間を埋めるDOEを模倣しています。

スライスサンプリングアルゴリズム

サブサンプリングアルゴリズムは、既存の大きなデータセットからユーザーが指定した数のポイントをサンプリングして、元のデータセットを適切に表現します。データセットを任意に2つに分割するのとは異なり、サブサンプリングツールは、スペースを埋めるDOEを模倣するポイントを考慮し、サブサンプリングされたデータセットの潜在的なバイアスを減らします。初期データのサブセットのみを使用することにより、計算負荷が大幅に軽減され、高度な分析を正確に実行する機能がインテリジェントな選択プロセスを通じて維持されます。データのより大きな残りのサブセットを使用してモデルの検証を実行できるため、予測の精度に自信を持ちながら、シミュレーションとテストのリソースを節約できます。

サブサンプリングプロセス

既存のデータセットを4つのスライスに切り分け、それぞれのスライスが空間を埋めるためのDOEを模倣しています。