Skip to Main Content

      

Ansysブログ

August 22, 2023

聴覚マスキング: サウンドを使用したサウンドの制御

私たちの周りでは無数のノイズが知覚を競っていますしかし幸いにも私たちが聞くことができるすべてのサウンドが、私たちが聞くサウンドということではありません。現代の世界で一般的な機械的、環境的、社会的ノイズの多くは、聴覚マスキングとして知られる現象の中で他のノイズによって隠されています。このようなサウンドの共通部分となるのが、あるサウンドが別のサウンドをブロックするという点で、自然に発生することも(安定した雨の上の雷のように)、または設計によって発生することもあります(歯科医のオフィスでの周囲のノイズのように)。

聴覚マスキングとは

聴覚マスキングとは、1つのサウンドの知覚が別のサウンドの存在によって減少することです。たとえば、医療機関や法律事務所では、高いレベルのプライバシーが必要な場合、サウンドマスキングによってホワイトノイズの覆いを作成して、意図しないリスナーが機密の会話を聞くのを防ぐことができます。電気自動車では、アクティブなサウンドを追加することで、電動モータの高周波音やシャーシからの大きなブーンというノイズを覆うことができます。サウンドマスキングは、エンジニアが望ましくないサウンド(信号)を他のサウンド(マスキング音)の下に隠すことで、より少なく知覚できるようにします。

元の電動モータノイズが聞こえるEV内部ノイズ

電動モータのノイズを覆うICEサウンドを追加したEV内部ノイズ

聴覚マスキングは、ノイズの低減が困難または望ましくないシナリオで特に役立ちます。サウンドを除去するように設計を変更すると、重量が増加したり、システムの動作に影響して、動作が遅くなったり、効率が低下したりすることがあります。サウンドを除去するのではなくマスキングすることで、エンジニアは機能的に理想でありながらノイズの多い設計に妥協する必要がありません。

マスキングのタイプ

サウンドの知覚に影響を与える聴覚マスキングには、同時マスキングと経時マスキングの2種類があります。

同時マスキング

同時マスキング(スペクトルマスキングまたは周波数マスキングとも呼ばれる)は、信号がマスキング音と同時に発生するときに、異なる周波数間で生じます。 

Simultaneous masking

図1.同時マスキング

生理学的な理由から、一部の周波数の知覚は他の周波数の知覚を妨げる可能性があります。簡単な例を見てみましょう。400Hzの純粋なトーンと200~600Hzのピンクノイズが混ざっていると、純粋なトーンは知覚できなくなります。 

純粋な400Hzトーン

200~600Hzのピンクノイズ

トーンとノイズ

 

純粋なトーン: 1つの周波数で構成されるサウンド

ピンクノイズ: オクターブ帯域あたりのエネルギーが等しい周波数を含むサウンド

同時マスキングは蝸牛の基底膜の動的挙動に関連しています。これは、静かな環境で通常検出されるサウンドによって生成された膜振動が、別のサウンド(十分な大きさで、その周波数が最初のサウンドに十分近い場合)で生成された振動によって「覆われた」ときに発生します。 

Signal masked

図2.信号は、周波数の内容が重複していなくても、マスキング音によってマスクすることができます。

図3は、1100~1300Hzの広帯域ノイズが20、40、60、および100dBのSPL(青と赤の曲線)で追加されたしきい値に対して、マスキング音(緑の曲線)がない場合の純粋なトーンの聴覚しきい値を示しています。

たとえば、マスキングノイズなしで3dBのSPLレベルで知覚される純粋な1000Hzトーンは、強度が43dBのSPLで、60dBのSPL広帯域マスキングノイズが存在する場合にのみ知覚されます。マスキング音の音量が大きいほど、マスキング効果が大きくなり、覆われる周波数範囲が大きくなります。低周波数はまた、逆周波数よりも高い周波数をより簡単にマスクする傾向があります。

EMモデリング

図3.マスキング音が存在しない場合(黄色の曲線)、およびマスキング音が存在する場合(グレーとゴールドの曲線)の純粋なトーンの聴覚しきい値

経時マスキング

経時マスキングは、時間分解能とも呼ばれ、連続するサウンドの間で発生します。ここでは、マスキング音のサウンドは、信号サウンドの前にあるか(順向マスキング)、その後に続きます(逆向マスキング)。

順向マスキングとは、信号の前にマスキング音が聞こえる状態のことです。2つのサウンド間の時間差の値が最大200msの場合に発生する可能性があります。順向マスキングは神経活動が持続するため、信号の検出が損なわれる可能性があります。

Forward masking

図4.順向マスキング

逆向マスキングとは、信号の後にマスキング音が聞こえることです。これは、時間差の値が20ms未満の場合にのみ発生します。そのため、逆向マスキングは順向マスキングよりも効率的ではありません。逆向マスキングは、リスナーがマスキング音の開始時に信号を誤って解釈したことが原因で発生する可能性があります。 

Backward masking

図5.逆向マスキング

経時マスキングは、サウンドの知覚に影響を与えます。これは、サウンドが発生すると聴覚システムがすでに他のサウンドを処理している可能性があるからです。これは、実際には同時に起こっていないにもかかわらず、サウンド間の重なりの知覚を引き起こします。 

Neural activity acoustic stimulus

図6.音響刺激の神経活動表現

サウンド知覚メトリックを計算するときは、同時マスキングと経時マスキングの両方が考慮されます。同時マスキングは、静止信号のほとんどの調性指標とラウドネスモデルで考慮されていますが、一方、経時マスキングは、非定常サウンドと衝撃サウンドのラウドネスモデル、および変動強度の計算で考慮されています。

聴覚マスキングの用途

聴覚マスキングは、気を散らすノイズや不快なノイズの存在によってサウンドの知覚が悪影響を受ける可能性があるあらゆる分野で不可欠です。この現象を理解し定量化することは、コミュニケーション、生産性、安全性を向上させるのに役立ちます。

  • プライバシー: 機密性と裁量が要求される空間では、聴覚マスキングは音声の明瞭性を低下させ、意図しないリスナーがプライベートな会話を盗聴できないようにします。
  • 音声強調: 補聴器などの通信システムでは、マスキングは周波数成分を選択的に増幅または抑制することで、音声理解を向上させることができます。
  • 音声圧縮: 保存スペースを節約するために、MP3とATRAC(Adaptive Transform Acoustic Coding)はマスクされたサウンドを省略して、サウンド品質の知覚できない変化でファイルサイズを圧縮します。

Ansys Soundのようなエンジニアリングソフトウェアを使用すると、さまざまな業界やアプリケーションのエンジニアは、知覚されるマスキング効果を考慮しながら、サウンドソースを聞いたり、解析したり、設計したりすることができます。

音量を上げる

直感に反しているように見えますが、実際には以下のようになります。望ましくないノイズを除去するには、ノイズを増やすことが最善の解決策となります。適切な周波数で適切なタイミングで他のサウンドの上にサウンドを戦略的に重ねることで、聴覚マスキングはサウンドの知覚方法を完全に変えることができるため、サウンドの一部は消え、他はよりシャープでバランスの取れたものになります。

聴覚の心理学と生理学の詳細については 「Psychoacoustics: Understanding the Listening Experience」をご覧ください。