Direct3D12のCommand QueueのDirect(GraphcisとCompute用のQueue)とComputeを描画面にオーバーレイして表示するプログラムがオープンソースになっています.

Overlapped Execution
https://github.com/TheRealMJP/OverlappedExecution

Queueのワークロード,ワークロードタイミング,依存関係などが可視化されます.各グラフのパートの実行時間も出るのがいいですね.

上記サイトで様々なベンダーのGPUの実行例がありますが,非同期Computeならグラフが並列に,そうでない環境ではCompute Queueの実行がDirect Queueとの実行に混ざりながら実行されているのがわかるのが便利そうですね.

Queueの実行の最適化などをプロファイラなどを使用する前にランタイムでチェックするときなど良さそうですね.