#### Auto-generated by synthdnn
#### python3 synthdnn.py matmul -s 1000 --skip-impl=ref -b harness_matmul_generated_ci

--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=bac --dt=f32:u8:f16 --attr-fpmath=bf16:true 1x4740x2:1x2x7363
--reset --skip-impl=ref --stag=any --wtag=any --dtag=bac --dt=f8_e4m3:f8_e5m2:f16  2x1x4:2x4x186
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=bac --dt=bf16:u8:f32 --attr-fpmath=bf16:true 4x5x1064:4x1064x2
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=any --dt=f16:u8:f16 --attr-fpmath=f16:true 4x40x2:4x2x67
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=bac --dt=f32:u8:f32 --attr-fpmath=bf16:true 1x4914x3:1x3x2653
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=abc --dt=u8:u8:f16  5x5x1:5x1x135
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=abc --dt=f16:u8:f16 --attr-fpmath=f16:true 2x36x1599:2x1599x2555
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=abc --dt=f8_e5m2:f8_e4m3:f32  6x20x123:6x123x249
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=any --dt=f32:s8:f16 --attr-fpmath=bf16:true 1x107x2983:1x2983x2517
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=any --dt=s8:u8:u8  5x3x4428:5x4428x101
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=abc --dt=f16:f16:u8  7x8x101:7x101x725
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=abc --dt=f32:u8:f16 --attr-fpmath=strict:true 3x2670x95:3x95x335
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=any --dt=f16:u4:u8  2x107x1271:2x1271x3
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=bac --dt=f8_e5m2:f8_e5m2:f16  1x5812x1192:1x1192x7
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=abc --dt=f8_e5m2:f8_e4m3:f32  2x3851x1189:2x1189x157
--reset --skip-impl=ref --stag=any --wtag=any --dtag=bac --dt=s8:u8:f16  1x36x16:1x16x114
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=abc --dt=f32:s8:f16 --attr-fpmath=bf16:true 1x3x1:1x1x86
--reset --skip-impl=ref --stag=any --wtag=any --dtag=bac --dt=f16:f16:u8  5x5777x134:5x134x377
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=abc --dt=f16:u8:f16 --attr-fpmath=f16:true 5x143x5194:5x5194x2
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=abc --dt=f32:s8:f16 --attr-fpmath=strict:true 2x25x745:2x745x7130
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=abc --dt=f16:u4:f32 --attr-fpmath=f16:true 2x2764x182:2x182x27
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=bac --dt=bf16:u8:bf16 --attr-fpmath=bf16:true 4x3x4:4x4x2
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=abc --dt=bf16:bf16:u8  3x2468x2:3x2x49
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=any --dt=s8:u8:f16  2x772x19:2x19x101
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=abc --dt=f8_e4m3:f8_e4m3:f32  4x27x5616:4x5616x11
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=bac --dt=f32:s8:bf16 --attr-fpmath=f16:true 1x522x33:1x33x516
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=abc --dt=f32:s8:bf16 --attr-fpmath=f16:true 3x8x29:3x29x2
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=bac --dt=bf16:bf16:u8  1x55x11:1x11x11
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=bac --dt=f32:u8:f16 --attr-fpmath=tf32:true 2x21x2312:2x2312x1
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=any --dt=bf16:s4:s8  1x329x596:1x596x2092
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=bac --dt=f32:s8:bf16 --attr-fpmath=f16:true 2x559x1142:2x1142x4
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=any --dt=f16:s4:s8  3x22x1:3x1x81
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=bac --dt=f8_e5m2:f8_e5m2:f16  4x3x5:4x5x42
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=bac --dt=f8_e5m2:f8_e4m3:f32  7x2x1517:7x1517x591
--reset --skip-impl=ref --stag=abc --wtag=cab --dtag=bac --dt=f32:u8:bf16 --attr-fpmath=strict:true 2x1485x784:2x784x159
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=abc --dt=bf16:s8:bf16 --attr-fpmath=bf16:true 8x1760x53:8x53x69
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=any --dt=s8:u8:f16  2x1x341:2x341x7137
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=bac --dt=f32:f32:f32 --attr-fpmath=f16 2x77x543:2x543x164
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=abc --dt=s8:u8:s32  3x7457x1:3x1x1779
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=abc --dt=f8_e4m3:f8_e4m3:f8_e5m2  1x17x978:1x978x69
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=bac --dt=f8_e4m3:f8_e5m2:f16  2x10x102:2x102x442
--reset --skip-impl=ref --stag=any --wtag=any --dtag=bac --dt=f32:s8:f16 --attr-fpmath=tf32:true 3x50x3:3x3x152
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=bac --dt=bf16:s8:f32 --attr-fpmath=bf16:true 4x825x5:4x5x14
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=any --dt=f8_e4m3:f8_e4m3:f16  2x92x11:2x11x353
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=abc --dt=u8:u8:u8  2x7246x461:2x461x399
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=abc --dt=f32:s8:f32 --attr-fpmath=f16:true 3x238x611:3x611x22
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=abc --dt=f16:f16:f16  4x229x1:4x1x300
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=abc --dt=bf16:s4:u8  6x177x2351:6x2351x882
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=abc --dt=bf16:u8:f32 --attr-fpmath=bf16:true 1x1054x1879:1x1879x31
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=any --dt=f16:f16:f16  2x128x1:2x1x39
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=abc --dt=s8:u8:s8  7x181x210:7x210x3
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=any --dt=u8:u8:u8  1x10x45:1x45x61
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=any --dt=f16:s4:s8  3x1399x5045:3x5045x5497
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=any --dt=f16:f16:f16  6x3723x3:6x3x86
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=abc --dt=bf16:s4:u8  1x56x35:1x35x81
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=bac --dt=f8_e5m2:f8_e5m2:bf16  2x1754x5:2x5x10
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=bac --dt=f16:u4:f16 --attr-fpmath=f16:true 2x7069x17:2x17x4168
--reset --skip-impl=ref --stag=any --wtag=any --dtag=abc --dt=bf16:bf16:f32  2x6669x1813:2x1813x4
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=bac --dt=f16:u8:u8  5x2411x18:5x18x1
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=bac --dt=bf16:u4:s8  7x2x600:7x600x298
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=any --dt=u8:u8:u8  4x58x2949:4x2949x92
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=abc --dt=s8:u8:f16  2x2x12:2x12x90
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=any --dt=f32:u8:bf16 --attr-fpmath=tf32:true 2x1236x759:2x759x10
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=bac --dt=f8_e4m3:f8_e4m3:f16  3x6772x1:3x1x36
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=bac --dt=f16:s8:u8  2x4x1:2x1x139
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=any --dt=f32:f32:f32 --attr-fpmath=tf32 2x551x1276:2x1276x58
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=abc --dt=bf16:s8:s8  2x161x72:2x72x2
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=abc --dt=bf16:s4:s8  4x270x17:4x17x248
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=abc --dt=u8:u8:s8  8x5402x374:8x374x1974
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=any --dt=f16:u8:f16 --attr-fpmath=f16:true 2x652x18:2x18x184
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=bac --dt=f32:u8:bf16 --attr-fpmath=strict:true 2x1891x2:2x2x3
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=bac --dt=f8_e5m2:f8_e4m3:f8_e5m2  2x12x190:2x190x2
--reset --skip-impl=ref --stag=any --wtag=any --dtag=bac --dt=f8_e4m3:f8_e4m3:bf16  6x3x6792:6x6792x976
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=bac --dt=f16:s8:u8  4x40x28:4x28x3339
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=any --dt=f8_e4m3:f8_e5m2:f16  3x2768x52:3x52x34
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=bac --dt=s8:u8:f32  3x17x1043:3x1043x5782
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=any --dt=bf16:s4:s8  2x4998x8:2x8x4223
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=any --dt=bf16:s4:f32 --attr-fpmath=bf16:true 4x76x17:4x17x5087
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=any --dt=f16:f16:f32  8x284x10:8x10x1099
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=bac --dt=bf16:s4:f32 --attr-fpmath=bf16:true 6x1230x352:6x352x941
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=abc --dt=f16:u4:f16 --attr-fpmath=f16:true 8x3998x139:8x139x1344
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=bac --dt=bf16:s4:bf16 --attr-fpmath=bf16:true 5x611x4:5x4x2963
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=any --dt=bf16:s8:u8  7x2238x9:7x9x43
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=bac --dt=f8_e5m2:f8_e4m3:f8_e4m3  1x260x732:1x732x72
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=any --dt=f16:u8:u8  1x79x20:1x20x309
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=bac --dt=f8_e5m2:f8_e5m2:bf16  2x1x2:2x2x6
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=abc --dt=bf16:s4:f32 --attr-fpmath=bf16:true 4x14x418:4x418x272
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=any --dt=bf16:s4:bf16 --attr-fpmath=bf16:true 6x975x2080:6x2080x1
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=abc --dt=f16:u8:s8  1x107x2:1x2x147
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=bac --dt=f32:u8:bf16 --attr-fpmath=tf32:true 6x2x82:6x82x11
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=bac --dt=f8_e4m3:f8_e4m3:f16  2x16x5775:2x5775x2
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=any --dt=f16:u8:u8  2x5256x6:2x6x290
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=bac --dt=f16:s8:u8  6x7x1527:6x1527x3903
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=any --dt=f32:u8:f32 --attr-fpmath=strict:true 5x216x2430:5x2430x167
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=bac --dt=f16:s8:u8  1x82x216:1x216x756
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=abc --dt=f64:f64:f64  6x582x9:6x9x30
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=bac --dt=bf16:bf16:s8  2x80x10:2x10x5
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=abc --dt=bf16:u8:s8  2x93x125:2x125x4
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=bac --dt=s8:u8:f16  3x25x1:3x1x4524
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=abc --dt=f32:s8:f32 --attr-fpmath=bf16:true 6x10x2:6x2x2
--reset --skip-impl=ref --stag=abc --wtag=cab --dtag=abc --dt=f16:s8:f32 --attr-fpmath=f16:true 1x62x455:1x455x8037
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=any --dt=f8_e5m2:f8_e5m2:f8_e4m3  5x5x108:5x108x40
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=bac --dt=f32:f32:f32 --attr-fpmath=bf16 5x15x2702:5x2702x1984
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=any --dt=u8:u8:bf16  1x50x1601:1x1601x191
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=abc --dt=f16:u4:f16 --attr-fpmath=f16:true 8x10x1137:8x1137x9
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=bac --dt=bf16:u8:s8  6x2x2535:6x2535x6295
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=any --dt=f16:s8:f16 --attr-fpmath=f16:true 2x377x2:2x2x481
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=any --dt=f32:s8:f16 --attr-fpmath=f16:true 6x1004x84:6x84x316
--reset --skip-impl=ref --stag=abc --wtag=cab --dtag=bac --dt=s8:u8:bf16  7x5x4421:7x4421x409
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=abc --dt=f8_e5m2:f8_e5m2:f32  2x244x58:2x58x2
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=any --dt=f32:f32:f32 --attr-fpmath=f16 1x108x15:1x15x3
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=any --dt=f8_e5m2:f8_e4m3:f32  2x152x151:2x151x3
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=bac --dt=f8_e5m2:f8_e5m2:f32  5x273x26:5x26x7
--reset --skip-impl=ref --stag=abc --wtag=cab --dtag=abc --dt=f16:u8:f32 --attr-fpmath=f16:true 4x4455x9:4x9x1029
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=bac --dt=f16:s4:f16 --attr-fpmath=f16:true 5x1734x30:5x30x3
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=any --dt=f32:s8:f32 --attr-fpmath=bf16:true 4x3880x433:4x433x4367
--reset --skip-impl=ref --stag=any --wtag=any --dtag=abc --dt=f32:u8:f16 --attr-fpmath=f16:true 6x151x72:6x72x1856
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=abc --dt=bf16:s8:s8  4x149x4726:4x4726x7
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=any --dt=u8:u8:bf16  2x4155x262:2x262x87
--reset --skip-impl=ref --stag=any --wtag=any --dtag=bac --dt=f32:s8:f32 --attr-fpmath=f16:true 2x3701x2906:2x2906x41
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=bac --dt=u8:u8:s8  6x302x25:6x25x1026
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=abc --dt=f32:f32:f32 --attr-fpmath=f16 5x55x74:5x74x1068
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=any --dt=s8:u8:u8  2x14x3312:2x3312x5
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=abc --dt=f16:s8:s8  2x2x1551:2x1551x1165
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=abc --dt=f32:u8:f16 --attr-fpmath=tf32:true 3x1022x6976:3x6976x8
--reset --skip-impl=ref --stag=any --wtag=any --dtag=any --dt=bf16:u4:u8  1x195x657:1x657x1264
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=any --dt=bf16:u8:f32 --attr-fpmath=bf16:true 7x1x2:7x2x15
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=bac --dt=bf16:u4:s8  7x1x3:7x3x1
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=bac --dt=bf16:s8:s8  5x176x4304:5x4304x2
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=any --dt=f32:s8:bf16 --attr-fpmath=strict:true 3x9x149:3x149x1291
--reset --skip-impl=ref --stag=any --wtag=any --dtag=abc --dt=f8_e5m2:f8_e5m2:f8_e4m3  8x1x17:8x17x1926
--reset --skip-impl=ref --stag=abc --wtag=cab --dtag=any --dt=bf16:u8:bf16 --attr-fpmath=bf16:true 3x3x10:3x10x29
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=abc --dt=bf16:s8:u8  2x9x8:2x8x678
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=any --dt=f32:u8:f16 --attr-fpmath=tf32:true 5x1x463:5x463x11
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=bac --dt=f8_e4m3:f8_e5m2:f8_e4m3  5x545x1661:5x1661x469
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=abc --dt=bf16:s4:u8  1x50x102:1x102x989
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=abc --dt=f8_e4m3:f8_e5m2:f8_e4m3  4x174x20:4x20x338
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=bac --dt=bf16:bf16:f32  2x33x3207:2x3207x1254
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=any --dt=f8_e5m2:f8_e4m3:f8_e4m3  3x11x7:3x7x6
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=any --dt=f8_e5m2:f8_e5m2:f8_e5m2  2x202x11:2x11x2419
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=bac --dt=bf16:bf16:s8  4x6x3147:4x3147x45
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=any --dt=f32:s8:f16 --attr-fpmath=strict:true 2x1031x54:2x54x7
--reset --skip-impl=ref --stag=any --wtag=any --dtag=bac --dt=u8:u8:s32  4x17x17:4x17x4247
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=any --dt=f8_e4m3:f8_e5m2:bf16  5x7159x308:5x308x16
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=bac --dt=f32:u8:f32 --attr-fpmath=bf16:true 3x69x1:3x1x2
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=abc --dt=f32:s8:f16 --attr-fpmath=f16:true 2x6300x2193:2x2193x97
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=any --dt=f32:u8:f16 --attr-fpmath=strict:true 2x38x47:2x47x2
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=bac --dt=f32:s8:f32 --attr-fpmath=f16:true 6x924x5201:6x5201x6
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=any --dt=f8_e4m3:f8_e4m3:f8_e4m3  2x185x7:2x7x5317
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=abc --dt=u8:u8:s32  5x952x752:5x752x16
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=abc --dt=f32:u8:f32 --attr-fpmath=tf32:true 2x105x8:2x8x11
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=abc --dt=f16:u4:u8  1x47x66:1x66x927
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=abc --dt=f32:s8:f32 --attr-fpmath=bf16:true 2x3x327:2x327x9
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=any --dt=s8:u8:s8  5x8x67:5x67x203
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=abc --dt=s8:u8:s8  2x1x69:2x69x4
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=any --dt=s8:u8:f32  6x660x1330:6x1330x80
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=any --dt=f8_e5m2:f8_e5m2:f8_e4m3  1x54x6991:1x6991x109
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=bac --dt=bf16:u4:bf16 --attr-fpmath=bf16:true 2x3x2677:2x2677x110
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=any --dt=f8_e4m3:f8_e5m2:bf16  5x465x5907:5x5907x10
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=any --dt=f16:u4:f32 --attr-fpmath=f16:true 1x3271x13:1x13x3164
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=any --dt=f8_e4m3:f8_e4m3:f16  5x35x572:5x572x1860
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=bac --dt=f32:u8:f32 --attr-fpmath=strict:true 1x223x370:1x370x5
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=bac --dt=f32:s8:f32 --attr-fpmath=bf16:true 2x33x7364:2x7364x11
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=abc --dt=f8_e4m3:f8_e4m3:f16  1x26x54:1x54x791
--reset --skip-impl=ref --stag=any --wtag=any --dtag=abc --dt=f16:s4:f16 --attr-fpmath=f16:true 1x53x420:1x420x85
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=bac --dt=f32:s8:f16 --attr-fpmath=strict:true 8x2262x20:8x20x1908
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=bac --dt=s8:u8:s32  2x1035x2589:2x2589x2
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=bac --dt=f8_e5m2:f8_e5m2:bf16  7x4x10:7x10x4
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=any --dt=f32:u8:f16 --attr-fpmath=bf16:true 3x420x27:3x27x4310
--reset --skip-impl=ref --stag=abc --wtag=cab --dtag=abc --dt=f32:u8:f32 --attr-fpmath=strict:true 2x1x13:2x13x138
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=abc --dt=f8_e4m3:f8_e4m3:bf16  1x7x227:1x227x4396
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=abc --dt=bf16:u8:bf16 --attr-fpmath=bf16:true 2x674x3:2x3x1019
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=abc --dt=f32:f32:f32  8x5x2834:8x2834x44
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=abc --dt=s8:u8:s8  1x16x2:1x2x1
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=abc --dt=f8_e5m2:f8_e4m3:bf16  2x3776x1080:2x1080x26
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=abc --dt=f16:u8:f32 --attr-fpmath=f16:true 5x4800x2561:5x2561x11
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=abc --dt=f8_e4m3:f8_e4m3:bf16  6x2987x585:6x585x1478
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=abc --dt=f8_e4m3:f8_e5m2:bf16  3x7058x143:3x143x30
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=any --dt=bf16:bf16:bf16  3x77x7030:3x7030x2691
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=abc --dt=f16:s8:u8  2x4848x2:2x2x43
--reset --skip-impl=ref --stag=any --wtag=any --dtag=bac --dt=bf16:s4:u8  2x2076x9:2x9x1317
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=abc --dt=f64:f64:f64  1x112x7:1x7x10
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=abc --dt=bf16:u4:u8  4x808x4:4x4x5
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=any --dt=f16:f16:f16  2x2x4:2x4x14
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=bac --dt=f32:u8:f16 --attr-fpmath=tf32:true 1x353x1964:1x1964x576
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=any --dt=bf16:u4:f32 --attr-fpmath=bf16:true 5x23x2119:5x2119x2062
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=abc --dt=f8_e4m3:f8_e5m2:f32  2x599x34:2x34x5
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=any --dt=f8_e5m2:f8_e4m3:bf16  4x5x8:4x8x10
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=any --dt=f32:f32:f32 --attr-fpmath=tf32 2x1156x31:2x31x155
--reset --skip-impl=ref --stag=abc --wtag=cab --dtag=bac --dt=bf16:s8:bf16 --attr-fpmath=bf16:true 2x47x56:2x56x316
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=bac --dt=f32:s8:f16 --attr-fpmath=bf16:true 6x10x2:6x2x11
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=any --dt=bf16:bf16:u8  4x410x78:4x78x3
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=bac --dt=f32:u8:f32 --attr-fpmath=tf32:true 3x1x68:3x68x1436
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=abc --dt=f16:s8:u8  2x69x19:2x19x1491
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=bac --dt=bf16:s8:s8  5x290x3:5x3x165
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=any --dt=s8:u8:s32  2x39x2011:2x2011x2
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=abc --dt=f32:u8:bf16 --attr-fpmath=tf32:true 7x3539x7280:7x7280x261
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=bac --dt=f8_e4m3:f8_e5m2:bf16  1x5367x56:1x56x138
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=bac --dt=f32:f32:f32  1x31x4:1x4x291
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=bac --dt=bf16:bf16:bf16  1x399x42:1x42x1520
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=bac --dt=f16:s8:u8  4x67x120:4x120x15
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=bac --dt=f32:u8:f32 --attr-fpmath=f16:true 3x84x4350:3x4350x234
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=any --dt=f32:s8:bf16 --attr-fpmath=strict:true 2x548x4:2x4x23
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=bac --dt=bf16:s4:f32 --attr-fpmath=bf16:true 7x349x12:7x12x2
--reset --skip-impl=ref --stag=any --wtag=any --dtag=abc --dt=bf16:u4:bf16 --attr-fpmath=bf16:true 3x4x921:3x921x5359
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=bac --dt=f8_e5m2:f8_e4m3:f16  1x527x18:1x18x3938
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=abc --dt=f32:s8:bf16 --attr-fpmath=bf16:true 5x1470x824:5x824x151
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=any --dt=f16:f16:f32  3x1779x72:3x72x506
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=abc --dt=f8_e5m2:f8_e5m2:f32  2x7070x2:2x2x2
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=any --dt=f8_e5m2:f8_e5m2:f16  2x150x369:2x369x644
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=any --dt=f32:u8:f16 --attr-fpmath=tf32:true 2x2x5:2x5x2
--reset --skip-impl=ref --stag=any --wtag=any --dtag=any --dt=f32:u8:f16 --attr-fpmath=tf32:true 6x6909x3:6x3x28
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=abc --dt=bf16:u8:s8  1x934x244:1x244x2
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=abc --dt=f8_e5m2:f8_e5m2:f32  5x2409x5:5x5x44
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=any --dt=f32:u8:f16 --attr-fpmath=f16:true 6x1832x15:6x15x6936
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=any --dt=f16:f16:u8  3x285x620:3x620x1862
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=bac --dt=f16:s8:f16 --attr-fpmath=f16:true 2x9x44:2x44x2
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=any --dt=f8_e4m3:f8_e5m2:f16  2x3484x65:2x65x2
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=any --dt=f32:f32:f32  2x1x20:2x20x12
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=bac --dt=f16:s4:f16 --attr-fpmath=f16:true 2x2x11:2x11x7
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=bac --dt=f32:u8:f32 --attr-fpmath=tf32:true 3x307x2439:3x2439x42
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=bac --dt=f8_e4m3:f8_e5m2:f8_e4m3  2x319x42:2x42x422
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=any --dt=bf16:s8:bf16 --attr-fpmath=bf16:true 1x7x3790:1x3790x1088
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=bac --dt=bf16:s4:bf16 --attr-fpmath=bf16:true 2x2329x5079:2x5079x10
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=bac --dt=u8:u8:bf16  1x49x1:1x1x3
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=any --dt=f8_e4m3:f8_e4m3:f16  3x65x1:3x1x2
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=bac --dt=f32:u8:f16 --attr-fpmath=strict:true 2x280x30:2x30x2934
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=bac --dt=f32:u8:f32 --attr-fpmath=bf16:true 3x11x1:3x1x1087
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=any --dt=f32:s8:f16 --attr-fpmath=strict:true 6x524x31:6x31x219
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=bac --dt=f16:s4:f16 --attr-fpmath=f16:true 2x2210x71:2x71x6879
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=any --dt=f32:s8:bf16 --attr-fpmath=bf16:true 3x17x201:3x201x79
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=abc --dt=s8:u8:u8  4x931x11:4x11x4821
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=abc --dt=bf16:s8:bf16 --attr-fpmath=bf16:true 1x1288x18:1x18x93
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=bac --dt=f32:u8:f32 --attr-fpmath=strict:true 1x27x3451:1x3451x696
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=abc --dt=u8:u8:s8  2x507x3:2x3x267
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=abc --dt=bf16:u4:s8  1x3x2:1x2x6561
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=any --dt=f16:u8:f16 --attr-fpmath=f16:true 1x73x4965:1x4965x21
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=abc --dt=f16:s4:f32 --attr-fpmath=f16:true 2x30x3040:2x3040x4
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=abc --dt=bf16:bf16:bf16  7x3x750:7x750x8
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=bac --dt=bf16:u4:bf16 --attr-fpmath=bf16:true 1x3057x47:1x47x8
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=any --dt=bf16:u8:s8  1x13x1:1x1x75
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=any --dt=f16:u8:f16 --attr-fpmath=f16:true 5x3791x3171:5x3171x44
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=any --dt=f32:u8:f16 --attr-fpmath=f16:true 2x14x38:2x38x42
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=any --dt=f32:s8:f32 --attr-fpmath=f16:true 3x5x16:3x16x1080
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=abc --dt=f16:u8:f16 --attr-fpmath=f16:true 6x2912x1387:6x1387x184
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=abc --dt=f32:f32:f32 --attr-fpmath=f16 1x3x414:1x414x199
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=abc --dt=s8:u8:f32  8x199x22:8x22x13
--reset --skip-impl=ref --stag=any --wtag=any --dtag=bac --dt=f16:s8:f32 --attr-fpmath=f16:true 3x93x2624:3x2624x21
--reset --skip-impl=ref --stag=abc --wtag=cab --dtag=bac --dt=bf16:s4:u8  1x5665x5:1x5x4
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=any --dt=f32:u8:bf16 --attr-fpmath=f16:true 4x4468x18:4x18x2018
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=abc --dt=f16:s4:u8  1x1013x6336:1x6336x6
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=abc --dt=u8:u8:f16  1x1x128:1x128x1428
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=abc --dt=f16:u8:f16 --attr-fpmath=f16:true 6x1948x4738:6x4738x1
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=abc --dt=f32:u8:bf16 --attr-fpmath=f16:true 6x22x5:6x5x29
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=bac --dt=f32:u8:f32 --attr-fpmath=f16:true 3x39x160:3x160x59
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=abc --dt=f32:u8:bf16 --attr-fpmath=bf16:true 5x7x1075:5x1075x12
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=abc --dt=f16:f16:u8  8x3x20:8x20x200
--reset --skip-impl=ref --stag=abc --wtag=cab --dtag=any --dt=bf16:bf16:bf16  2x25x8:2x8x3
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=bac --dt=f8_e4m3:f8_e5m2:bf16  1x1558x388:1x388x1
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=any --dt=bf16:s8:u8  1x5857x7:1x7x6936
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=any --dt=u8:u8:f32  2x16x40:2x40x2
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=abc --dt=f32:s8:f32 --attr-fpmath=tf32:true 4x49x184:4x184x20
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=abc --dt=s8:u8:f32  6x70x137:6x137x2
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=abc --dt=f32:s8:bf16 --attr-fpmath=f16:true 6x3443x297:6x297x69
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=bac --dt=s8:u8:s32  4x34x3:4x3x234
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=any --dt=f8_e4m3:f8_e4m3:f32  2x1146x2:2x2x50
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=any --dt=f16:u8:f32 --attr-fpmath=f16:true 1x702x61:1x61x1
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=any --dt=f16:u8:f16 --attr-fpmath=f16:true 6x5986x346:6x346x118
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=bac --dt=bf16:s4:f32 --attr-fpmath=bf16:true 1x1x56:1x56x139
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=bac --dt=f32:f32:f32 --attr-fpmath=f16 2x39x26:2x26x48
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=abc --dt=f16:s8:f16 --attr-fpmath=f16:true 1x45x8:1x8x39
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=any --dt=f16:s8:s8  2x515x462:2x462x6
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=abc --dt=f8_e4m3:f8_e5m2:f8_e5m2  1x60x5384:1x5384x1932
--reset --skip-impl=ref --stag=any --wtag=any --dtag=abc --dt=bf16:bf16:bf16  3x13x1185:3x1185x1011
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=abc --dt=bf16:u4:f32 --attr-fpmath=bf16:true 8x9x177:8x177x2
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=any --dt=f32:f32:f32 --attr-fpmath=f16 2x7x20:2x20x1691
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=any --dt=f8_e5m2:f8_e5m2:f16  2x3x4489:2x4489x7542
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=bac --dt=bf16:u4:u8  1x68x1:1x1x112
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=any --dt=f8_e5m2:f8_e4m3:f8_e5m2  4x27x4:4x4x627
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=abc --dt=f32:s8:f32 --attr-fpmath=strict:true 2x452x181:2x181x5
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=bac --dt=f8_e5m2:f8_e5m2:f8_e5m2  4x59x47:4x47x166
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=any --dt=f32:f32:f32 --attr-fpmath=f16 2x254x78:2x78x1
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=any --dt=f32:u8:f32 --attr-fpmath=bf16:true 3x23x2960:3x2960x280
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=bac --dt=f32:s8:f16 --attr-fpmath=strict:true 3x17x2679:3x2679x8
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=any --dt=f8_e5m2:f8_e5m2:f8_e4m3  6x92x216:6x216x76
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=abc --dt=bf16:u4:u8  4x6x9:4x9x343
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=abc --dt=s8:u8:s8  2x2x1:2x1x1044
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=bac --dt=bf16:bf16:bf16  2x2x81:2x81x646
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=abc --dt=f32:u8:f32 --attr-fpmath=tf32:true 5x2x381:5x381x3990
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=abc --dt=bf16:s4:f32 --attr-fpmath=bf16:true 5x215x6:5x6x61
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=abc --dt=bf16:bf16:f32  1x5x69:1x69x4128
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=abc --dt=bf16:bf16:u8  1x3090x2134:1x2134x3
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=bac --dt=s8:u8:u8  1x6x7:1x7x13
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=abc --dt=bf16:s4:f32 --attr-fpmath=bf16:true 1x69x6489:1x6489x232
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=bac --dt=s8:u8:f32  2x9x1718:2x1718x531
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=abc --dt=f32:s8:bf16 --attr-fpmath=tf32:true 4x5445x73:4x73x7395
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=bac --dt=f8_e4m3:f8_e5m2:bf16  3x2x6625:3x6625x7
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=abc --dt=s8:u8:s32  1x179x1972:1x1972x4703
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=any --dt=bf16:bf16:s8  1x7x167:1x167x2
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=abc --dt=f32:s8:f32 --attr-fpmath=strict:true 5x20x4:5x4x2178
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=any --dt=u8:u8:s8  2x6x12:2x12x72
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=any --dt=bf16:u4:s8  3x299x4:3x4x47
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=any --dt=bf16:u8:s8  2x8x88:2x88x6633
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=bac --dt=f16:u4:f16 --attr-fpmath=f16:true 1x5x8:1x8x14
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=bac --dt=bf16:u4:bf16 --attr-fpmath=bf16:true 3x26x1:3x1x161
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=abc --dt=f32:f32:f32 --attr-fpmath=tf32 4x2x24:4x24x2
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=abc --dt=f8_e4m3:f8_e4m3:f8_e4m3  3x14x2:3x2x348
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=any --dt=f32:u8:f32 --attr-fpmath=strict:true 7x23x165:7x165x27
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=any --dt=f32:f32:f32  2x457x3888:2x3888x2
--reset --skip-impl=ref --stag=abc --wtag=cab --dtag=any --dt=u8:u8:u8  4x36x38:4x38x5162
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=any --dt=f8_e5m2:f8_e4m3:f8_e5m2  3x155x10:3x10x449
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=any --dt=bf16:u8:u8  1x1926x5306:1x5306x2560
--reset --skip-impl=ref --stag=any --wtag=any --dtag=abc --dt=f32:s8:bf16 --attr-fpmath=strict:true 7x1679x1:7x1x2139
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=any --dt=s8:u8:bf16  2x4479x1706:2x1706x56
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=abc --dt=f32:s8:f32 --attr-fpmath=strict:true 3x180x538:3x538x5665
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=any --dt=f16:f16:f32  5x118x21:5x21x7511
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=any --dt=u8:u8:s8  2x56x3332:2x3332x3854
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=abc --dt=bf16:s8:f32 --attr-fpmath=bf16:true 4x2x6:4x6x4
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=any --dt=f16:s4:u8  2x2x1888:2x1888x922
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=any --dt=f16:s4:s8  3x2608x596:3x596x1433
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=abc --dt=f16:u8:f16 --attr-fpmath=f16:true 2x6958x1:2x1x3
--reset --skip-impl=ref --stag=any --wtag=any --dtag=abc --dt=f32:u8:f16 --attr-fpmath=tf32:true 2x2x17:2x17x14
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=any --dt=f8_e4m3:f8_e4m3:f32  2x295x7:2x7x2172
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=abc --dt=f32:u8:bf16 --attr-fpmath=tf32:true 5x4x2989:5x2989x141
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=abc --dt=bf16:s4:u8  3x235x2:3x2x11
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=abc --dt=s8:u8:s8  4x10x2:4x2x5
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=abc --dt=bf16:u8:bf16 --attr-fpmath=bf16:true 1x3x19:1x19x334
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=abc --dt=f32:u8:bf16 --attr-fpmath=tf32:true 1x850x6:1x6x1591
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=abc --dt=f32:u8:f16 --attr-fpmath=f16:true 3x1037x3366:3x3366x1620
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=abc --dt=bf16:s4:f32 --attr-fpmath=bf16:true 1x266x384:1x384x33
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=abc --dt=bf16:u4:f32 --attr-fpmath=bf16:true 2x23x1871:2x1871x4250
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=any --dt=s8:u8:u8  8x147x67:8x67x215
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=abc --dt=f8_e4m3:f8_e4m3:f16  2x100x215:2x215x10
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=any --dt=bf16:u8:u8  3x1006x89:3x89x2
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=abc --dt=f32:u8:f16 --attr-fpmath=f16:true 5x1x5585:5x5585x93
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=bac --dt=bf16:bf16:u8  3x1149x322:3x322x5057
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=any --dt=bf16:bf16:f32  4x275x521:4x521x196
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=abc --dt=f16:f16:f32  2x3x3:2x3x1886
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=abc --dt=f8_e4m3:f8_e4m3:bf16  4x19x544:4x544x5
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=any --dt=f16:s4:f32 --attr-fpmath=f16:true 1x2931x99:1x99x91
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=abc --dt=f32:u8:f32 --attr-fpmath=strict:true 3x1603x1:3x1x8
--reset --skip-impl=ref --stag=abc --wtag=cab --dtag=abc --dt=f8_e4m3:f8_e5m2:f8_e5m2  2x26x4:2x4x4
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=any --dt=f16:s8:u8  4x560x161:4x161x4
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=any --dt=f32:u8:bf16 --attr-fpmath=strict:true 7x84x4:7x4x43
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=abc --dt=f16:u4:u8  2x3x219:2x219x3
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=bac --dt=f8_e5m2:f8_e5m2:f32  8x1x15:8x15x172
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=any --dt=f16:s8:f16 --attr-fpmath=f16:true 8x531x2:8x2x147
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=abc --dt=f8_e5m2:f8_e5m2:f16  3x1x116:3x116x2149
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=abc --dt=bf16:bf16:bf16  5x40x4719:5x4719x6684
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=bac --dt=f16:f16:f16  4x1430x1472:4x1472x739
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=bac --dt=f8_e4m3:f8_e4m3:f8_e5m2  3x2456x482:3x482x213
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=bac --dt=f8_e5m2:f8_e5m2:f32  2x2x7267:2x7267x4
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=any --dt=f32:f32:f32 --attr-fpmath=bf16 5x53x922:5x922x2
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=bac --dt=bf16:s4:f32 --attr-fpmath=bf16:true 3x9x103:3x103x3082
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=abc --dt=f16:f16:f16  4x237x2112:4x2112x194
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=abc --dt=bf16:bf16:s8  2x4635x17:2x17x89
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=any --dt=f32:s8:bf16 --attr-fpmath=strict:true 4x3x731:4x731x68
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=bac --dt=bf16:u8:f32 --attr-fpmath=bf16:true 3x3203x75:3x75x127
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=abc --dt=bf16:u4:u8  5x3x2005:5x2005x676
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=any --dt=bf16:u8:f32 --attr-fpmath=bf16:true 2x2x184:2x184x480
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=abc --dt=f8_e4m3:f8_e4m3:f16  4x52x668:4x668x3597
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=bac --dt=f32:u8:f16 --attr-fpmath=bf16:true 4x1131x37:4x37x5289
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=bac --dt=s8:u8:u8  7x1x2:7x2x3
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=bac --dt=f32:u8:f16 --attr-fpmath=f16:true 7x1026x2:7x2x89
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=abc --dt=bf16:s4:s8  3x3646x234:3x234x889
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=abc --dt=bf16:s8:s8  3x6x9:3x9x542
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=abc --dt=f16:u8:f32 --attr-fpmath=f16:true 1x10x33:1x33x1142
--reset --skip-impl=ref --stag=any --wtag=any --dtag=bac --dt=bf16:u8:f32 --attr-fpmath=bf16:true 5x161x2:5x2x6734
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=abc --dt=f8_e5m2:f8_e4m3:f32  1x4x5759:1x5759x336
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=bac --dt=f32:s8:bf16 --attr-fpmath=f16:true 5x4x69:5x69x2
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=bac --dt=u8:u8:s32  6x20x35:6x35x292
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=bac --dt=f16:f16:f32  2x1296x194:2x194x495
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=abc --dt=f32:s8:bf16 --attr-fpmath=bf16:true 2x2590x166:2x166x91
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=any --dt=f32:u8:bf16 --attr-fpmath=tf32:true 4x493x2595:4x2595x29
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=bac --dt=bf16:u8:s8  3x2234x88:3x88x39
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=bac --dt=u8:u8:f16  4x50x119:4x119x2575
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=bac --dt=f32:u8:f32 --attr-fpmath=strict:true 2x25x3355:2x3355x67
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=abc --dt=f32:s8:bf16 --attr-fpmath=tf32:true 2x843x28:2x28x25
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=abc --dt=f32:u8:f16 --attr-fpmath=tf32:true 5x693x7835:5x7835x3899
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=abc --dt=f32:u8:f32 --attr-fpmath=bf16:true 1x559x12:1x12x41
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=abc --dt=s8:u8:f32  6x4432x9:6x9x29
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=abc --dt=f8_e5m2:f8_e5m2:f16  2x963x467:2x467x43
--reset --skip-impl=ref --stag=any --wtag=any --dtag=abc --dt=f32:s8:f32 --attr-fpmath=bf16:true 7x88x348:7x348x5
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=bac --dt=f16:u8:s8  5x147x80:5x80x1
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=abc --dt=f16:s4:u8  3x2x3255:3x3255x2
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=any --dt=f32:s8:bf16 --attr-fpmath=f16:true 3x7488x11:3x11x159
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=abc --dt=bf16:u8:f32 --attr-fpmath=bf16:true 5x238x2:5x2x16
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=abc --dt=f8_e5m2:f8_e5m2:f8_e4m3  6x3x69:6x69x3923
--reset --skip-impl=ref --stag=any --wtag=any --dtag=abc --dt=f32:f32:f32 --attr-fpmath=bf16 2x5911x18:2x18x12
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=any --dt=f16:s8:f32 --attr-fpmath=f16:true 2x3434x56:2x56x5545
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=bac --dt=f16:u8:f16 --attr-fpmath=f16:true 1x3x24:1x24x6
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=any --dt=f16:s4:s8  5x154x6433:5x6433x3
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=any --dt=f32:u8:f32 --attr-fpmath=f16:true 3x1028x2242:3x2242x137
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=abc --dt=f32:u8:f16 --attr-fpmath=bf16:true 6x9x4935:6x4935x21
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=bac --dt=bf16:bf16:u8  3x3467x13:3x13x4
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=bac --dt=f8_e4m3:f8_e4m3:bf16  2x18x2:2x2x23
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=bac --dt=bf16:u8:u8  2x3x1:2x1x2117
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=abc --dt=f8_e5m2:f8_e5m2:f8_e5m2  2x497x2:2x2x429
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=bac --dt=f8_e4m3:f8_e5m2:f16  5x365x36:5x36x203
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=any --dt=f8_e4m3:f8_e5m2:bf16  1x325x1387:1x1387x5
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=any --dt=f32:u8:f32 --attr-fpmath=bf16:true 1x49x693:1x693x22
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=any --dt=f16:u4:u8  2x7414x9:2x9x2
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=abc --dt=f8_e4m3:f8_e4m3:f32  6x2162x3:6x3x2690
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=any --dt=f32:f32:f32 --attr-fpmath=f16 3x72x5146:3x5146x509
--reset --skip-impl=ref --stag=any --wtag=any --dtag=bac --dt=bf16:s4:f32 --attr-fpmath=bf16:true 4x7x2797:4x2797x15
--reset --skip-impl=ref --stag=any --wtag=any --dtag=bac --dt=f16:u8:f16 --attr-fpmath=f16:true 2x33x337:2x337x50
--reset --skip-impl=ref --stag=abc --wtag=cab --dtag=any --dt=f8_e5m2:f8_e4m3:f32  1x2x707:1x707x2290
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=abc --dt=f32:u8:bf16 --attr-fpmath=bf16:true 2x9x159:2x159x69
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=any --dt=bf16:s8:f32 --attr-fpmath=bf16:true 3x7x144:3x144x55
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=any --dt=f8_e4m3:f8_e4m3:f8_e5m2  1x335x1977:1x1977x4322
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=bac --dt=f16:f16:u8  2x6056x1314:2x1314x6
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=abc --dt=s8:u8:f16  6x3x32:6x32x36
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=bac --dt=f32:s8:f32 --attr-fpmath=strict:true 7x4x3458:7x3458x773
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=bac --dt=f8_e4m3:f8_e5m2:f8_e5m2  4x3x11:4x11x258
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=abc --dt=f8_e4m3:f8_e4m3:f8_e5m2  1x336x5647:1x5647x203
--reset --skip-impl=ref --stag=abc --wtag=cab --dtag=bac --dt=bf16:u8:s8  2x1x1617:2x1617x9
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=bac --dt=bf16:u8:bf16 --attr-fpmath=bf16:true 3x6277x15:3x15x32
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=abc --dt=f16:f16:f16  2x5305x5:2x5x160
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=abc --dt=u8:u8:bf16  2x102x129:2x129x117
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=bac --dt=bf16:bf16:s8  1x47x240:1x240x490
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=abc --dt=f32:s8:f32 --attr-fpmath=tf32:true 6x295x3015:6x3015x1773
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=abc --dt=f16:s4:f32 --attr-fpmath=f16:true 2x15x129:2x129x3501
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=bac --dt=f32:s8:f32 --attr-fpmath=bf16:true 1x974x9:1x9x4
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=abc --dt=f32:f32:f32 --attr-fpmath=bf16 6x1x17:6x17x2245
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=any --dt=f64:f64:f64  1x1x417:1x417x8
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=abc --dt=f32:s8:f16 --attr-fpmath=strict:true 7x15x15:7x15x424
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=bac --dt=s8:u8:f16  5x68x142:5x142x553
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=any --dt=f16:f16:f16  6x6x62:6x62x22
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=any --dt=f8_e5m2:f8_e5m2:f8_e4m3  3x14x14:3x14x2434
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=bac --dt=f8_e4m3:f8_e4m3:f32  3x1319x10:3x10x41
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=any --dt=bf16:u8:s8  4x373x20:4x20x10
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=bac --dt=f32:s8:f16 --attr-fpmath=f16:true 1x62x4022:1x4022x19
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=any --dt=f8_e4m3:f8_e4m3:f8_e4m3  3x1825x403:3x403x145
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=any --dt=f32:s8:bf16 --attr-fpmath=f16:true 3x154x3302:3x3302x5
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=abc --dt=f16:u4:s8  5x579x141:5x141x1788
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=abc --dt=f32:s8:f32 --attr-fpmath=bf16:true 7x6x11:7x11x2
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=any --dt=f16:u8:u8  4x44x569:4x569x752
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=abc --dt=u8:u8:f16  1x1700x1:1x1x455
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=any --dt=f8_e4m3:f8_e5m2:bf16  4x13x2028:4x2028x116
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=bac --dt=f8_e4m3:f8_e5m2:f32  2x2975x375:2x375x26
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=any --dt=f8_e5m2:f8_e5m2:f16  2x395x28:2x28x1818
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=abc --dt=bf16:bf16:u8  2x15x3:2x3x7953
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=any --dt=f16:s8:s8  3x129x344:3x344x4538
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=abc --dt=u8:u8:u8  3x1349x6:3x6x6
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=abc --dt=s8:u8:u8  3x221x128:3x128x717
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=any --dt=f8_e4m3:f8_e5m2:f8_e5m2  1x2774x81:1x81x153
--reset --skip-impl=ref --stag=abc --wtag=cab --dtag=abc --dt=f8_e5m2:f8_e4m3:bf16  1x6x100:1x100x2624
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=bac --dt=s8:u8:u8  4x2x2:4x2x7
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=abc --dt=f8_e4m3:f8_e5m2:f8_e5m2  2x918x31:2x31x3
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=bac --dt=f32:s8:bf16 --attr-fpmath=bf16:true 8x1744x292:8x292x63
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=bac --dt=bf16:s8:s8  6x98x3:6x3x16
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=bac --dt=f32:u8:f32 --attr-fpmath=bf16:true 3x9x908:3x908x2262
--reset --skip-impl=ref --stag=abc --wtag=cab --dtag=any --dt=bf16:u8:f32 --attr-fpmath=bf16:true 5x2363x1:5x1x35
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=abc --dt=s8:u8:u8  5x3328x1:5x1x889
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=abc --dt=f16:u8:u8  4x2x100:4x100x6
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=bac --dt=s8:u8:u8  1x2x2:1x2x320
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=bac --dt=f16:s4:f32 --attr-fpmath=f16:true 2x2914x5:2x5x23
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=abc --dt=f32:u8:f32 --attr-fpmath=tf32:true 2x34x1328:2x1328x17
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=abc --dt=f32:f32:f32 --attr-fpmath=bf16 4x1x49:4x49x22
--reset --skip-impl=ref --stag=abc --wtag=cab --dtag=abc --dt=f16:s8:u8  5x4x6257:5x6257x6555
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=abc --dt=f16:s8:f16 --attr-fpmath=f16:true 2x286x17:2x17x213
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=abc --dt=f8_e4m3:f8_e4m3:f8_e4m3  4x1x86:4x86x2666
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=any --dt=f16:u8:f32 --attr-fpmath=f16:true 3x244x9:3x9x7834
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=bac --dt=bf16:u8:bf16 --attr-fpmath=bf16:true 3x2536x1:3x1x16
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=any --dt=f32:u8:f32 --attr-fpmath=tf32:true 1x9x30:1x30x21
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=bac --dt=f64:f64:f64  1x86x425:1x425x1462
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=any --dt=f8_e4m3:f8_e4m3:f32  1x171x1786:1x1786x1
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=bac --dt=f8_e5m2:f8_e5m2:bf16  3x40x4:3x4x1
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=abc --dt=s8:u8:u8  4x67x1290:4x1290x528
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=any --dt=f8_e5m2:f8_e5m2:f16  6x145x2:6x2x257
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=abc --dt=bf16:u8:s8  4x316x2354:4x2354x5
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=any --dt=f32:u8:f16 --attr-fpmath=f16:true 4x7660x5054:4x5054x2956
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=bac --dt=f32:s8:bf16 --attr-fpmath=f16:true 3x9x126:3x126x6097
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=any --dt=f8_e4m3:f8_e4m3:f16  2x27x520:2x520x2064
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=any --dt=f16:f16:f32  1x29x104:1x104x41
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=any --dt=bf16:s4:u8  2x91x7381:2x7381x4
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=bac --dt=f16:s4:u8  2x11x595:2x595x40
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=any --dt=f16:f16:f16  2x2x6177:2x6177x51
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=abc --dt=f8_e5m2:f8_e5m2:f8_e5m2  4x440x5:4x5x826
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=abc --dt=f32:s8:f16 --attr-fpmath=bf16:true 2x28x38:2x38x2
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=any --dt=f8_e5m2:f8_e5m2:bf16  2x2x80:2x80x11
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=bac --dt=f32:s8:f16 --attr-fpmath=f16:true 2x261x2249:2x2249x9
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=bac --dt=bf16:bf16:bf16  6x4x1:6x1x19
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=any --dt=f32:f32:f32 --attr-fpmath=tf32 3x304x115:3x115x4833
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=abc --dt=f16:u8:u8  4x4525x1160:4x1160x1
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=any --dt=bf16:u4:f32 --attr-fpmath=bf16:true 2x1113x509:2x509x6
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=abc --dt=s8:u8:bf16  3x8x12:3x12x290
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=any --dt=f8_e4m3:f8_e5m2:f32  2x14x40:2x40x4
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=bac --dt=f8_e5m2:f8_e4m3:f16  1x4x153:1x153x2735
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=bac --dt=bf16:s4:bf16 --attr-fpmath=bf16:true 6x16x2:6x2x513
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=any --dt=f32:s8:f16 --attr-fpmath=f16:true 1x8x177:1x177x298
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=any --dt=f16:f16:u8  1x5199x1:1x1x3
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=bac --dt=f16:u4:f16 --attr-fpmath=f16:true 2x2x2668:2x2668x7052
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=abc --dt=f16:s8:u8  6x4x1:6x1x7
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=bac --dt=bf16:u4:s8  2x46x1090:2x1090x395
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=bac --dt=bf16:u4:s8  1x3915x303:1x303x4882
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=bac --dt=f32:u8:bf16 --attr-fpmath=tf32:true 5x157x19:5x19x3949
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=abc --dt=bf16:s8:bf16 --attr-fpmath=bf16:true 5x210x76:5x76x1023
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=bac --dt=f8_e4m3:f8_e5m2:f8_e5m2  1x25x265:1x265x58
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=any --dt=f16:u8:f32 --attr-fpmath=f16:true 2x13x41:2x41x2425
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=bac --dt=f16:u8:f32 --attr-fpmath=f16:true 2x340x4:2x4x161
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=abc --dt=bf16:s8:s8  2x3x297:2x297x4
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=abc --dt=f32:u8:bf16 --attr-fpmath=strict:true 8x21x382:8x382x118
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=any --dt=s8:u8:f32  2x200x2:2x2x2
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=bac --dt=bf16:bf16:u8  5x25x1055:5x1055x138
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=any --dt=f8_e4m3:f8_e5m2:f8_e5m2  2x212x1413:2x1413x65
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=abc --dt=f16:u8:u8  4x9x5346:4x5346x660
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=abc --dt=u8:u8:s8  3x7x2:3x2x11
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=any --dt=u8:u8:f16  5x3x162:5x162x132
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=abc --dt=f16:f16:s8  1x13x4033:1x4033x69
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=bac --dt=f16:s8:f32 --attr-fpmath=f16:true 3x5x5:3x5x6
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=bac --dt=bf16:u8:s8  3x18x2088:3x2088x4
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=bac --dt=u8:u8:s32  3x2x3:3x3x2
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=abc --dt=f16:s8:u8  3x2x1501:3x1501x1099
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=any --dt=f32:f32:f32 --attr-fpmath=f16 1x3x998:1x998x482
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=any --dt=bf16:s4:f32 --attr-fpmath=bf16:true 1x441x1824:1x1824x82
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=abc --dt=f8_e4m3:f8_e4m3:f16  5x2x2290:5x2290x16
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=abc --dt=f8_e4m3:f8_e4m3:f8_e5m2  2x4x359:2x359x201
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=any --dt=f32:s8:f16 --attr-fpmath=bf16:true 2x8x2:2x2x3430
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=any --dt=f32:u8:f32 --attr-fpmath=f16:true 6x5128x1340:6x1340x1
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=any --dt=f16:f16:f32  3x1x4908:3x4908x120
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=abc --dt=bf16:u8:bf16 --attr-fpmath=bf16:true 3x3x2:3x2x20
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=any --dt=bf16:u8:f32 --attr-fpmath=bf16:true 1x2x260:1x260x16
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=bac --dt=f8_e5m2:f8_e5m2:f8_e4m3  1x303x1632:1x1632x71
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=any --dt=s8:u8:f16  1x495x3514:1x3514x1058
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=abc --dt=f32:u8:f32 --attr-fpmath=bf16:true 1x11x171:1x171x1090
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=any --dt=bf16:s4:bf16 --attr-fpmath=bf16:true 4x1117x5:4x5x31
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=bac --dt=f16:f16:f16  2x172x2344:2x2344x4602
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=any --dt=f8_e5m2:f8_e4m3:f8_e4m3  4x28x170:4x170x70
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=any --dt=bf16:bf16:bf16  1x214x6578:1x6578x17
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=abc --dt=f16:s8:u8  3x1381x11:3x11x4408
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=abc --dt=bf16:u4:bf16 --attr-fpmath=bf16:true 8x599x1388:8x1388x1
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=any --dt=f32:s8:f32 --attr-fpmath=tf32:true 2x3x55:2x55x131
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=any --dt=f16:s4:f16 --attr-fpmath=f16:true 3x2785x46:3x46x235
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=abc --dt=bf16:s8:s8  4x45x8018:4x8018x102
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=bac --dt=f8_e4m3:f8_e5m2:f32  4x3x5318:4x5318x4
--reset --skip-impl=ref --stag=any --wtag=any --dtag=abc --dt=f8_e5m2:f8_e4m3:f8_e4m3  1x88x903:1x903x23
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=bac --dt=s8:u8:s32  1x643x82:1x82x3744
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=any --dt=bf16:bf16:bf16  7x5211x1103:7x1103x27
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=bac --dt=f32:f32:f32 --attr-fpmath=bf16 6x6023x9:6x9x196
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=bac --dt=bf16:s8:bf16 --attr-fpmath=bf16:true 1x5522x88:1x88x70
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=abc --dt=bf16:u4:s8  6x2x53:6x53x2
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=abc --dt=u8:u8:s32  6x15x464:6x464x15
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=any --dt=f32:s8:f16 --attr-fpmath=bf16:true 2x74x9:2x9x21
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=any --dt=bf16:u8:bf16 --attr-fpmath=bf16:true 7x40x8:7x8x19
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=any --dt=f32:f32:f32 --attr-fpmath=tf32 1x3x218:1x218x1
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=bac --dt=f8_e4m3:f8_e4m3:f8_e4m3  3x2x4239:3x4239x17
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=any --dt=bf16:bf16:s8  6x3799x3:6x3x5
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=abc --dt=f8_e4m3:f8_e5m2:f8_e4m3  6x2274x5647:6x5647x256
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=any --dt=f32:u8:f32 --attr-fpmath=strict:true 2x1x11:2x11x2
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=bac --dt=f64:f64:f64  2x6x1832:2x1832x5
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=any --dt=f8_e5m2:f8_e5m2:f32  2x5746x114:2x114x528
--reset --skip-impl=ref --stag=any --wtag=any --dtag=abc --dt=f16:s4:u8  1x93x2352:1x2352x13
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=bac --dt=bf16:u8:f32 --attr-fpmath=bf16:true 4x308x128:4x128x261
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=bac --dt=bf16:s8:s8  7x3689x2800:7x2800x2
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=abc --dt=u8:u8:f32  5x4x5:5x5x46
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=any --dt=f8_e4m3:f8_e5m2:bf16  1x671x11:1x11x31
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=abc --dt=bf16:bf16:s8  3x553x2:3x2x48
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=any --dt=f32:u8:f16 --attr-fpmath=tf32:true 1x290x33:1x33x2863
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=abc --dt=f16:f16:f16  5x235x3:5x3x51
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=any --dt=s8:u8:s32  1x1241x764:1x764x4
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=bac --dt=f32:f32:f32  2x2x282:2x282x1
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=abc --dt=s8:u8:bf16  5x293x2:5x2x116
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=abc --dt=f16:u4:f32 --attr-fpmath=f16:true 1x1x1:1x1x1189
--reset --skip-impl=ref --stag=abc --wtag=cab --dtag=bac --dt=f8_e4m3:f8_e4m3:f16  1x4x999:1x999x4
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=abc --dt=bf16:s4:f32 --attr-fpmath=bf16:true 1x1831x1:1x1x269
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=abc --dt=bf16:s4:s8  3x826x1:3x1x862
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=abc --dt=f32:s8:f16 --attr-fpmath=tf32:true 3x2x3842:3x3842x743
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=abc --dt=bf16:bf16:f32  3x9x3:3x3x117
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=abc --dt=bf16:s8:u8  1x165x2:1x2x37
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=any --dt=bf16:bf16:bf16  2x2x1807:2x1807x1
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=abc --dt=u8:u8:bf16  3x10x5:3x5x1444
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=bac --dt=f32:u8:bf16 --attr-fpmath=f16:true 2x1439x418:2x418x16
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=bac --dt=u8:u8:f16  2x4x8:2x8x39
--reset --skip-impl=ref --stag=abc --wtag=cab --dtag=abc --dt=f16:s4:u8  3x75x1594:3x1594x857
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=abc --dt=f32:u8:bf16 --attr-fpmath=tf32:true 8x83x8:8x8x224
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=any --dt=f32:u8:bf16 --attr-fpmath=tf32:true 2x7593x3:2x3x27
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=bac --dt=s8:u8:s32  2x3498x4277:2x4277x307
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=abc --dt=bf16:u8:bf16 --attr-fpmath=bf16:true 5x1778x1205:5x1205x7
--reset --skip-impl=ref --stag=any --wtag=any --dtag=abc --dt=f8_e5m2:f8_e4m3:f16  5x52x21:5x21x11
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=abc --dt=f16:u8:f16 --attr-fpmath=f16:true 2x138x13:2x13x1
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=abc --dt=f32:u8:f32 --attr-fpmath=bf16:true 7x25x403:7x403x29
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=abc --dt=f32:s8:f16 --attr-fpmath=f16:true 3x4964x13:3x13x70
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=bac --dt=bf16:s8:u8  1x2x12:1x12x4
--reset --skip-impl=ref --stag=abc --wtag=cab --dtag=any --dt=f32:f32:f32 --attr-fpmath=bf16 4x56x338:4x338x14
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=abc --dt=f16:u4:u8  3x4x586:3x586x6
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=any --dt=f8_e4m3:f8_e4m3:f8_e5m2  4x1x11:4x11x258
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=abc --dt=f16:s8:s8  8x26x435:8x435x96
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=any --dt=bf16:u8:s8  4x1x6579:4x6579x8
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=any --dt=u8:u8:f32  1x2x9:1x9x16
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=any --dt=s8:u8:u8  1x6487x85:1x85x5360
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=any --dt=f8_e4m3:f8_e5m2:f16  4x1623x4364:4x4364x691
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=bac --dt=f32:u8:f32 --attr-fpmath=bf16:true 2x20x5593:2x5593x16
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=bac --dt=bf16:u8:s8  2x5x21:2x21x206
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=abc --dt=f32:s8:f16 --attr-fpmath=tf32:true 1x53x12:1x12x82
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=bac --dt=f32:s8:f16 --attr-fpmath=f16:true 2x18x4018:2x4018x2
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=abc --dt=f8_e4m3:f8_e5m2:f8_e5m2  1x81x37:1x37x62
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=abc --dt=bf16:u4:u8  3x2x2287:3x2287x2
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=any --dt=f16:u4:u8  1x2x13:1x13x2170
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=abc --dt=f32:u8:f32 --attr-fpmath=f16:true 5x5882x3254:5x3254x4
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=any --dt=bf16:u4:f32 --attr-fpmath=bf16:true 3x57x7:3x7x4
--reset --skip-impl=ref --stag=abc --wtag=cab --dtag=bac --dt=u8:u8:f32  2x7362x1:2x1x643
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=abc --dt=f32:u8:f16 --attr-fpmath=bf16:true 4x932x2:4x2x643
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=abc --dt=f64:f64:f64  2x149x10:2x10x3
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=any --dt=f32:s8:f32 --attr-fpmath=f16:true 4x27x1780:4x1780x1
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=bac --dt=u8:u8:f32  2x2694x4566:2x4566x8
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=bac --dt=f8_e4m3:f8_e5m2:f8_e5m2  1x1x342:1x342x30
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=bac --dt=f8_e5m2:f8_e5m2:f8_e4m3  2x1974x171:2x171x1
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=bac --dt=bf16:u8:bf16 --attr-fpmath=bf16:true 1x6682x3:1x3x11
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=bac --dt=f16:u8:f32 --attr-fpmath=f16:true 1x111x224:1x224x25
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=any --dt=f32:s8:f16 --attr-fpmath=tf32:true 7x2x6746:7x6746x347
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=any --dt=f16:f16:f32  7x37x766:7x766x491
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=bac --dt=bf16:u8:s8  5x1148x193:5x193x1268
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=bac --dt=f16:s8:u8  1x6838x3:1x3x2
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=any --dt=f8_e4m3:f8_e5m2:f32  5x331x223:5x223x3169
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=bac --dt=f32:f32:f32 --attr-fpmath=tf32 1x2x918:1x918x12
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=abc --dt=f32:u8:f16 --attr-fpmath=f16:true 2x230x855:2x855x2138
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=bac --dt=bf16:u8:bf16 --attr-fpmath=bf16:true 7x1920x4080:7x4080x1
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=any --dt=f32:u8:f16 --attr-fpmath=bf16:true 3x1735x7:3x7x1405
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=bac --dt=bf16:bf16:bf16  7x3648x57:7x57x8015
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=bac --dt=f16:u4:f32 --attr-fpmath=f16:true 1x1x2:1x2x38
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=abc --dt=f32:u8:bf16 --attr-fpmath=bf16:true 2x68x1035:2x1035x2805
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=bac --dt=u8:u8:f16  5x40x35:5x35x9
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=any --dt=f8_e4m3:f8_e5m2:bf16  7x62x1:7x1x293
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=any --dt=f32:u8:bf16 --attr-fpmath=bf16:true 2x318x889:2x889x2315
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=any --dt=f16:u8:s8  5x55x252:5x252x109
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=any --dt=f32:s8:bf16 --attr-fpmath=strict:true 2x57x366:2x366x22
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=any --dt=u8:u8:u8  8x12x13:8x13x9
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=abc --dt=f32:s8:bf16 --attr-fpmath=strict:true 2x1x208:2x208x437
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=any --dt=bf16:bf16:f32  3x7x2:3x2x361
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=bac --dt=f32:s8:bf16 --attr-fpmath=strict:true 1x621x7:1x7x1028
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=abc --dt=bf16:u8:bf16 --attr-fpmath=bf16:true 2x3x758:2x758x107
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=abc --dt=f16:f16:s8  4x33x4:4x4x7
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=abc --dt=bf16:u8:s8  1x4288x36:1x36x3
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=bac --dt=u8:u8:bf16  2x5283x4:2x4x53
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=any --dt=s8:u8:f32  1x720x20:1x20x61
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=abc --dt=f16:s8:u8  4x421x17:4x17x5
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=any --dt=f16:s8:f32 --attr-fpmath=f16:true 5x152x270:5x270x341
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=abc --dt=f32:s8:f32 --attr-fpmath=tf32:true 6x5046x1165:6x1165x135
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=bac --dt=f32:f32:f32 --attr-fpmath=bf16 3x17x154:3x154x219
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=abc --dt=f32:f32:f32  3x1482x361:3x361x1980
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=bac --dt=f16:s4:f16 --attr-fpmath=f16:true 4x1x27:4x27x42
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=any --dt=f64:f64:f64  1x11x1159:1x1159x260
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=any --dt=f32:u8:f32 --attr-fpmath=f16:true 6x23x160:6x160x7
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=any --dt=f16:u4:s8  2x2x17:2x17x32
--reset --skip-impl=ref --stag=abc --wtag=cab --dtag=abc --dt=f32:s8:f32 --attr-fpmath=bf16:true 3x9x10:3x10x21
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=abc --dt=f16:f16:s8  5x107x1985:5x1985x391
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=abc --dt=f32:s8:bf16 --attr-fpmath=f16:true 3x478x7:3x7x92
--reset --skip-impl=ref --stag=abc --wtag=cab --dtag=any --dt=f8_e5m2:f8_e4m3:f8_e4m3  6x365x2:6x2x109
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=bac --dt=f8_e4m3:f8_e4m3:f32  1x2726x12:1x12x4191
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=abc --dt=f8_e4m3:f8_e4m3:f8_e4m3  6x9x1:6x1x2476
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=any --dt=f32:s8:f32 --attr-fpmath=tf32:true 1x10x1:1x1x4719
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=bac --dt=f32:u8:f32 --attr-fpmath=bf16:true 2x3x1816:2x1816x3862
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=bac --dt=bf16:s4:f32 --attr-fpmath=bf16:true 6x1x22:6x22x39
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=any --dt=u8:u8:f32  4x1740x1:4x1x1789
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=bac --dt=f32:s8:f32 --attr-fpmath=f16:true 1x168x1:1x1x440
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=bac --dt=f32:u8:f16 --attr-fpmath=bf16:true 5x4x766:5x766x54
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=bac --dt=f32:s8:bf16 --attr-fpmath=f16:true 7x218x1:7x1x8
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=any --dt=f16:u8:s8  2x58x25:2x25x432
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=any --dt=f16:f16:s8  3x878x363:3x363x2
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=bac --dt=f32:u8:bf16 --attr-fpmath=strict:true 1x47x5:1x5x425
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=abc --dt=f8_e5m2:f8_e4m3:f8_e4m3  4x142x871:4x871x231
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=any --dt=f32:s8:bf16 --attr-fpmath=bf16:true 3x8x221:3x221x8
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=any --dt=f32:s8:f16 --attr-fpmath=strict:true 5x5842x4846:5x4846x4172
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=abc --dt=f32:s8:f16 --attr-fpmath=strict:true 6x1469x1:6x1x4
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=any --dt=f8_e4m3:f8_e4m3:f8_e5m2  8x5x176:8x176x2110
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=bac --dt=s8:u8:bf16  1x205x1501:1x1501x167
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=abc --dt=f32:s8:f16 --attr-fpmath=f16:true 5x5x4:5x4x20
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=bac --dt=f16:u4:s8  3x1x5:3x5x21
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=any --dt=f8_e5m2:f8_e4m3:f8_e4m3  3x5018x1154:3x1154x147
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=any --dt=f32:u8:bf16 --attr-fpmath=bf16:true 1x372x282:1x282x41
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=bac --dt=bf16:s8:u8  1x114x35:1x35x2
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=abc --dt=f16:u8:u8  1x22x3123:1x3123x903
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=abc --dt=f32:u8:bf16 --attr-fpmath=tf32:true 5x3x3:5x3x1980
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=abc --dt=f32:u8:bf16 --attr-fpmath=f16:true 1x4x3:1x3x1
--reset --skip-impl=ref --stag=abc --wtag=cab --dtag=abc --dt=f32:u8:bf16 --attr-fpmath=tf32:true 3x6x1:3x1x13
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=bac --dt=f32:u8:bf16 --attr-fpmath=tf32:true 2x2x6003:2x6003x30
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=bac --dt=bf16:s8:u8  3x1264x3:3x3x1195
--reset --skip-impl=ref --stag=any --wtag=any --dtag=bac --dt=f32:u8:f16 --attr-fpmath=bf16:true 2x153x2286:2x2286x1474
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=abc --dt=f32:s8:bf16 --attr-fpmath=strict:true 3x15x2:3x2x85
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=bac --dt=bf16:s8:f32 --attr-fpmath=bf16:true 2x67x1552:2x1552x8
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=bac --dt=bf16:u4:u8  5x119x6317:5x6317x5
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=abc --dt=f8_e5m2:f8_e5m2:f16  4x630x297:4x297x68
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=any --dt=f32:u8:f16 --attr-fpmath=strict:true 6x231x2437:6x2437x1
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=bac --dt=u8:u8:f16  3x20x835:3x835x43
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=abc --dt=u8:u8:bf16  1x3093x3:1x3x44
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=bac --dt=f32:u8:f32 --attr-fpmath=f16:true 1x131x19:1x19x22
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=any --dt=f32:u8:f16 --attr-fpmath=bf16:true 2x145x234:2x234x4
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=abc --dt=f8_e4m3:f8_e5m2:f8_e5m2  2x5x458:2x458x2
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=any --dt=s8:u8:f16  2x4x3965:2x3965x24
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=abc --dt=f16:u8:f16 --attr-fpmath=f16:true 2x396x24:2x24x486
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=any --dt=f16:f16:s8  3x17x1461:3x1461x189
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=abc --dt=f8_e5m2:f8_e5m2:f8_e5m2  4x2992x65:4x65x7
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=bac --dt=f16:s4:u8  1x3111x1:1x1x832
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=bac --dt=f16:s4:s8  4x1x1671:4x1671x117
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=bac --dt=f16:u4:f32 --attr-fpmath=f16:true 3x103x16:3x16x2150
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=any --dt=f32:u8:bf16 --attr-fpmath=strict:true 2x16x14:2x14x407
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=bac --dt=f16:s8:s8  2x727x817:2x817x5
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=abc --dt=f32:s8:f32 --attr-fpmath=bf16:true 6x2348x4690:6x4690x3
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=abc --dt=f16:f16:f32  5x48x18:5x18x13
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=abc --dt=f16:s8:s8  2x3544x111:2x111x1119
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=abc --dt=f8_e5m2:f8_e5m2:f16  7x7x5403:7x5403x295
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=any --dt=f8_e4m3:f8_e5m2:f8_e5m2  2x177x6084:2x6084x48
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=any --dt=bf16:s8:s8  4x1x43:4x43x27
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=any --dt=f8_e4m3:f8_e5m2:f16  2x5469x1763:2x1763x23
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=bac --dt=f16:u4:f32 --attr-fpmath=f16:true 3x6x59:3x59x7634
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=bac --dt=f8_e4m3:f8_e5m2:f8_e5m2  3x2x9:3x9x38
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=bac --dt=f8_e4m3:f8_e4m3:f32  1x949x72:1x72x6
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=any --dt=f8_e4m3:f8_e4m3:f16  7x1486x1116:7x1116x1304
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=bac --dt=f32:u8:f16 --attr-fpmath=tf32:true 1x130x168:1x168x372
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=any --dt=bf16:u4:s8  2x34x17:2x17x120
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=bac --dt=f32:s8:f32 --attr-fpmath=strict:true 2x7255x1:2x1x1125
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=bac --dt=f8_e5m2:f8_e5m2:f32  5x163x882:5x882x113
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=bac --dt=s8:u8:bf16  3x104x81:3x81x6
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=abc --dt=f32:s8:f16 --attr-fpmath=tf32:true 4x327x2489:4x2489x25
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=abc --dt=bf16:bf16:s8  2x529x84:2x84x53
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=any --dt=f32:u8:f32 --attr-fpmath=strict:true 5x1x3:5x3x715
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=any --dt=bf16:u8:f32 --attr-fpmath=bf16:true 5x93x1322:5x1322x18
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=any --dt=f8_e5m2:f8_e5m2:f8_e4m3  1x2x3149:1x3149x6044
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=bac --dt=f32:s8:f32 --attr-fpmath=tf32:true 1x84x5006:1x5006x1603
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=abc --dt=f32:u8:bf16 --attr-fpmath=bf16:true 4x3x325:4x325x54
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=bac --dt=f32:u8:f32 --attr-fpmath=tf32:true 2x5x309:2x309x5
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=any --dt=bf16:s8:bf16 --attr-fpmath=bf16:true 3x33x168:3x168x14
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=bac --dt=f32:s8:f16 --attr-fpmath=f16:true 4x6x49:4x49x2
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=any --dt=bf16:u4:bf16 --attr-fpmath=bf16:true 7x1x26:7x26x36
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=abc --dt=bf16:bf16:u8  3x102x18:3x18x3
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=any --dt=f32:s8:f32 --attr-fpmath=f16:true 5x7x459:5x459x6
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=bac --dt=bf16:u8:f32 --attr-fpmath=bf16:true 2x4x121:2x121x18
--reset --skip-impl=ref --stag=abc --wtag=cab --dtag=abc --dt=f8_e4m3:f8_e4m3:f8_e4m3  1x2018x1961:1x1961x2
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=bac --dt=bf16:u8:bf16 --attr-fpmath=bf16:true 2x80x6:2x6x2
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=any --dt=f8_e5m2:f8_e5m2:f32  2x1607x3:2x3x4400
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=bac --dt=bf16:bf16:s8  6x2575x13:6x13x1
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=any --dt=u8:u8:bf16  1x2686x61:1x61x51
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=abc --dt=f16:u4:u8  2x120x74:2x74x48
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=any --dt=f32:u8:bf16 --attr-fpmath=strict:true 2x406x1:2x1x3921
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=any --dt=f16:s8:u8  5x1x7466:5x7466x595
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=bac --dt=bf16:s4:s8  4x126x4:4x4x3
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=abc --dt=f32:u8:f16 --attr-fpmath=bf16:true 7x75x3:7x3x196
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=any --dt=f8_e4m3:f8_e5m2:bf16  1x22x5:1x5x20
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=any --dt=f32:u8:f32 --attr-fpmath=strict:true 4x1009x3957:4x3957x10
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=abc --dt=bf16:u4:s8  2x5x5:2x5x66
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=any --dt=f8_e5m2:f8_e5m2:f8_e4m3  5x1x9:5x9x52
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=abc --dt=f32:u8:f32 --attr-fpmath=bf16:true 2x23x398:2x398x61
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=abc --dt=f8_e4m3:f8_e4m3:f8_e4m3  2x181x2:2x2x94
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=any --dt=f16:u8:s8  2x1x7428:2x7428x127
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=any --dt=s8:u8:bf16  5x2900x1234:5x1234x4
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=any --dt=u8:u8:bf16  2x56x73:2x73x1
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=any --dt=f16:f16:f16  2x4694x481:2x481x9
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=any --dt=f16:u4:f32 --attr-fpmath=f16:true 2x27x1:2x1x5999
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=any --dt=f32:f32:f32  2x4650x1354:2x1354x1
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=bac --dt=f16:u4:u8  4x13x10:4x10x63
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=abc --dt=bf16:bf16:u8  5x3x3034:5x3034x563
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=any --dt=s8:u8:f32  3x568x11:3x11x14
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=abc --dt=f32:u8:f16 --attr-fpmath=f16:true 7x335x35:7x35x282
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=any --dt=bf16:u4:s8  1x24x48:1x48x83
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=bac --dt=f32:s8:f16 --attr-fpmath=tf32:true 1x10x244:1x244x26
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=abc --dt=f8_e4m3:f8_e4m3:f8_e4m3  6x5x16:6x16x1187
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=bac --dt=f16:s4:s8  2x3x4115:2x4115x12
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=bac --dt=f32:s8:f32 --attr-fpmath=bf16:true 3x5x61:3x61x5121
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=bac --dt=f32:s8:f16 --attr-fpmath=tf32:true 3x72x1:3x1x92
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=bac --dt=f32:u8:f32 --attr-fpmath=bf16:true 1x1680x3691:1x3691x633
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=bac --dt=f32:u8:f16 --attr-fpmath=bf16:true 4x1x6:4x6x2
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=abc --dt=f32:u8:f16 --attr-fpmath=strict:true 2x54x316:2x316x1794
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=bac --dt=f8_e4m3:f8_e4m3:bf16  2x353x3:2x3x246
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=abc --dt=f8_e5m2:f8_e5m2:f8_e5m2  5x13x989:5x989x1751
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=abc --dt=bf16:u4:bf16 --attr-fpmath=bf16:true 1x10x172:1x172x2465
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=abc --dt=u8:u8:u8  8x429x2:8x2x496
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=any --dt=u8:u8:s32  2x1729x209:2x209x3
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=bac --dt=f32:u8:f16 --attr-fpmath=bf16:true 3x4x13:3x13x18
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=any --dt=f32:u8:f32 --attr-fpmath=bf16:true 1x3466x299:1x299x19
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=bac --dt=bf16:u8:s8  3x131x123:3x123x2529
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=any --dt=f16:u8:u8  2x130x1:2x1x2353
--reset --skip-impl=ref --stag=abc --wtag=cab --dtag=any --dt=f32:u8:bf16 --attr-fpmath=f16:true 2x682x4:2x4x6
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=any --dt=f16:u8:u8  2x10x9:2x9x20
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=any --dt=f16:f16:f16  6x9x4:6x4x6
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=bac --dt=bf16:u4:s8  1x1218x206:1x206x3
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=abc --dt=f32:f32:f32  4x85x11:4x11x173
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=abc --dt=f8_e4m3:f8_e4m3:f8_e5m2  4x2x178:4x178x5801
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=any --dt=f8_e5m2:f8_e5m2:f8_e5m2  8x206x84:8x84x10
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=any --dt=f8_e5m2:f8_e4m3:f16  1x3990x18:1x18x1860
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=any --dt=f8_e5m2:f8_e4m3:f8_e5m2  1x8x4044:1x4044x4855
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=bac --dt=f32:u8:f16 --attr-fpmath=strict:true 2x487x663:2x663x615
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=bac --dt=bf16:bf16:f32  2x224x32:2x32x319
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=bac --dt=f32:u8:bf16 --attr-fpmath=bf16:true 1x79x3954:1x3954x605
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=bac --dt=f16:s8:f32 --attr-fpmath=f16:true 5x255x1169:5x1169x3322
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=bac --dt=f16:u8:s8  3x375x1381:3x1381x116
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=bac --dt=f32:u8:f16 --attr-fpmath=f16:true 3x6x134:3x134x7360
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=abc --dt=bf16:u4:u8  3x229x3:3x3x13
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=abc --dt=f32:u8:bf16 --attr-fpmath=bf16:true 8x12x2:8x2x52
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=bac --dt=f32:s8:bf16 --attr-fpmath=tf32:true 3x105x839:3x839x1318
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=any --dt=f32:u8:bf16 --attr-fpmath=tf32:true 1x2178x31:1x31x4
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=any --dt=f32:u8:bf16 --attr-fpmath=strict:true 2x1216x9:2x9x8
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=bac --dt=bf16:s4:bf16 --attr-fpmath=bf16:true 6x1558x1058:6x1058x1150
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=any --dt=f8_e5m2:f8_e5m2:f8_e5m2  2x4771x1996:2x1996x2
--reset --skip-impl=ref --stag=any --wtag=any --dtag=bac --dt=f16:s4:s8  3x4461x73:3x73x1136
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=abc --dt=bf16:s8:u8  1x69x2:1x2x9
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=bac --dt=f8_e4m3:f8_e4m3:f8_e4m3  6x97x81:6x81x108
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=bac --dt=f16:s8:u8  2x20x13:2x13x94
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=bac --dt=f32:s8:f16 --attr-fpmath=f16:true 2x3827x3:2x3x1
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=any --dt=s8:u8:bf16  1x189x100:1x100x6
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=bac --dt=f8_e4m3:f8_e5m2:bf16  3x6x14:3x14x218
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=any --dt=f32:f32:f32 --attr-fpmath=f16 5x2x84:5x84x6
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=any --dt=bf16:s4:bf16 --attr-fpmath=bf16:true 4x2x6630:4x6630x1945
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=any --dt=f8_e4m3:f8_e5m2:f16  6x40x815:6x815x1455
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=abc --dt=f8_e4m3:f8_e4m3:bf16  5x9x99:5x99x15
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=bac --dt=f32:u8:f16 --attr-fpmath=tf32:true 6x2568x450:6x450x1216
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=bac --dt=f32:s8:f16 --attr-fpmath=strict:true 1x196x3:1x3x218
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=abc --dt=f16:f16:s8  5x4014x1354:5x1354x32
--reset --skip-impl=ref --stag=abc --wtag=cab --dtag=abc --dt=bf16:bf16:bf16  6x2x6:6x6x9
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=abc --dt=u8:u8:u8  7x438x12:7x12x932
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=any --dt=f64:f64:f64  3x104x4812:3x4812x2
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=bac --dt=f32:u8:f32 --attr-fpmath=f16:true 2x5x2:2x2x7771
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=any --dt=bf16:bf16:f32  1x2680x1662:1x1662x3848
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=any --dt=bf16:u4:u8  3x1x897:3x897x102
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=abc --dt=bf16:bf16:bf16  7x375x264:7x264x4
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=bac --dt=f64:f64:f64  1x1x31:1x31x2199
--reset --skip-impl=ref --stag=abc --wtag=cab --dtag=any --dt=f32:u8:bf16 --attr-fpmath=strict:true 1x1142x39:1x39x62
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=any --dt=bf16:u4:u8  4x298x1:4x1x1
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=abc --dt=f32:f32:f32 --attr-fpmath=f16 1x3080x436:1x436x2
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=bac --dt=f16:f16:f32  4x3x5196:4x5196x10
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=abc --dt=f64:f64:f64  2x3x13:2x13x6877
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=abc --dt=f32:s8:f16 --attr-fpmath=bf16:true 2x2x1647:2x1647x9
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=bac --dt=f16:s4:s8  8x363x256:8x256x3
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=abc --dt=u8:u8:f32  6x72x40:6x40x761
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=bac --dt=bf16:u4:f32 --attr-fpmath=bf16:true 3x18x1450:3x1450x17
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=bac --dt=bf16:s8:bf16 --attr-fpmath=bf16:true 2x2x579:2x579x30
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=abc --dt=bf16:s8:s8  3x6x27:3x27x4
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=bac --dt=f8_e4m3:f8_e4m3:f32  6x1640x129:6x129x4062
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=abc --dt=f32:f32:f32 --attr-fpmath=tf32 2x449x16:2x16x225
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=abc --dt=f16:f16:f32  2x14x5:2x5x23
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=abc --dt=f8_e4m3:f8_e4m3:f16  1x23x251:1x251x20
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=any --dt=f16:s8:s8  2x18x107:2x107x20
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=abc --dt=f8_e5m2:f8_e4m3:f8_e5m2  2x61x351:2x351x2
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=any --dt=f32:u8:bf16 --attr-fpmath=strict:true 6x50x58:6x58x2
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=abc --dt=f16:u8:s8  3x2x1086:3x1086x1204
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=abc --dt=s8:u8:u8  5x75x16:5x16x564
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=bac --dt=f64:f64:f64  8x35x21:8x21x158
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=abc --dt=f8_e5m2:f8_e4m3:f8_e4m3  1x22x4136:1x4136x1687
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=any --dt=f8_e4m3:f8_e4m3:f8_e4m3  1x35x82:1x82x47
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=abc --dt=f16:u8:f16 --attr-fpmath=f16:true 3x1539x7329:3x7329x6
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=abc --dt=bf16:bf16:f32  2x8x591:2x591x3
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=abc --dt=f8_e5m2:f8_e4m3:f32  2x4856x17:2x17x2
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=any --dt=f32:u8:f32 --attr-fpmath=bf16:true 1x1041x26:1x26x4698
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=abc --dt=bf16:bf16:bf16  1x362x682:1x682x1
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=abc --dt=f8_e5m2:f8_e4m3:f16  3x22x1677:3x1677x422
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=bac --dt=s8:u8:u8  2x81x5614:2x5614x3965
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=any --dt=bf16:u8:f32 --attr-fpmath=bf16:true 2x38x347:2x347x41
--reset --skip-impl=ref --stag=abc --wtag=cab --dtag=bac --dt=f32:f32:f32 --attr-fpmath=f16 4x35x9:4x9x105
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=any --dt=f32:u8:f32 --attr-fpmath=tf32:true 2x1293x305:2x305x107
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=abc --dt=bf16:bf16:f32  1x70x1017:1x1017x7
--reset --skip-impl=ref --stag=any --wtag=any --dtag=any --dt=bf16:u8:f32 --attr-fpmath=bf16:true 1x323x619:1x619x2826
--reset --skip-impl=ref --stag=abc --wtag=cab --dtag=any --dt=f16:s4:f32 --attr-fpmath=f16:true 2x42x1711:2x1711x2
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=abc --dt=f16:f16:u8  3x3846x17:3x17x1261
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=any --dt=f8_e5m2:f8_e4m3:bf16  2x2630x517:2x517x2
--reset --skip-impl=ref --stag=any --wtag=any --dtag=bac --dt=f32:s8:f32 --attr-fpmath=strict:true 1x3x1300:1x1300x375
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=any --dt=f32:s8:f32 --attr-fpmath=tf32:true 1x7819x364:1x364x941
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=abc --dt=f32:u8:bf16 --attr-fpmath=f16:true 3x27x741:3x741x35
--reset --skip-impl=ref --stag=abc --wtag=cab --dtag=bac --dt=f32:s8:f16 --attr-fpmath=strict:true 3x402x134:3x134x5
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=any --dt=bf16:u4:s8  2x2x29:2x29x876
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=bac --dt=f32:s8:f16 --attr-fpmath=tf32:true 5x525x8072:5x8072x2
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=any --dt=f8_e5m2:f8_e4m3:bf16  5x15x2350:5x2350x4
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=bac --dt=f16:u8:f32 --attr-fpmath=f16:true 3x48x804:3x804x9
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=abc --dt=f32:s8:bf16 --attr-fpmath=tf32:true 1x1x7:1x7x3
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=any --dt=f32:s8:bf16 --attr-fpmath=tf32:true 2x152x20:2x20x8
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=abc --dt=f32:u8:f16 --attr-fpmath=f16:true 2x232x649:2x649x41
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=bac --dt=bf16:s8:u8  7x6815x6781:7x6781x107
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=bac --dt=f32:f32:f32 --attr-fpmath=f16 1x3x1:1x1x29
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=any --dt=bf16:u4:bf16 --attr-fpmath=bf16:true 3x4x7:3x7x31
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=abc --dt=f32:u8:f32 --attr-fpmath=f16:true 2x170x277:2x277x20
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=any --dt=bf16:bf16:s8  2x31x2671:2x2671x229
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=abc --dt=f8_e5m2:f8_e4m3:f8_e5m2  3x10x64:3x64x1
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=abc --dt=u8:u8:s32  2x8x330:2x330x248
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=abc --dt=f16:s8:f16 --attr-fpmath=f16:true 6x1x39:6x39x467
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=any --dt=bf16:s4:f32 --attr-fpmath=bf16:true 3x826x7197:3x7197x3891
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=any --dt=f16:s4:f16 --attr-fpmath=f16:true 1x1105x62:1x62x664
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=abc --dt=u8:u8:f32  6x1443x745:6x745x1
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=abc --dt=s8:u8:f16  7x3342x2:7x2x1510
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=any --dt=f8_e4m3:f8_e4m3:f16  2x1x943:2x943x261
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=any --dt=bf16:u4:f32 --attr-fpmath=bf16:true 3x57x60:3x60x202
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=any --dt=bf16:s4:s8  4x3x57:4x57x5723
--reset --skip-impl=ref --stag=abc --wtag=cab --dtag=any --dt=f16:u4:s8  2x1179x2:2x2x298
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=any --dt=bf16:s4:s8  4x564x693:4x693x2
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=bac --dt=f16:s8:f32 --attr-fpmath=f16:true 2x2292x878:2x878x8
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=bac --dt=bf16:s4:f32 --attr-fpmath=bf16:true 6x1280x774:6x774x7
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=any --dt=s8:u8:f32  1x3x48:1x48x5
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=abc --dt=u8:u8:bf16  1x114x4:1x4x97
--reset --skip-impl=ref --stag=any --wtag=any --dtag=any --dt=f16:f16:s8  2x2484x1600:2x1600x2603
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=abc --dt=bf16:s8:u8  2x1773x130:2x130x1
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=bac --dt=f16:f16:f32  1x48x2:1x2x8
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=abc --dt=f8_e4m3:f8_e5m2:f32  2x1523x12:2x12x2
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=bac --dt=f8_e5m2:f8_e4m3:bf16  2x2x2:2x2x3
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=bac --dt=f8_e4m3:f8_e4m3:f16  1x675x7781:1x7781x55
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=bac --dt=f8_e4m3:f8_e5m2:bf16  2x34x9:2x9x28
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=abc --dt=f16:u4:f16 --attr-fpmath=f16:true 1x213x6400:1x6400x1147
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=abc --dt=bf16:s8:bf16 --attr-fpmath=bf16:true 4x10x19:4x19x6404
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=abc --dt=f32:u8:f16 --attr-fpmath=bf16:true 2x15x50:2x50x21
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=bac --dt=bf16:s4:u8  2x52x13:2x13x90
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=abc --dt=f16:f16:s8  2x21x5319:2x5319x1349
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=bac --dt=s8:u8:s8  2x45x2900:2x2900x108
--reset --skip-impl=ref --stag=any --wtag=abc --dtag=abc --dt=f16:s4:f16 --attr-fpmath=f16:true 3x7275x532:3x532x27
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=abc --dt=bf16:u4:bf16 --attr-fpmath=bf16:true 5x52x14:5x14x3707
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=bac --dt=f64:f64:f64  5x70x1888:5x1888x41
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=abc --dt=bf16:u4:f32 --attr-fpmath=bf16:true 7x28x3:7x3x13
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=abc --dt=f16:s4:f32 --attr-fpmath=f16:true 3x2416x2:3x2x3
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=abc --dt=f32:s8:bf16 --attr-fpmath=f16:true 3x162x1228:3x1228x10
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=any --dt=f32:s8:f32 --attr-fpmath=f16:true 1x176x17:1x17x9
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=bac --dt=f32:s8:bf16 --attr-fpmath=bf16:true 2x11x2465:2x2465x428
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=abc --dt=f32:u8:f16 --attr-fpmath=bf16:true 1x255x906:1x906x33
--reset --skip-impl=ref --stag=abc --wtag=acb --dtag=any --dt=f16:s4:f32 --attr-fpmath=f16:true 2x41x1355:2x1355x227
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=any --dt=f32:u8:bf16 --attr-fpmath=bf16:true 1x3878x279:1x279x77
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=any --dt=f16:u4:f16 --attr-fpmath=f16:true 6x1482x83:6x83x12
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=bac --dt=f16:f16:s8  1x160x1:1x1x3071
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=abc --dt=f8_e4m3:f8_e5m2:f16  1x7596x408:1x408x113
--reset --skip-impl=ref --stag=any --wtag=any --dtag=any --dt=f8_e5m2:f8_e5m2:f16  5x18x240:5x240x1731
--reset --skip-impl=ref --stag=any --wtag=any --dtag=bac --dt=f8_e4m3:f8_e4m3:f16  5x731x16:5x16x1864
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=bac --dt=s8:u8:u8  1x41x157:1x157x700
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=bac --dt=f16:u8:f16 --attr-fpmath=f16:true 3x715x267:3x267x22
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=bac --dt=f16:s8:u8  1x855x819:1x819x95
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=bac --dt=f32:u8:f16 --attr-fpmath=bf16:true 8x113x1359:8x1359x32
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=bac --dt=bf16:u8:s8  5x192x1534:5x1534x1132
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=bac --dt=f8_e5m2:f8_e5m2:f8_e5m2  3x56x173:3x173x265
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=bac --dt=bf16:bf16:f32  5x314x147:5x147x248
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=abc --dt=bf16:s8:u8  3x2353x5450:3x5450x6
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=abc --dt=bf16:u4:bf16 --attr-fpmath=bf16:true 3x3352x6680:3x6680x3
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=any --dt=f8_e5m2:f8_e5m2:f32  2x2904x1078:2x1078x4726
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=any --dt=s8:u8:f32  1x187x1:1x1x2
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=abc --dt=f32:f32:f32  4x912x454:4x454x644
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=abc --dt=bf16:s8:u8  5x6157x6:5x6x4728
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=any --dt=f16:s4:s8  8x24x189:8x189x2
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=bac --dt=f32:s8:f32 --attr-fpmath=tf32:true 8x136x3755:8x3755x858
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=abc --dt=bf16:bf16:bf16  1x68x166:1x166x223
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=abc --dt=bf16:s8:f32 --attr-fpmath=bf16:true 1x7217x46:1x46x201
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=abc --dt=bf16:u4:f32 --attr-fpmath=bf16:true 2x237x429:2x429x124
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=any --dt=f32:f32:f32 --attr-fpmath=bf16 1x68x2028:1x2028x2375
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=abc --dt=bf16:s4:bf16 --attr-fpmath=bf16:true 7x2x105:7x105x1699
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=abc --dt=f8_e5m2:f8_e5m2:f8_e4m3  6x7x67:6x67x6606
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=abc --dt=f16:u4:f32 --attr-fpmath=f16:true 2x9x6:2x6x6
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=abc --dt=f32:s8:f16 --attr-fpmath=tf32:true 6x1x7:6x7x1216
--reset --skip-impl=ref --stag=any --wtag=bac --dtag=abc --dt=u8:u8:f32  3x3691x1583:3x1583x491
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=abc --dt=s8:u8:bf16  5x23x7788:5x7788x80
--reset --skip-impl=ref --stag=any --wtag=any --dtag=any --dt=f16:s4:u8  5x3952x760:5x760x137
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=abc --dt=bf16:bf16:f32  7x43x755:7x755x1
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=any --dt=f8_e5m2:f8_e4m3:f16  1x1023x2688:1x2688x20
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=abc --dt=bf16:bf16:s8  1x15x1:1x1x165
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=abc --dt=f32:u8:f32 --attr-fpmath=bf16:true 2x3385x145:2x145x175
--reset --skip-impl=ref --stag=cab --wtag=cab --dtag=abc --dt=f32:s8:f16 --attr-fpmath=tf32:true 4x39x156:4x156x2351
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=bac --dt=f32:f32:f32  3x1061x6733:3x6733x11
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=bac --dt=f16:f16:s8  1x49x17:1x17x2
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=abc --dt=bf16:u4:f32 --attr-fpmath=bf16:true 2x30x9:2x9x48
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=bac --dt=f32:u8:bf16 --attr-fpmath=bf16:true 2x12x283:2x283x5
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=any --dt=f8_e4m3:f8_e5m2:f8_e5m2  1x2978x11:1x11x98
--reset --skip-impl=ref --stag=abc --wtag=any --dtag=any --dt=f8_e5m2:f8_e4m3:f16  8x50x80:8x80x1
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=any --dt=f32:f32:f32 --attr-fpmath=bf16 6x2673x1793:6x1793x85
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=bac --dt=f8_e5m2:f8_e4m3:bf16  4x4647x27:4x27x3042
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=abc --dt=f8_e4m3:f8_e4m3:f8_e4m3  7x192x83:7x83x1
--reset --skip-impl=ref --stag=acb --wtag=bac --dtag=bac --dt=f16:u8:s8  3x44x1690:3x1690x12
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=abc --dt=bf16:bf16:u8  2x805x1848:2x1848x20
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=abc --dt=f32:s8:f32 --attr-fpmath=tf32:true 3x401x84:3x84x1395
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=bac --dt=f8_e5m2:f8_e4m3:f32  4x3885x252:4x252x59
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=bac --dt=f16:f16:u8  1x425x183:1x183x7189
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=bac --dt=f16:u4:s8  8x77x25:8x25x16
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=abc --dt=f8_e4m3:f8_e5m2:f8_e5m2  4x789x76:4x76x42
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=abc --dt=f32:u8:bf16 --attr-fpmath=f16:true 1x3819x10:1x10x4
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=abc --dt=bf16:u8:u8  4x42x207:4x207x409
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=bac --dt=f16:s8:f16 --attr-fpmath=f16:true 3x263x318:3x318x177
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=any --dt=u8:u8:s8  4x1x19:4x19x102
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=bac --dt=f8_e4m3:f8_e4m3:f8_e5m2  1x8x5242:1x5242x2
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=bac --dt=f32:s8:f32 --attr-fpmath=f16:true 5x63x58:5x58x28
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=bac --dt=f32:f32:f32 --attr-fpmath=bf16 3x7x5:3x5x3196
--reset --skip-impl=ref --stag=bac --wtag=cab --dtag=abc --dt=f8_e5m2:f8_e4m3:f16  1x3888x36:1x36x2961
--reset --skip-impl=ref --stag=any --wtag=acb --dtag=bac --dt=f8_e4m3:f8_e5m2:f32  5x652x849:5x849x1905
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=bac --dt=f16:u8:s8  3x2347x102:3x102x188
--reset --skip-impl=ref --stag=abc --wtag=bac --dtag=bac --dt=f8_e5m2:f8_e5m2:f32  6x26x668:6x668x111
--reset --skip-impl=ref --stag=acb --wtag=cab --dtag=abc --dt=f32:s8:f32 --attr-fpmath=strict:true 2x4x3:2x3x3
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=bac --dt=f32:u8:f16 --attr-fpmath=strict:true 2x1485x48:2x48x2
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=abc --dt=f16:u4:u8  3x2x2:3x2x288
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=any --dt=bf16:s4:bf16 --attr-fpmath=bf16:true 1x4893x74:1x74x175
--reset --skip-impl=ref --stag=bac --wtag=any --dtag=abc --dt=f8_e5m2:f8_e4m3:bf16  3x4x1459:3x1459x92
--reset --skip-impl=ref --stag=any --wtag=cab --dtag=bac --dt=f32:u8:f32 --attr-fpmath=strict:true 1x3x167:1x167x1913
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=any --dt=s8:u8:bf16  1x1x27:1x27x1
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=any --dt=f32:u8:bf16 --attr-fpmath=f16:true 2x9x2279:2x2279x582
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=any --dt=f16:f16:s8  6x582x1054:6x1054x2861
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=abc --dt=f32:s8:bf16 --attr-fpmath=bf16:true 3x1x2:3x2x1313
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=any --dt=f8_e5m2:f8_e5m2:f8_e4m3  7x489x61:7x61x159
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=abc --dt=f32:f32:f32 --attr-fpmath=f16 2x124x36:2x36x1
--reset --skip-impl=ref --stag=abc --wtag=abc --dtag=any --dt=f16:f16:s8  7x40x945:7x945x276
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=any --dt=f8_e5m2:f8_e4m3:f16  3x10x16:3x16x92
--reset --skip-impl=ref --stag=cab --wtag=any --dtag=abc --dt=f8_e4m3:f8_e4m3:f32  3x7x18:3x18x964
--reset --skip-impl=ref --stag=cab --wtag=acb --dtag=bac --dt=bf16:u8:f32 --attr-fpmath=bf16:true 5x1577x60:5x60x9
--reset --skip-impl=ref --stag=acb --wtag=acb --dtag=any --dt=u8:u8:bf16  1x188x4:1x4x338
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=abc --dt=bf16:s4:bf16 --attr-fpmath=bf16:true 6x4x245:6x245x37
--reset --skip-impl=ref --stag=cab --wtag=bac --dtag=any --dt=f8_e4m3:f8_e4m3:f8_e4m3  8x3748x2:8x2x67
--reset --skip-impl=ref --stag=acb --wtag=any --dtag=bac --dt=u8:u8:f32  2x71x128:2x128x5
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=bac --dt=bf16:bf16:bf16  3x656x157:3x157x50
--reset --skip-impl=ref --stag=acb --wtag=abc --dtag=any --dt=f8_e4m3:f8_e4m3:f8_e5m2  7x1459x2616:7x2616x251
--reset --skip-impl=ref --stag=cab --wtag=abc --dtag=any --dt=bf16:u4:u8  2x6457x48:2x48x374
--reset --skip-impl=ref --stag=bac --wtag=abc --dtag=bac --dt=f32:u8:f16 --attr-fpmath=f16:true 6x49x3586:6x3586x4
--reset --skip-impl=ref --stag=bac --wtag=bac --dtag=bac --dt=f8_e5m2:f8_e4m3:f16  2x13x112:2x112x3611
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=any --dt=f32:s8:f32 --attr-fpmath=strict:true 3x7016x37:3x37x717
--reset --skip-impl=ref --stag=bac --wtag=acb --dtag=abc --dt=f32:s8:f32 --attr-fpmath=f16:true 2x677x47:2x47x26
