aggregate.py: add format=latest_grouped (#6472)
This allows us to show speedups grouped by model, e.g.:
```
╒═════════════╤════════════╤══════════╤══════════════╤══════════╤═══════════════════╤══════════╤══════════════════╤══════════╕
│ ModelName │ Speedup │ StdDev │ Speedup │ StdDev │ Speedup │ StdDev │ Speedup │ StdDev │
│ │ Inductor │ │ XLA+Dynamo │ │ XLA_Eval+Dynamo │ │ XLA+LazyTensor │ │
│ │ over │ │ over │ │ over │ │ over │ │
│ │ Oldest │ │ Oldest │ │ Oldest │ │ Oldest │ │
│ │ Inductor │ │ Inductor │ │ Inductor │ │ Inductor │ │
╞═════════════╪════════════╪══════════╪══════════════╪══════════╪═══════════════════╪══════════╪══════════════════╪══════════╡
│ llama2.13b │ 1.00 │ 0.00 │ │ │ │ │ 0.32 │ 0.00 │
├─────────────┼────────────┼──────────┼──────────────┼──────────┼───────────────────┼──────────┼──────────────────┼──────────┤
│ llama2.7b │ 1.00 │ 0.00 │ 0.82 │ 0.00 │ 0.83 │ 0.00 │ 0.28 │ 0.00 │
├─────────────┼────────────┼──────────┼──────────────┼──────────┼───────────────────┼──────────┼──────────────────┼──────────┤
│ GEOMEAN │ 1.00 │ 0.00 │ 0.82 │ 0.00 │ 0.83 │ 0.00 │ 0.30 │ 0.00 │
╘═════════════╧════════════╧══════════╧══════════════╧══════════╧═══════════════════╧══════════╧══════════════════╧══════════╛
```