Together AI zaprezentowało technikę speculative decodingu świadomego dystrybucji, która przyspia szania rollouty reinforcement learning aż o połowę, znacznie skracając czas treningu modeli.