Commit 5f28bab2 authored Sep 13, 2018 by A. Unique TensorFlower Committed by TensorFlower Gardener Sep 13, 2018

Avoid excessive cpu<->gpu memory swaps, compute shape ops on the CPU. This

results in +10% perf improvement for tensor2tensor Transformer model training
step times, and +37% perf improvement for tensor2tensor Transformer model
decoding.

PiperOrigin-RevId: 212804933

parent da02a441

Show whitespace changes

Inline Side-by-side

Please to comment