en:discussion:深度学习:注意力机制与transformer