avva: (Default)
avva ([personal profile] avva) wrote2019-06-15 06:35 pm

о трансформере

the transformer … “explained”? (англ.)

Хорошее объяснение для неспециалистов того, как устроена - очень в общих чертах - архитектура нейронной сети Transformer, которая лежит в основе предсказателя текста GTP-2 и других впечатляющих результатов последнего времени. Особенно интересно сравнение с конволюционными и рекуррентными сетями.