Протягом тривалого часу точилися активні дискусії щодо пошуку кращої архітектури для великих мовних моделей (LLM), яка могла б стати альтернативою трансформерам. Схоже, каліфорнійський стартап Inception Labs вже має перспективне рішення. Компанія представила Mercury – першу у світі велику мовну модель на основі дифузії, розроблену для комерційного використання.
