备忘录最尖锐的部分直指 Anthropic。德莱瑟指责对手将叙事建立在“恐惧、限制及少数精英应控制 AI”的观念上,并称 Anthropic 因未锁定足够算力而犯下“战略错误”,导致客户遭遇限流、可用性不稳定等问题。
Transformer 架构的伟大之处,不仅在于提出了注意力机制,更在于提供了一套 “模块化” 的设计框架 —— 通过组合编码器(Encoder)和解码器(Decoder),可以衍生出多种结构变体。从 BERT 的 “纯编码器” 到 GPT 的 “纯解码器”,从 T5 的 “编码器 - 解码器” 到 ...