SubQ
首个基于亚二次稀疏注意力(SSA)的前沿模型。1200 万 token 上下文,1M tokens 下比 FlashAttention 快 52 倍,成本不到 Claude Opus 的 5%。
访问官网 arrow_outward觉得这篇有帮助?
订阅后可以在新内容真正发布时收到提醒。
首个基于亚二次稀疏注意力(SSA)的前沿模型。1200 万 token 上下文,1M tokens 下比 FlashAttention 快 52 倍,成本不到 Claude Opus 的 5%。
访问官网 arrow_outward订阅后可以在新内容真正发布时收到提醒。