SubQ

hub AI 模型 / 平台部分免费

首个基于亚二次稀疏注意力（SSA）的前沿模型。1200 万 token 上下文，1M tokens 下比 FlashAttention 快 52 倍，成本不到 Claude Opus 的 5%。

LLMLong ContextSSASparse Attention12M TokensSubquadratic