Today's Highlights

  • vLLM 0.20 发布,提升内存和 MoE 服务效率。
  • NVIDIA 推出 Nemotron 3 Nano Omni,多模态 MoE 模型。
  • Mistral 推出 Workflows,提升企业 AI 生产系统的持久性。
  • Hermes 在实际工作流程中表现优于 OpenClaw。
  • GPT-5.5 Pro 在 Epoch 能力指数上达到新高。

模型

vLLM 0.20 发布

vLLM 0.20 版本提升了内存和 MoE 服务效率,支持多种硬件平台。

Read More
vLLMMoE

NVIDIA Nemotron 3 Nano Omni

NVIDIA 推出 Nemotron 3 Nano Omni,多模态 MoE 模型,支持文本、图像、视频、音频和文档。

Read More
NVIDIAMoE

Poolside Laguna XS.2 发布

Poolside 发布 Laguna XS.2,33B 总参数 / 3B 活跃 MoE 编码模型。

Read More
PoolsideMoE

产品

Mistral Workflows 推出

Mistral 推出 Workflows,作为企业 AI 过程的编排层。

Read More
MistralWorkflows

研究

GPT-5.5 Pro 在 Epoch 指数上创新高

GPT-5.5 Pro 在 Epoch 能力指数上达到 159,并在 FrontierMath 上取得新高。

Read More
GPT-5.5Benchmark

Microsoft 的 TRELLIS.2 发布

Microsoft 发布 TRELLIS.2,开源的 4B 图像到 3D 模型。

Read More
Microsoft3D

工具

Hermes 在实际工作流程中表现优异

Hermes 在指令跟随和实际工作流程中表现优于 OpenClaw。

Read More
HermesAgent

Keywords: vLLM / Nemotron 3 / DeepSeek V4 / Mistral Workflows / Hermes / GPT-5.5 Pro / Laguna XS.2 / TRELLIS.2 / DeepGEMM MegaMoE / DeepSpeed