2026年04月18日 AI 资讯速递

Apr 18, 2026

Claude Opus 4.7 在盲测中以 69:31 击败 4.6 版本；Meta 发布 Muse Spark 转向闭源策略；AWS Bedrock 支持按 IAM 主体归因推理成本。

今日概览

Claude Opus 4.7 在盲测中击败 4.6 版本
用户测试显示 Qwen 3.6 35B 优于 Gemma 4 26B
AWS 为 Bedrock 推出细粒度成本归因功能
社区热议 Claude Design 工具及 Anthropic 迭代速度
Deeplearning.ai 通讯讨论 Meta 战略转向等议题

大模型与产品发布

Claude Opus 4.7 在盲测中击败 4.6 版本

一项由 GPT-5.4、Gemini 3.1 Pro 和 DeepSeek V3.2 作为评委的盲测显示，Claude Opus 4.7 在 100 个问题中赢得了 69 场，性能优于 4.6 版本。测试覆盖多个领域，Claude Opus 4.7 在编程、推理和创意写作任务中均取得优势。

来源：大黑AI·模型动态

社区热议 Claude Design 工具及 Anthropic 迭代速度

用户惊叹 Anthropic 产品迭代速度，并介绍了由 Claude Opus 4.7 驱动的 Claude Design 工具，可将描述转为设计稿、PPT 等，支持多种输入和导出格式。该工具展示了 AI 在设计工作流中的实际应用潜力。

来源：大黑AI·技巧教程

OpenAI 高管离职并解散科学部门

OpenAI 高管 Kevin Weil 离职，同时公司解散科学部门，这是其内部组织结构的重大变动。该变化正值 OpenAI 推进商业化转型之际，引发社区对其战略方向的关注和讨论。

来源：大黑AI·行业资讯

AI 应用与落地

用户测试显示 Qwen 3.6 35B 优于 Gemma 4 26B

用户个人测试表明，在代码调试和文档分析任务上，Qwen 3.6 35B 的表现明显优于 Gemma 4 26B。测试涵盖多个实际场景，Qwen 3.6 在指令遵循和输出质量上均获得更高评价。

来源：大黑AI·模型动态

AWS 为 Bedrock 推出细粒度成本归因功能

Amazon Bedrock 现已支持细粒度成本归因，可将推理成本自动归属到发起调用的 IAM 主体（用户、角色或联合身份如 Okta/Entra ID），无需修改现有工作流程。成本数据写入 CUR 2.0，用户可通过 Cost Explorer 和成本分配标签按团队、项目或自定义维度聚合分析。该功能支持 IAM 用户、Bedrock API Key、IAM 角色及联邦用户等多种调用方式。

来源：AWS Blog

Deeplearning.ai 通讯讨论 Meta 战略转向等议题

最新一期 The Batch 通讯讨论了 Meta 从开放权重策略转向发布闭源模型 Muse Spark，该模型为原生多模态推理模型，支持工具调用和多智能体编排，在部分健康和多模态基准测试中表现领先，但编程和智能体任务表现不及预期。通讯还涉及大型药企投资 AI、监管碎片化及模拟人类队列等话题。

来源：Deeplearning.ai The Batch