2026年04月18日 AI 资讯速递

Claude Opus 4.7 在盲测中以 69:31 击败 4.6 版本;Meta 发布 Muse Spark 转向闭源策略;AWS Bedrock 支持按 IAM 主体归因推理成本。

今日概览

  • Claude Opus 4.7 在盲测中击败 4.6 版本
  • 用户测试显示 Qwen 3.6 35B 优于 Gemma 4 26B
  • AWS 为 Bedrock 推出细粒度成本归因功能
  • 社区热议 Claude Design 工具及 Anthropic 迭代速度
  • Deeplearning.ai 通讯讨论 Meta 战略转向等议题

大模型与产品发布

Claude Opus 4.7 在盲测中击败 4.6 版本

一项由 GPT-5.4、Gemini 3.1 Pro 和 DeepSeek V3.2 作为评委的盲测显示,Claude Opus 4.7 在 100 个问题中赢得了 69 场,性能优于 4.6 版本。测试覆盖多个领域,Claude Opus 4.7 在编程、推理和创意写作任务中均取得优势。

来源:大黑AI·模型动态

社区热议 Claude Design 工具及 Anthropic 迭代速度

用户惊叹 Anthropic 产品迭代速度,并介绍了由 Claude Opus 4.7 驱动的 Claude Design 工具,可将描述转为设计稿、PPT 等,支持多种输入和导出格式。该工具展示了 AI 在设计工作流中的实际应用潜力。

来源:大黑AI·技巧教程

OpenAI 高管离职并解散科学部门

OpenAI 高管 Kevin Weil 离职,同时公司解散科学部门,这是其内部组织结构的重大变动。该变化正值 OpenAI 推进商业化转型之际,引发社区对其战略方向的关注和讨论。

来源:大黑AI·行业资讯

AI 应用与落地

用户测试显示 Qwen 3.6 35B 优于 Gemma 4 26B

用户个人测试表明,在代码调试和文档分析任务上,Qwen 3.6 35B 的表现明显优于 Gemma 4 26B。测试涵盖多个实际场景,Qwen 3.6 在指令遵循和输出质量上均获得更高评价。

来源:大黑AI·模型动态

AWS 为 Bedrock 推出细粒度成本归因功能

Amazon Bedrock 现已支持细粒度成本归因,可将推理成本自动归属到发起调用的 IAM 主体(用户、角色或联合身份如 Okta/Entra ID),无需修改现有工作流程。成本数据写入 CUR 2.0,用户可通过 Cost Explorer 和成本分配标签按团队、项目或自定义维度聚合分析。该功能支持 IAM 用户、Bedrock API Key、IAM 角色及联邦用户等多种调用方式。

来源:AWS Blog

Deeplearning.ai 通讯讨论 Meta 战略转向等议题

最新一期 The Batch 通讯讨论了 Meta 从开放权重策略转向发布闭源模型 Muse Spark,该模型为原生多模态推理模型,支持工具调用和多智能体编排,在部分健康和多模态基准测试中表现领先,但编程和智能体任务表现不及预期。通讯还涉及大型药企投资 AI、监管碎片化及模拟人类队列等话题。

来源:Deeplearning.ai The Batch