2026年04月18日 AI 资讯速递
Claude Opus 4.7 在盲测中以 69:31 击败 4.6 版本;Meta 发布 Muse Spark 转向闭源策略;AWS Bedrock 支持按 IAM 主体归因推理成本。
今日概览
- Claude Opus 4.7 在盲测中击败 4.6 版本
- 用户测试显示 Qwen 3.6 35B 优于 Gemma 4 26B
- AWS 为 Bedrock 推出细粒度成本归因功能
- 社区热议 Claude Design 工具及 Anthropic 迭代速度
- Deeplearning.ai 通讯讨论 Meta 战略转向等议题
大模型与产品发布
Claude Opus 4.7 在盲测中击败 4.6 版本
一项由 GPT-5.4、Gemini 3.1 Pro 和 DeepSeek V3.2 作为评委的盲测显示,Claude Opus 4.7 在 100 个问题中赢得了 69 场,性能优于 4.6 版本。测试覆盖多个领域,Claude Opus 4.7 在编程、推理和创意写作任务中均取得优势。
来源:大黑AI·模型动态
社区热议 Claude Design 工具及 Anthropic 迭代速度
用户惊叹 Anthropic 产品迭代速度,并介绍了由 Claude Opus 4.7 驱动的 Claude Design 工具,可将描述转为设计稿、PPT 等,支持多种输入和导出格式。该工具展示了 AI 在设计工作流中的实际应用潜力。
来源:大黑AI·技巧教程
OpenAI 高管离职并解散科学部门
OpenAI 高管 Kevin Weil 离职,同时公司解散科学部门,这是其内部组织结构的重大变动。该变化正值 OpenAI 推进商业化转型之际,引发社区对其战略方向的关注和讨论。
来源:大黑AI·行业资讯
AI 应用与落地
用户测试显示 Qwen 3.6 35B 优于 Gemma 4 26B
用户个人测试表明,在代码调试和文档分析任务上,Qwen 3.6 35B 的表现明显优于 Gemma 4 26B。测试涵盖多个实际场景,Qwen 3.6 在指令遵循和输出质量上均获得更高评价。
来源:大黑AI·模型动态
AWS 为 Bedrock 推出细粒度成本归因功能
Amazon Bedrock 现已支持细粒度成本归因,可将推理成本自动归属到发起调用的 IAM 主体(用户、角色或联合身份如 Okta/Entra ID),无需修改现有工作流程。成本数据写入 CUR 2.0,用户可通过 Cost Explorer 和成本分配标签按团队、项目或自定义维度聚合分析。该功能支持 IAM 用户、Bedrock API Key、IAM 角色及联邦用户等多种调用方式。
来源:AWS Blog
Deeplearning.ai 通讯讨论 Meta 战略转向等议题
最新一期 The Batch 通讯讨论了 Meta 从开放权重策略转向发布闭源模型 Muse Spark,该模型为原生多模态推理模型,支持工具调用和多智能体编排,在部分健康和多模态基准测试中表现领先,但编程和智能体任务表现不及预期。通讯还涉及大型药企投资 AI、监管碎片化及模拟人类队列等话题。