2026年06月15日 AI 资讯速递

Jun 15, 2026

智谱推出GLM-5.2模型，支持1M上下文，模型长程任务领先，定位最强国产Coding模型。GLM-5.2 将面向 GLM Coding Plan 全量用户开放，覆盖 Lite / Pro / Max / 团队版。GLM-5.2 API 本周将上线，同时模型也将开源，遵循 MIT 协议。来源：智谱...

今日概览

智谱AI推出最新旗舰开源模型 GLM-5.2
大晓机器人完成天使+轮融资，已累计融资数亿美元
百度飞桨 PaddleOCR 开源第六代 OCR 模型 PP-OCRv6
EAGLE推测解码正式合并到llama.cpp
Nemotron等≤120B模型长上下文能力对比

大模型与产品发布

智谱AI推出最新旗舰开源模型 GLM-5.2

智谱推出GLM-5.2模型，支持1M上下文，模型长程任务领先，定位最强国产Coding模型。GLM-5.2 将面向 GLM Coding Plan 全量用户开放，覆盖 Lite / Pro / Max / 团队版。GLM-5.2 API 本周将上线，同时模型也将开源，遵循 MIT 协议。来源：智谱

来源：AI工具集

大晓机器人完成天使+轮融资，已累计融资数亿美元

大晓机器人完成天使+轮融资，上半年累计融资数亿美元，达晨财智、深创投等参投。资金将投入世界模型及软硬一体解决方案。开悟世界模型3.0为全球首个开源量产世界模型，多项权威评测第一，支持7分钟长时序视频生成，已实现端侧部署。来源：商汤科技SenseTime

来源：AI工具集

百度飞桨 PaddleOCR 开源第六代 OCR 模型 PP-OCRv6

百度飞桨正式推出PP-OCRv6，首次推出Tiny/Small/Medium三档模型。模型检测与识别精度较v5提升4.9%和5.1%，CPU推理速度最高达前代5.2倍。模型支持50种语言，新增电路板、数码管等工业场景，鲁棒性史上最高。模型现已上线官网并开源至GitHub和HuggingFace。来源：飞桨 PaddlePaddle

来源：AI工具集

Nemotron等≤120B模型长上下文能力对比

在128GB共享内存上对比Nemotron等4个≤120B模型，评估长上下文能力，发现部分模型性能衰减。[6] 来源: [6] https://www.reddit.com/r/LocalLLaMA/comments/1u5vqpl/nemotron_king_of_the_deep_comparison_of_4_models/

来源：大黑AI·模型动态

Pixel 10 Pro成功运行Gemma 12B模型

在Google Pixel 10 Pro上使用Termux运行Gemma 12B，功耗低于10瓦，达6.5pp 1.3tg，展示移动端运行中等模型的可行性。[4] 来源: [4] https://www.reddit.com/r/LocalLLaMA/comments/1u60l19/gemma_12b_less_than_10_watts_65pp_13tg/

来源：大黑AI·产品工具

开源AI代码审查工具lgtmaybe发布

lgtmaybe支持任意LLM提供商（含本地Ollama），并行审查并反射消除误报，保护隐私。项目地址：https://www.reddit.com/r/LocalLLaMA/comments/1u5yytz/building_lgtmaybe_a_pr_reviewer_for_any_model/[5] 来源: [5] https://www.reddit.com/r/LocalLLaMA/comments/1u5yytz/building_lgtmaybe_a_pr_reviewer_for_any_model/

来源：大黑AI·产品工具

27B小模型凭借Agent框架超越Anthropic Fable5

karminski-牙医分享Iterative-Contextual-Refinements框架，通过BFS探索+DFS优化+路由闭环，让Qwen3.6-27B在CGRE测试以95.5分超越Fable5的94.1分，代价是25-40x token消耗。框架：https://t.co/PuiNaqmUkE 论文：https://t.co/LHRC7qLjuG[1] 来源: [1] https://x.com/karminski3/status/2066301480609751089

来源：大黑AI·技巧教程

从零推导GPTQ量化补偿数学

Reddit用户从零推导GPTQ4-bit量化不破坏模型perplexity的原因——权重被视为相关而非独立变量，为量化理解提供理论基础。[3] 来源: [3] https://www.reddit.com/r/LocalLLaMA/comments/1u602zu/why_doesnt_4bit_gptq_wreck_a_models_perplexity_i/

来源：大黑AI·技巧教程

AI 应用与落地

EAGLE推测解码正式合并到llama.cpp

EAGLE推测解码支持已合并入llama.cpp，可显著加速本地推理，对部署和优化有重要意义。Reddit社区热议。[2] 来源: [2] https://www.reddit.com/r/LocalLLaMA/comments/1u5z4j0/eagle_support_merged_into_llamacpp/

来源：大黑AI·模型动态

Qwen 3.6 35B-A3B Q4 vs Gemma 4 12B Q8对比讨论

开发者在32GB统一内存设备上对比Qwen 3.6 35B-A3B Q4与Gemma 4 12B Q8，讨论量化对速度和能力的影响。[7] 来源: [7] https://www.reddit.com/r/LocalLLaMA/comments/1u5xd7x/qwen_36_35ba3b_q4_or_gemma_4_12b_q8/

来源：大黑AI·模型动态

AI不会取代软件工程师：Simon Willison发文反驳夸大叙事

Simon Willison发表长文探讨AI为何不会取代软件工程师，反驳夸大其词的叙事，对从业者具启发价值。链接：https://simonwillison.net/2026/Jun/14/why-ai-hasnt-replaced-software-engineers/[8] 来源: [8] https://simonwillison.net/2026/Jun/14/why-ai-hasnt-replaced-software-engineers/#atom-everything

来源：大黑AI·行业资讯