2026年06月15日 AI 资讯速递

智谱推出GLM-5.2模型,支持1M上下文,模型长程任务领先,定位最强国产Coding模型。GLM-5.2 将面向 GLM Coding Plan 全量用户开放,覆盖 Lite / Pro / Max / 团队版。GLM-5.2 API 本周将上线,同时模型也将开源,遵循 MIT 协议。来源:智谱...

今日概览

  • 智谱AI推出最新旗舰开源模型 GLM-5.2
  • 大晓机器人完成天使+轮融资,已累计融资数亿美元
  • 百度飞桨 PaddleOCR 开源第六代 OCR 模型 PP-OCRv6
  • EAGLE推测解码正式合并到llama.cpp
  • Nemotron等≤120B模型长上下文能力对比

大模型与产品发布

智谱AI推出最新旗舰开源模型 GLM-5.2

智谱推出GLM-5.2模型,支持1M上下文,模型长程任务领先,定位最强国产Coding模型。GLM-5.2 将面向 GLM Coding Plan 全量用户开放,覆盖 Lite / Pro / Max / 团队版。GLM-5.2 API 本周将上线,同时模型也将开源,遵循 MIT 协议。来源:智谱

来源:AI工具集

大晓机器人完成天使+轮融资,已累计融资数亿美元

大晓机器人完成天使+轮融资,上半年累计融资数亿美元,达晨财智、深创投等参投。资金将投入世界模型及软硬一体解决方案。开悟世界模型3.0为全球首个开源量产世界模型,多项权威评测第一,支持7分钟长时序视频生成,已实现端侧部署。来源:商汤科技SenseTime

来源:AI工具集

百度飞桨 PaddleOCR 开源第六代 OCR 模型 PP-OCRv6

百度飞桨正式推出PP-OCRv6,首次推出Tiny/Small/Medium三档模型。模型检测与识别精度较v5提升4.9%和5.1%,CPU推理速度最高达前代5.2倍。模型支持50种语言,新增电路板、数码管等工业场景,鲁棒性史上最高。模型现已上线官网并开源至GitHub和HuggingFace。来源:飞桨 PaddlePaddle

来源:AI工具集

Nemotron等≤120B模型长上下文能力对比

在128GB共享内存上对比Nemotron等4个≤120B模型,评估长上下文能力,发现部分模型性能衰减。[6] 来源: [6] https://www.reddit.com/r/LocalLLaMA/comments/1u5vqpl/nemotron_king_of_the_deep_comparison_of_4_models/

来源:大黑AI·模型动态

Pixel 10 Pro成功运行Gemma 12B模型

在Google Pixel 10 Pro上使用Termux运行Gemma 12B,功耗低于10瓦,达6.5pp 1.3tg,展示移动端运行中等模型的可行性。[4] 来源: [4] https://www.reddit.com/r/LocalLLaMA/comments/1u60l19/gemma_12b_less_than_10_watts_65pp_13tg/

来源:大黑AI·产品工具

开源AI代码审查工具lgtmaybe发布

lgtmaybe支持任意LLM提供商(含本地Ollama),并行审查并反射消除误报,保护隐私。项目地址:https://www.reddit.com/r/LocalLLaMA/comments/1u5yytz/building_lgtmaybe_a_pr_reviewer_for_any_model/[5] 来源: [5] https://www.reddit.com/r/LocalLLaMA/comments/1u5yytz/building_lgtmaybe_a_pr_reviewer_for_any_model/

来源:大黑AI·产品工具

27B小模型凭借Agent框架超越Anthropic Fable5

karminski-牙医分享Iterative-Contextual-Refinements框架,通过BFS探索+DFS优化+路由闭环,让Qwen3.6-27B在CGRE测试以95.5分超越Fable5的94.1分,代价是25-40x token消耗。框架:https://t.co/PuiNaqmUkE 论文:https://t.co/LHRC7qLjuG[1] 来源: [1] https://x.com/karminski3/status/2066301480609751089

来源:大黑AI·技巧教程

从零推导GPTQ量化补偿数学

Reddit用户从零推导GPTQ4-bit量化不破坏模型perplexity的原因——权重被视为相关而非独立变量,为量化理解提供理论基础。[3] 来源: [3] https://www.reddit.com/r/LocalLLaMA/comments/1u602zu/why_doesnt_4bit_gptq_wreck_a_models_perplexity_i/

来源:大黑AI·技巧教程

AI 应用与落地

EAGLE推测解码正式合并到llama.cpp

EAGLE推测解码支持已合并入llama.cpp,可显著加速本地推理,对部署和优化有重要意义。Reddit社区热议。[2] 来源: [2] https://www.reddit.com/r/LocalLLaMA/comments/1u5z4j0/eagle_support_merged_into_llamacpp/

来源:大黑AI·模型动态

Qwen 3.6 35B-A3B Q4 vs Gemma 4 12B Q8对比讨论

开发者在32GB统一内存设备上对比Qwen 3.6 35B-A3B Q4与Gemma 4 12B Q8,讨论量化对速度和能力的影响。[7] 来源: [7] https://www.reddit.com/r/LocalLLaMA/comments/1u5xd7x/qwen_36_35ba3b_q4_or_gemma_4_12b_q8/

来源:大黑AI·模型动态

AI不会取代软件工程师:Simon Willison发文反驳夸大叙事

Simon Willison发表长文探讨AI为何不会取代软件工程师,反驳夸大其词的叙事,对从业者具启发价值。链接:https://simonwillison.net/2026/Jun/14/why-ai-hasnt-replaced-software-engineers/[8] 来源: [8] https://simonwillison.net/2026/Jun/14/why-ai-hasnt-replaced-software-engineers/#atom-everything

来源:大黑AI·行业资讯