2026年06月15日 AI 资讯速递
智谱推出GLM-5.2模型,支持1M上下文,模型长程任务领先,定位最强国产Coding模型。GLM-5.2 将面向 GLM Coding Plan 全量用户开放,覆盖 Lite / Pro / Max / 团队版。GLM-5.2 API 本周将上线,同时模型也将开源,遵循 MIT 协议。来源:智谱...
今日概览
- 智谱AI推出最新旗舰开源模型 GLM-5.2
- 大晓机器人完成天使+轮融资,已累计融资数亿美元
- 百度飞桨 PaddleOCR 开源第六代 OCR 模型 PP-OCRv6
- EAGLE推测解码正式合并到llama.cpp
- Nemotron等≤120B模型长上下文能力对比
大模型与产品发布
智谱AI推出最新旗舰开源模型 GLM-5.2
智谱推出GLM-5.2模型,支持1M上下文,模型长程任务领先,定位最强国产Coding模型。GLM-5.2 将面向 GLM Coding Plan 全量用户开放,覆盖 Lite / Pro / Max / 团队版。GLM-5.2 API 本周将上线,同时模型也将开源,遵循 MIT 协议。来源:智谱
来源:AI工具集
大晓机器人完成天使+轮融资,已累计融资数亿美元
大晓机器人完成天使+轮融资,上半年累计融资数亿美元,达晨财智、深创投等参投。资金将投入世界模型及软硬一体解决方案。开悟世界模型3.0为全球首个开源量产世界模型,多项权威评测第一,支持7分钟长时序视频生成,已实现端侧部署。来源:商汤科技SenseTime
来源:AI工具集
百度飞桨 PaddleOCR 开源第六代 OCR 模型 PP-OCRv6
百度飞桨正式推出PP-OCRv6,首次推出Tiny/Small/Medium三档模型。模型检测与识别精度较v5提升4.9%和5.1%,CPU推理速度最高达前代5.2倍。模型支持50种语言,新增电路板、数码管等工业场景,鲁棒性史上最高。模型现已上线官网并开源至GitHub和HuggingFace。来源:飞桨 PaddlePaddle
来源:AI工具集
Nemotron等≤120B模型长上下文能力对比
在128GB共享内存上对比Nemotron等4个≤120B模型,评估长上下文能力,发现部分模型性能衰减。[6] 来源: [6] https://www.reddit.com/r/LocalLLaMA/comments/1u5vqpl/nemotron_king_of_the_deep_comparison_of_4_models/
来源:大黑AI·模型动态
Pixel 10 Pro成功运行Gemma 12B模型
在Google Pixel 10 Pro上使用Termux运行Gemma 12B,功耗低于10瓦,达6.5pp 1.3tg,展示移动端运行中等模型的可行性。[4] 来源: [4] https://www.reddit.com/r/LocalLLaMA/comments/1u60l19/gemma_12b_less_than_10_watts_65pp_13tg/
来源:大黑AI·产品工具
开源AI代码审查工具lgtmaybe发布
lgtmaybe支持任意LLM提供商(含本地Ollama),并行审查并反射消除误报,保护隐私。项目地址:https://www.reddit.com/r/LocalLLaMA/comments/1u5yytz/building_lgtmaybe_a_pr_reviewer_for_any_model/[5] 来源: [5] https://www.reddit.com/r/LocalLLaMA/comments/1u5yytz/building_lgtmaybe_a_pr_reviewer_for_any_model/
来源:大黑AI·产品工具
27B小模型凭借Agent框架超越Anthropic Fable5
karminski-牙医分享Iterative-Contextual-Refinements框架,通过BFS探索+DFS优化+路由闭环,让Qwen3.6-27B在CGRE测试以95.5分超越Fable5的94.1分,代价是25-40x token消耗。框架:https://t.co/PuiNaqmUkE 论文:https://t.co/LHRC7qLjuG[1] 来源: [1] https://x.com/karminski3/status/2066301480609751089
来源:大黑AI·技巧教程
从零推导GPTQ量化补偿数学
Reddit用户从零推导GPTQ4-bit量化不破坏模型perplexity的原因——权重被视为相关而非独立变量,为量化理解提供理论基础。[3] 来源: [3] https://www.reddit.com/r/LocalLLaMA/comments/1u602zu/why_doesnt_4bit_gptq_wreck_a_models_perplexity_i/
来源:大黑AI·技巧教程
AI 应用与落地
EAGLE推测解码正式合并到llama.cpp
EAGLE推测解码支持已合并入llama.cpp,可显著加速本地推理,对部署和优化有重要意义。Reddit社区热议。[2] 来源: [2] https://www.reddit.com/r/LocalLLaMA/comments/1u5z4j0/eagle_support_merged_into_llamacpp/
来源:大黑AI·模型动态
Qwen 3.6 35B-A3B Q4 vs Gemma 4 12B Q8对比讨论
开发者在32GB统一内存设备上对比Qwen 3.6 35B-A3B Q4与Gemma 4 12B Q8,讨论量化对速度和能力的影响。[7] 来源: [7] https://www.reddit.com/r/LocalLLaMA/comments/1u5xd7x/qwen_36_35ba3b_q4_or_gemma_4_12b_q8/
来源:大黑AI·模型动态
AI不会取代软件工程师:Simon Willison发文反驳夸大叙事
Simon Willison发表长文探讨AI为何不会取代软件工程师,反驳夸大其词的叙事,对从业者具启发价值。链接:https://simonwillison.net/2026/Jun/14/why-ai-hasnt-replaced-software-engineers/[8] 来源: [8] https://simonwillison.net/2026/Jun/14/why-ai-hasnt-replaced-software-engineers/#atom-everything
来源:大黑AI·行业资讯