20260521 开源技术热点新闻资讯

:writing_hand: 核心总览:阿里云发布32款Agent新品与Qwen3.7-Max,智象未来推出两千亿参数图像大模型,OpenAI模型推翻离散几何核心猜想。LLVM 22.1.6发布,文档系统迁移至MyST Markdown。PyTorch修复多项Dynamo语义与MPS性能问题,Triton优化FP16/BF16 matmul与AMD CDNA4布局。


一、PyTorch 生态核心动态

内容摘要:MPS后端为Conv3d启用NDHWC+DHWIO快速路径,优化channels_last_3d内存布局下的卷积性能,提升Apple Silicon GPU执行效率。

内容摘要:修复Dynamo字典更新语义,确保动态编译下字典操作的Python语义一致性,避免意外行为。

内容摘要:修复AOT Inductor在共享动态维度场景下guard代码生成中的未定义符号问题,确保导出模型正确性。

内容摘要:修复MPS后端sort操作对bool/int-max/NaN输入返回越界索引的问题,确保排序结果正确性。


二、LLVM/MLIR 最新进展

内容摘要:LLVM 22.1.6版本正式发布,包含多项稳定性修复与性能优化,修复编译器工具链中的关键问题。

内容摘要:提议将LLVM文档格式从reStructuredText迁移至MyST Markdown,提升文档编写效率与维护性,现代化LLVM文档系统。

内容摘要:ARM后端将常量选择操作转换为算术运算,优化代码生成,减少分支指令,提升执行性能。

内容摘要:clang-format统一解析_typeof_unqual_与_typeof_语法,确保代码格式化对C23新语法的正确处理。

内容摘要:C++20协程采用C调用约定,确保协程跨语言调用的ABI兼容性,提升协程与其他语言交互能力。


三、Triton & TileLang 技术动态

内容摘要:Triton启用microscaled lhs配合密集FP16/BF16矩阵乘法权重,优化混合精度计算路径,提升数值计算效率。

内容摘要:AMD GLUON后端将compute_padded_layout_cdna4函数暴露至Python,方便开发者调用AMD CDNA4架构的布局计算。

内容摘要:修复Blackwell架构tensor memory存储中16x32bx2消息的对齐错误,确保张量内存操作正确性。

内容摘要:扩展Blackwell架构张量内存优化,提升新一代NVIDIA GPU的内存访问效率与计算吞吐。

内容摘要:TileLang Metal后端添加基于simdgroup_matrix的矩阵乘法支持,优化Apple Silicon GPU上的GEMM性能。


四、业界重磅新闻

内容摘要:阿里云宣布全栈Agent化升级,发布真武M890自研芯片、Qwen3.7-Max旗舰模型、Agentic Cloud基础设施及千问云等超50项新品,标志着阿里云从云服务商向Agent基础设施提供商的战略转型。

内容摘要:智象未来发布HiDream-O1-Image-Pro图像大模型,超两千亿参数原生全模态图像模型,并完成新一轮亿级融资,视觉生成商业化进程提速。

内容摘要:Google依托Gemini 3.5系列将传统搜索框升级为通用任务执行入口,深度嵌入Gmail、Docs、Android等全域产品生态,重塑全球用户的信息获取与任务执行方式。

内容摘要:OpenAI模型推翻离散几何核心猜想,展示AI在数学研究中的突破性能力,为AI辅助科学发现开辟新路径。

内容摘要:阿里巴巴发布Qwen3.7-Max旗舰模型,聚焦Agent应用场景,提供更强的规划、推理与多模态能力,推动大模型向智能体应用演进。

内容摘要:GitHub确认3800个仓库通过恶意VSCode扩展被入侵,攻击者利用扩展访问开发者仓库,引发开发者工具安全讨论。

1 个赞