当前位置:主页 > 财经 > 经济 > 国产大模型新年动作频频:智谱联手华为开源新模型 MiniMax开源评测集

国产大模型新年动作频频:智谱联手华为开源新模型 MiniMax开源评测集

2026-01-26 16:00:01来源:澎湃新闻

文章导读
AI产业的迭代可谓日新月异,2026年甫一开始,国产开源大模型就进入了“上新潮”。 1月14日,澎湃新闻记者获悉,最近上市的AI独角兽智谱(02513.HK)联合华为开源新一代图像生成模型GLM-Image,...

  AI产业的迭代可谓日新月异,2026年甫一开始,国产开源大模型就进入了“上新潮”。

  1月14日,澎湃新闻记者获悉,最近上市的AI独角兽智谱(02513.HK)联合华为开源新一代图像生成模型GLM-Image,模型基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成从数据到训练的全流程,是首个在国产芯片上完成全程训练的SOTA多模态模型。

  据智谱方面介绍,GLM-Image 采用自主创新的“自回归+扩散解码器”混合架构,实现图像生成与语言模型的联合,是智谱面向以Nano Banana Pro为代表的新一代“认知型生成”技术范式的一次重要探索。

  在架构特点方面,面对传统模型在“理解复杂指令”与“精准绘制文字”上难以兼顾的问题,GLM-Image引入“自回归+扩散解码器”混合架构,融合9B的自回归模型与7B的DiT扩散解码器。通过改进Tokenizer策略,GLM-Image能够自适应处理多种分辨率,原生支持从1024x1024到2048×2048尺寸的任意比例图像的生成任务,无需重新训练。

  值得注意的是,在上市后智谱股价持续迎来飙升,截至14日港股午盘,涨16.83%,其发行价定为116.2港元/股,这也意味着上市后智谱股价已经大涨超80%。

  在和华为合作方面,据智谱披露,依托昇腾NPU和昇思MindSpore AI框架,使用动态图多级流水下发、高性能融合算子、多流并行等特性,公司自研模型训练套件,完整优化数据预处理、预训练、SFT和RL的端到端流程。

  通过动态图的多级流水优化机制,将Host侧算子下发的关键阶段流水化并高度重叠,消除下发瓶颈;通过多流并行策略,通信和计算互掩,打破文本梯度同步、图像特征广播等操作的通信墙,使用AdamW EMA、COC、RMS Norm等昇腾亲和的高性能融合算子,同步提升训练的稳定性和性能。

  据了解,GLM-Image是首个在国产芯片上完成全流程训练的SOTA多模态模型,验证在国产全栈算力底座上训练高性能多模态生成模型的可行性。

  不仅仅是智谱。多家中国AI企业新年以来动作频频。同样在1月14日,澎湃新闻记者获悉,MiniMax正式开源首个面向Coding Agent的系统性评测集OctoCodingBench,试图为下一代AGI的落地标准给出更清晰的谜底。评测结果显示,部分开源模型在过程合规指标上已快速逼近甚至超越部分闭源模型。

  1月12日,DeepSeek发布一篇新论文《Conditional Memory via Scalable Lookup:A New Axis of Sparsity for Large Language Models》(基于可扩展查找的条件记忆:大语言模型稀疏性的新维度),梁文锋位列作者名单中,这篇论文为北京大学和DeepSeek共同完成。据分析,这篇论文的核心直指当前大语言模型存在的记忆力“短板”,提出了“条件记忆”这一概念。

  行业普遍猜测,DeepSeek的下一代模型V4或将在今年春节前后正式发布。

  此外,爱诗科技发布最新视频模型PixVerse R1,是全球首个支持最高1080P分辨率通用实时世界模型,据介绍,这款新模型首次将视频生成的延迟从“秒级”降至“即时”响应,实现“所想即所见、所说即所现”的实时交互体验,标志AIGC领域的视频生成从“静态输出”迈入“实时交互”的全新阶段。PixVerse R1通过实现连贯且实时的生成,代表全世界范围内视听媒体领域的重要演进。

  1月13日,沉寂已久的另一家大模型独角兽“百川智能”宣布开源新一代医疗大模型 Baichuan—M3,其在全球最权威的医疗AI评测HealthBench中以65.1分的综合成绩位列全球第一;在专门考验复杂决策能力的HealthBench Hard上,以44.4分的成绩夺冠。这一成绩首次在医疗领域实现对GPT-5.2的超越。

  对于近期的大模型热潮,百川智能创始人兼CEO、原搜狗CEO王小川当天在接受媒体采访时表示,“上市的两家(智谱、MiniMax)是踩在了通用模型的技术红利和国家对于科技强国扶持的基础上,这方向是没有问题的,只是他们的市值和商业化能力并不匹配。”

  王小川表示,融易新媒体消息,未来百川也会走到上市这条道路上,但并没有在进程中,他透露可能会在2027年启动上市计划。目前公司账上还有30亿元。


免责声明
融易新媒体转载此文目的在于传递更多信息,不代表本网的观点和立场。文章内容仅供参考,不构成投资建议。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
热门文章
日榜 周榜
1 “彭十六”偷税216.32万元 税务部门揭秘2起网络主播偷税案

税务部门今天揭秘2起网络主播偷税案件。经查,网络主播彭煊之,于2021年至2023年期间,从事...

2 国产大模型新年动作频频:智谱联手华为开源新模型 MiniMax开源

AI产业的迭代可谓日新月异,2026年甫一开始,国产开源大模型就进入了“上新潮”。 1月14日,...

3 《固体废物综合治理行动计划》出台 如何构建“无废未来”?

加强固体废物综合治理,是推进美丽中国建设、加快经济社会发展完整绿色转型的重要举措。...

4 我国连续13年位居全球最大网络零售市场

记者从1月13日至14日在北京召开的全国电子商务工作会议上获悉,我国数字消费整体规模超23...

5 三部门规范新能源汽车产业竞争秩序相关工作

1月14日,工业和信息化部装备工业一司、国家发展改革委产业发展司、市场监管总局价格监督...

6 中国汽车产业迎来逻辑转换分水岭

1月14日,中国汽车工业协会发布的数据显示,中国汽车2025年全年销量达3440万辆、产量3453.1万辆...

7 利好频出促工业互联网与人工智能融合赋能

1月13日,工业和信息化部印发《推动工业互联网平台高质量发展行动方案(2026—2028年)》(以下简...

8 存储器迎“超级周期” 存储封装测试市场景气度攀升

全球存储器市场步入“超级周期”,涨价趋势已蔓延至下游封测环节。近日,多家有存储封装...

9 两条主线支撑2025年汽车产销规模再创新高

在政策支持、供给端持续丰富与基础设施改善等多重因素共同作用下,2025年我国汽车产业延续...

10 2025年我国汽车产销量均突破3400万辆 实现超预期增长

1月14日,中国证券报记者从中国汽车工业协会月度信息发布会上获悉,2025年,中国汽车产销累...

1 “彭十六”偷税216.32万元 税务部门揭秘2起网络主播偷税案

税务部门今天揭秘2起网络主播偷税案件。经查,网络主播彭煊之,于2021年至2023年期间,从事...

2 国产大模型新年动作频频:智谱联手华为开源新模型 MiniMax开源

AI产业的迭代可谓日新月异,2026年甫一开始,国产开源大模型就进入了“上新潮”。 1月14日,...

3 《固体废物综合治理行动计划》出台 如何构建“无废未来”?

加强固体废物综合治理,是推进美丽中国建设、加快经济社会发展完整绿色转型的重要举措。...

4 我国连续13年位居全球最大网络零售市场

记者从1月13日至14日在北京召开的全国电子商务工作会议上获悉,我国数字消费整体规模超23...

5 三部门规范新能源汽车产业竞争秩序相关工作

1月14日,工业和信息化部装备工业一司、国家发展改革委产业发展司、市场监管总局价格监督...

6 中国汽车产业迎来逻辑转换分水岭

1月14日,中国汽车工业协会发布的数据显示,中国汽车2025年全年销量达3440万辆、产量3453.1万辆...

7 利好频出促工业互联网与人工智能融合赋能

1月13日,工业和信息化部印发《推动工业互联网平台高质量发展行动方案(2026—2028年)》(以下简...

8 存储器迎“超级周期” 存储封装测试市场景气度攀升

全球存储器市场步入“超级周期”,涨价趋势已蔓延至下游封测环节。近日,多家有存储封装...

9 两条主线支撑2025年汽车产销规模再创新高

在政策支持、供给端持续丰富与基础设施改善等多重因素共同作用下,2025年我国汽车产业延续...

10 2025年我国汽车产销量均突破3400万辆 实现超预期增长

1月14日,中国证券报记者从中国汽车工业协会月度信息发布会上获悉,2025年,中国汽车产销累...

备案号:鄂ICP备2022012449号-6 Copyright © 2002-2024 关于我们 网站地图