• 2025-04-30 14:38:45
  • 阅读(4748)
  • 评论(50)
  • 券商机构分(fen)析认为,国内(nei)外大(da)模型(xing)能力(li)差(cha)距缩(suo)小,国产算力(li)芯片连续进化,国内(nei)头部互联网厂商加大(da)Capex投(tou)入,为国内(nei)AI包围之路奠基了基石。伴随(sui)国内(nei)外巨头大(da)模型(xing)连续迭代,C端或有(you)望迎来杀手级应(ying)用。

    全线大(da)涨(zhang)

    4月30日,小米系全线拉升,小米集(ji)团盘中一(yi)度(du)大(da)涨(zhang)超5%,金(jin)山云(yun)一(yi)度(du)大(da)涨(zhang)超18%,金(jin)山软件最低落(zhang)超6%。

    与此同时,港股云(yun)计(ji)算板(ban)块连续拉升,截至午间开盘,金(jin)蝶国际涨(zhang)4.7%,中国软件国际涨(zhang)2.72%,阿里巴巴-W涨(zhang)1.48% ‍

    据“小米大(da)模型(xing)”公(gong)众(zhong)号消息,今(jin)日,小米开源首个为推理(Reasoning)而生的大(da)模型(xing)“Xiaomi MiMo”,联动预(yu)训练到后训练,全面提拔推理能力(li)。

    据介绍,在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公(gong)开测评集(ji)上,MiMo以7B的参数规模,超出了OpenAI的闭(bi)源推理模型(xing)o1-mini和阿里Qwen更(geng)大(da)规模的开源推理模型(xing)QwQ-32B-Preview。

    展开剩余 73 %

    官(guan)方称,在相同RL训练数据环境下,MiMo-7B的数学&代码领域的强化进修潜(qian)力(li)显著领先。iMo-7B全系列模型(xing)均已开源。

    小米技术团队表(biao)示,MiMo的核心(xin)突破在于预(yu)训练与后训练阶段的协同优(you)化。在预(yu)训练阶段,模型(xing)经过挖(wa)掘高质量(liang)推理语(yu)料并合成(cheng)约2000亿tokens专项数据,采用三阶段渐(jian)进训练策略,累计(ji)训练量(liang)达25万亿tokens。

    后训练阶段则(ze)引入创新强化进修技术,包括自研的“Test Difficulty Driven Reward”算法和“Easy Data Re-Sampling”策略,有(you)效提拔模型(xing)在复杂任务中的波动性。技术团队还开辟了“Seamless Rollout”系统,使训练效率提拔2.29倍,验证(zheng)速率(du)加快1.96倍。

    值(zhi)得注意的是,小米官(guan)方表(biao)示,MiMo-7B在相同强化进修训练数据下,数学与代码领域的表(biao)现显著优(you)于以后业界广泛使用的DeepSeek-R1-Distill-7B和Qwen2.5-32B模型(xing)。

    目前,小米已在HuggingFace平台开源MiMo-7B全系列4个模型(xing),并发布详细技术报告。

    值(zhi)得一(yi)提的是,就在小米宣告“Xiaomi Mimo”开源前,阿里巴巴通义千问于4月29日凌晨发布了新版Qwen 3 系列模型(xing),包括2个MoE模型(xing)和6个dense模型(xing)。

    通义千问表(biao)示,作为Qwen系列全新一(yi)代的混合推理模型(xing),Qwen 3在GPQA、AIME24/25、LiveCodeBench等多个权(quan)威评测中表(biao)现出极具竞争(zheng)力(li)的结果。在相同计(ji)算资源下,Qwen 3模型(xing)以更(geng)小的规模完成了对更(geng)大(da)体量(liang)上一(yi)代模型(xing)的超出,真正做到了“小而强大(da)”。

    Qwen 3融合了推理与非推理能力(li),在逻辑分(fen)析和创意天生(cheng)等任务中表(biao)现卓越。预(yu)训练数据量(liang)达到约36万亿 tokens,并经过量轮大(da)规模强化进修与精细优(you)化,在推理、工具调用、指令遵守及多语(yu)言能力(li)等方面显著提拔。

    “AI大(da)模型(xing)大(da)战(zhan)”复兴(qi)

    值(zhi)得注意的是,AI大(da)模型(xing)竞争(zheng)再度(du)进入白热化。

    2025年以来,环球(qiu)AI大(da)模型(xing)的竞争(zheng)愈发激烈,据不完全统计(ji),在已往119天内(nei),中美十家主要大(da)模型(xing)公(gong)司就发布或更(geng)新了14款基础大(da)模型(xing)。

    国际市(shi)场调研机构Artificial Analysis发布的报告表现,美国大(da)模型(xing)虽然目前还领先,但中国的差(cha)距在赓续缩(suo)小。

    西部证(zheng)券指出,AI大(da)模型(xing)能力(li)提拔和使用成(cheng)本下降是主旋律,多模态或逐(zhu)步成(cheng)为未(wei)来基础模型(xing)的标配,进一(yi)步拉动算力(li)需求。国内(nei)外大(da)模型(xing)能力(li)差(cha)距缩(suo)小,国产算力(li)芯片连续进化,国内(nei)头部互联网厂商加大(da)Capex投(tou)入,为国内(nei)AI包围之路奠基了基石。

    开源证(zheng)券认为,AI Agent为以大(da)语(yu)言模型(xing)(LLM)为驱(qu)动,具有(you)自主理解、感知、规划、记忆和使用工具的能力(li),能自动实行复杂任务的系统。不同于传统人工智能,AI Agent具有经过独立思考、调用工具逐(zhu)步完成(cheng)给定目标的能力(li)。看好(hao)AI Agent应(ying)用将在2025年多点开花,其中AI Agent有(you)望在B端率先商业化,电商、营销、CRM、金(jin)融、法律等场景加速落(luo)地(di)。伴随(sui)国内(nei)外巨头大(da)模型(xing)连续迭代,C端或有(you)望迎来杀手级应(ying)用。

    天风证(zheng)券表(biao)示,通义千问体系在模型(xing)能力(li)、硬件能力(li)及生态建设上保持领先,已完成全模态笼盖,成(cheng)为环球(qiu)最大(da)模型(xing)开源生态。其自主算力(li)体系较强,笼盖通用计(ji)算与智算需求,在自主可控行业具有(you)优(you)势。AI Agent市(shi)场规模有(you)望超万亿,通义千问凭借在B端资源禀赋及深厚(hou)技术积(ji)淀,已发布多行业垂直生态体系,有(you)望成(cheng)为B端Agent链主,相关(guan)生态体系公(gong)司或将受益。

    责编:战(zhan)术恒

    排版:王璐璐

    校正:陶谦 ‍‍‍

    发布于:广东省
    29  收藏