欙鳇茽餐新闻网
新京(jing)报(bao)贝壳财经记者 罗(luo)亦(yi)丹(dan) 编辑 王进雨 校正 杨许(xu)丽
人工智能是(shi)年(nian)轻(qing)的事业,也是(shi)年(nian)轻(qing)人的事业。
清程极智联合创始人师天麾正成为这句(ju)话的一(yi)个生动的注脚,而他的经历也是(shi)以后中国年(nian)轻(qing)一(yi)代AI高端人才的缩影(ying)——高中拿(na)下信息学奥(ao)林匹克竞赛金奖保送清华大学,大学确定了系(xi)统和高性能计算的研究方向(xiang),博士(shi)卒业后成为中国科(ke)学院计算技术研究所课程讲师、中国信通(tong)院万卡智算集(ji)群服务能力推进方阵技术专(zhuan)家。
▲清程极智联合创始人师天麾。受访者供图
多个身(shen)份(fen)标签加持,互联网大厂曾向(xiang)师天麾抛出高薪的橄榄枝,他最终(zhong)却选择自己(ji)创业,理由也很简(jian)单,“做一(yi)些没有同(tong)的事”。在他眼中,大厂“老板安排”和KPI均是(shi)束缚,立异将难以(yi)开展。
在AI圈(quan),年(nian)轻(qing)的身(shen)影(ying)已然(ran)显眼。2024年(nian)异军突起的Kimi由90后杨植麟领军,2025年(nian)席卷环球的DeepSeek核心团队成员为清北的应(ying)届卒业生组(zu)成。根据猎聘大数据研究院报(bao)告,近一(yi)年(nian)AI技术活跃人才中,30岁(sui)以(yi)下的人才占比59.90%。
展开剩余 87 %如今(jin),创立一(yi)年(nian)多时候,清程极智已同(tong)时入驻上海(hai)“模速空(kong)间”和北京(jing)“人工智能立异街区”,这个清华系(xi)AI Infra(人工智能基(ji)础设施)立异企(qi)业,员工平均年(nian)龄没有到30岁(sui)。
作为一(yi)名95后,师天麾的身(shen)上看(kan)没有到老一(yi)辈人心中那座名为“技术差距”的大山(shan)。面对新京(jing)报(bao)AI研究院关于算力、立异等问题时,师天麾坦言,英伟达(da)从建(jian)立起CUDA到很多人用,其实(shi)也没有很久。国产芯片只需解决好(hao)更好(hao)用的问题,以(yi)海内的工业制造能力,将以(yi)超高性价比在竞争中胜(sheng)出。
他所在的这支由清华计算机系(xi)师兄弟(di)组(zu)建(jian)的团队,既是(shi)中国AI重生代的典范样本,也是(shi)破解国产算力短缺的探路(lu)者,开源的大模型推理引擎“赤兔(tu)”通(tong)过底层技术革新,实(shi)现了大多数老旧英伟达(da)GPU和国产芯片对原生FP8模型的高效安排,从而可以或许运行DeepSeek满血版(ban)。当环球AI竞赛进入算力攻坚阶段,年(nian)轻(qing)团队正在为国产芯片与大模型之间架起一(yi)座“通(tong)天塔”,在英伟达(da)主导的算力版(ban)图中撕开一(yi)道立异裂缝。
━━━━━
创业
代码写得特别快的愉悦
新京(jing)报(bao)AI研究院:你最早(zao)打仗AI是(shi)甚么时候(hou),为何(he)选择了这个行业?
师天麾:我最早(zao)打仗AI要追溯到初高中到场信息学奥(ao)林匹克竞赛小组(zu)的时候(hou),当时的学习内容主要为“算法和数据结(jie)构”。之以是(yi)学习奥(ao)赛,主要是(shi)对计算机感兴趣,还能偷偷打游戏。高二的暑假(jia),我获得了2014全国青少年(nian)信息学奥(ao)林匹克竞赛金牌,保送了清华大学计算机系(xi)。
在我的大学期间,人工智能已经迎来了以(yi)智能驾(jia)驶和CV(计算机视(shi)觉)为主的第一(yi)波(bo)浪潮(chao),大二时,我还没想好(hao)将来是(shi)就业还是(shi)从事科(ke)研,于是(shi)去了智能驾(jia)驶企(qi)业Momenta实(shi)习研究算法。经过工作实(shi)践,我发现人工智能算法的“黑(hei)箱”特性致使(zhi)可解释性没有强,这无法给我很高的造诣感。大三时,我去商汤科(ke)技的高性能计算部分(men)进行了尝(chang)试,才找到了自己(ji)真(zhen)正的兴趣所在。
实(shi)际(ji)上,信息学奥(ao)林匹克竞赛本身(shen)就对程序运行的时候有要求,这也让我对“把一(yi)份(fen)代码写得特别快”很感兴趣,最终(zhong)我成为清华大学高性能计算研究所翟季(ji)冬先生的博士(shi)。在博士(shi)研究过程当中,多年(nian)积累也为创业供应了条件。2023年(nian),我们清程极智成立,主要以(yi)清华计算机系(xi)高性能计算所的师兄弟(di)为班底,清程主要做AI Infra。
简(jian)单来讲,AI Infra是(shi)连接硬件与AI算法之间的“中间层”,通(tong)过我们的软件,客户(hu)可以(yi)在相同(tong)的硬件资源上实(shi)现更快的推理速率和更高的并发性能,实(shi)现AI应(ying)用落地更高效、更低成本,让国产硬件也能“比肩”英伟达(da)。
新京(jing)报(bao)AI研究院:清程极智的员工非常年(nian)轻(qing),团队为何(he)是(shi)如许的组(zu)合?
师天麾:我们团队30岁(sui)以(yi)上的人很少,只要三名80后。年(nian)龄最大的为1985年(nian)出生,最小的则是(shi)一(yi)名已经保送清华的高三实(shi)习生。比拟学校更着重(zhong)理论基(ji)础学习,企(qi)业可以(yi)真(zhen)正让理论学以(yi)致(zhi)用。当我们把一(yi)个实(shi)际(ji)问题足够细(xi)化(hua),最后就会变(bian)成一(yi)个题目,交给这名高三实(shi)习生后,他用一(yi)两地利间就做完了一(yi)周的工作,并且反应说终(zhong)于明白(bai)了在学校学习的计算机理论基(ji)础“有甚么用”。
我们团队年(nian)轻(qing)的原因一(yi)方面是(shi)所在的行业比较热门(men),团队技术背景也很好(hao),对同(tong)学们挺有吸收力的,以是(yi)一(yi)些刚出校门(men)的同(tong)学就到场清程了。另一(yi)方面,其实(shi)AI Infra研究相关职位并没有好(hao)招人,比拟算法,我们的工作更加偏方向(xiang)底层,圈(quan)子“就这么大”。以是(yi),我们也愿意招一(yi)些有想法、有热忱、基(ji)础扎实(shi)、学习能力强的年(nian)轻(qing)人进行培养,有些甚至是(shi)在校生。同(tong)时,AI行业本身(shen)也比较年(nian)轻(qing),有些担起重(zhong)任的技术大佬(lao)也是(shi)95后甚至00后,也就是(shi)互联网原住民一(yi)代。
新京(jing)报(bao)AI研究院:从你进入清华到现在,已经过去了十年(nian),这期间AI技术已经经历了至少两轮浪潮(chao),对此有甚么感觉?怎么看(kan)待热点变(bian)化(hua)对学生选择专(zhuan)业的影(ying)响?
师天麾:当我决定走高性能算力这条路(lu)时,技术热点的变(bian)化(hua)对我就影(ying)响没有大了。由于没有论是(shi)CV、大模型,还是(shi)再(zai)往前的云计算、超算,哪一(yi)项技术火爆,只需用的人多起来,成本在一(yi)定程度上就会变(bian)高,都需要通(tong)过高性能计算来加速、降本。
入校时火爆的热点,可能卒业时没有一(yi)定再(zai)热。但学生只需打牢基(ji)础,无论未来甚么热点火爆,高性能计算的能力都可以(yi)很好(hao)地运用进去。
━━━━━
商机
从训练转向(xiang)推理,踩点DeepSeek爆火
新京(jing)报(bao)AI研究院:今(jin)年(nian)1月底开始,DeepSeek爆火,作为从事算力研究的AI Infra公司,你们受到了怎样的影(ying)响?
师天麾:春节(jie)期间翻开手机,同伙圈(quan)随处都是(shi)DeepSeek的消息。很多去年(nian)和我们合作的国产公司开始密集(ji)和我们探讨怎样快速适配DeepSeek。春节(jie)期间,我们和这些公司几乎天天都在沟通(tong)。
DeepSeek采用MoE(混合专(zhuan)家模型)架构,我们在前几年(nian)MoE刚出现时就判断它会成为未来的重(zhong)要趋向,因此进行了MoE模型训练、推理加速的技术积累,也发表了一(yi)些国际(ji)顶级会议的论文。
清程极智的客户(hu)生态主要包括硬件厂商、大模型研发企(qi)业以(yi)及有数字(zi)化(hua)转型需求的企(qi)业。去年(nian),大模型训练的需求高于推理的需求,但随着DeepSeek出现,企(qi)业对推理服务的需求正超越传统的训练需求,而我们推出的DeepSeek一(yi)体机以(yi)低技术门(men)槛(kan),让企(qi)业在无需专(zhuan)业AI团队支持的环境(jing)下也能安排并利用大模型,作用类似于AI领域的“傻瓜相机”。
我们做推理的优势很大,由于DeepSeek需要多机器推理,涉(she)及上层并行计算的优化(hua),这方面我们有面向(xiang)超大规模国产算力集(ji)群研制的大模型训练系(xi)统“八卦炉(lu)”,计算能力已扩大到10万台服务器超大规模集(ji)群,以是(yi)在多机并行计算、通(tong)信优化(hua)等方面履历丰富,将这一(yi)数目级的集(ji)群优化(hua)履历放到几台机器上,做起来非常随手。
现在,我们的一(yi)体机产物安排较多的模型主要有DeepSeek、智谱GLM 、Qwen和llama等支流(liu)模型。
新京(jing)报(bao)AI研究院:进展大模型,算力是(shi)一(yi)个绕没有开的话题。英伟达(da)在这一(yi)领域经营(ying)多年(nian),甚至衡量一(yi)家企(qi)业的算力往往是(shi)看(kan)其拥有若干张“英伟达(da)卡”。你的进展愿景会是(shi)成为下一(yi)个英伟达(da)吗?
师天麾:比拟于成为英伟达(da),我们的定位更类似于赞助国产芯片比肩英伟达(da)。让国产芯片以(yi)及老旧英伟达(da)芯片的能力达(da)到和英伟达(da)新版(ban)芯片一(yi)样。今(jin)年(nian)初,清程极智与清华配合(tong)开源了大模型推理引擎“赤兔(tu)”(chitu),通(tong)过赤兔(tu)的安排,让英伟达(da)老卡旧卡及国产芯片可以(yi)支持FP8精度模型,从而可以或许运行DeepSeek满血版(ban)。下一(yi)步,我们也将尝(chang)试让CPU服务器也能高效运行大模型。
以后,国产硬件正在逐步变(bian)成熟,但这需要一(yi)定的过程,比如我们在利用国产硬件时会发现一(yi)些底层Bug,此时我们会和对方进行反应。
其实(shi),英伟达(da)从建(jian)立起CUDA生态到很多人用,时候上也没有很久,其崛起的主要因素是(shi)赶(gan)上了GPU适配AI训练推理的技术盈余期。以是(yi)归根结(jie)底,这还是(shi)国产生态的问题——没有一(yi)定需要一(yi)味(wei)在硬件上追逐赶(gan)超,通(tong)过软硬协同(tong)一(yi)样能让国产显卡更好(hao)用,以(yi)我国在工业制造领域强大的产业化(hua)能力,参(can)照手机、汽车等行业的演进轨迹,完整具备在合理周期内实(shi)现显卡产物的性价比突破。
以后,很多央国企(qi)已批量采购国产显卡装备,但实(shi)际(ji)安排时仍依赖海(hai)外推理引擎,而部分(fen)前瞻(zhan)性客户(hu)已启动专(zhuan)项采购流(liu)程,将国产推理引擎纳入采购流(liu)程,这标志着市场对纯国产技术栈(zhan)的认可度正在提升。
以后,DeepSeek的出现证明国产大模型已经没有输天下一(yi)流(liu)模型了,如果(guo)没有用上同(tong)样好(hao)的国产显卡和推理引擎,生态就没有完整,只要生态好(hao),算力国产化(hua)的方针才能更好(hao)实(shi)现。
我们的最终(zhong)方针是(shi):没有管(guan)底层的硬件是(shi)甚么,只需通(tong)过我们的软件引擎,都可以或许感觉到相同(tong)性能的算力服务,规避掉硬件的差异。
━━━━━
抉择
KPI压力带没有来立异
新京(jing)报(bao)AI研究院:DeepSeek的团队也很年(nian)轻(qing),你怎么看(kan)待DeepSeek在立异方面的成功?
师天麾:DeepSeek做得很好(hao),原因之一(yi)当然(ran)是(shi)他们招揽的人才非常锋利。我们组(zu)博二和博三的同(tong)学全部收到过DeepSeek的邮件。比拟大厂,DeepSeek少了一(yi)些KPI的压力,更类似于学校里博士(shi)从事的科(ke)研工作,即“找一(yi)个有意思的点,尽量去实(shi)现。做一(yi)件有意义的事情,但没有要求给我带来若干收益”。
一(yi)旦有了KPI的压力,往往就没有敢去做收益没有确定的事情,会更加倾(qing)向(xiang)于复制已有的、明白的路(lu)径,这没有会冒险,但也做没有出“特别没有一(yi)样”的东西。
新京(jing)报(bao)AI研究院:以(yi)你本身(shen)的经历来看(kan),AI相关专(zhuan)业卒业生在初创企(qi)业、大厂与学校科(ke)研之间怎样(he)抉择?在企(qi)业的经历和实(shi)验室有何(he)没有同(tong)?
师天麾:我博士(shi)卒业后,就已经有大厂发来了薪资很高的offer,但我当时更倾(qing)向(xiang)于创业,做一(yi)些没有同(tong)的事。在大厂,大多情况下是(shi)“老板安排甚么就做甚么”,同(tong)时要背负一(yi)定KPI,如果(guo)被(bei)这些东西束缚住,可能一(yi)些事情将难以(yi)开展。当初如果(guo)我选择了大厂,可能也会先待两三年(nian)熟悉(xi)产业界,有了履历再(zai)出来创业。对付大厂来说,“你就值这个钱,你必须做这件事才能发挥价值。”
在清程极智,我们基(ji)本很少加班,空气开放并没有“内卷”。我们对自己(ji)的技术非常有信心,我们相信,顶级的技术人员没有是(shi)逼着加班就能释放出生产力的,最重(zhong)要的是(shi)没有受限制的创造力。
对付学界与企(qi)业的区别,学校的实(shi)验室会更多地从技术角度分(fen)析一(yi)件事,比如大模型训练推理系(xi)统的性能瓶颈在哪里,怎样(he)解决使其加速。在学校,1万行代码就能验证一(yi)个想法,但要把这个想法变(bian)成可用、波动、几乎没有Bug的产物,可能需要几十万代码。这就是(shi)企(qi)业要做的,对付企(qi)业的产物,性能好(hao)并没有代表绝对好(hao)用,需要更多权衡,更多产物工程化(hua)。
同(tong)时,实(shi)验室对付投产比没有那末在意。企(qi)业则需要向(xiang)投资人交代,试错成本没有能太大。最后,两者的节(jie)奏也有所没有同(tong),企(qi)业需要看(kan)市场上客户(hu)真(zhen)正需要甚么,要从用户(hu)角度来考虑市场的变(bian)化(hua),并进行积极地适配。
记者联系(xi)邮箱:luoyidan@xjbnews.com
值班编辑 康嘻(xi)嘻(xi) 古丽
发布于:北京(jing)市