微軟攜手中科院大學(xué)團(tuán)隊(duì)推出CPU驅(qū)動AI模型,1位架構(gòu)實(shí)現(xiàn)低能耗運(yùn)行

2025-04-28 11:35  瀏覽:  

微軟研究院與中國科學(xué)院大學(xué)合作團(tuán)隊(duì)近日在arXiv平臺發(fā)布研究成果,推出全新人工智能模型。該模型突破性地在常規(guī)CPU而非GPU上運(yùn)行,通過創(chuàng)新的數(shù)據(jù)處理架構(gòu)顯著降低能耗,為人工智能技術(shù)落地提供新思路。

傳統(tǒng)GPU驅(qū)動模型的能耗困境

當(dāng)前主流大語言模型(LLM)如ChatGPT依賴GPU芯片進(jìn)行訓(xùn)練與推理,此類模型在處理海量數(shù)據(jù)時需要強(qiáng)大算力支撐,導(dǎo)致能耗問題日益凸顯。數(shù)據(jù)中心為支持聊天機(jī)器人等應(yīng)用消耗大量電力,引發(fā)業(yè)界對可持續(xù)發(fā)展的擔(dān)憂。研究團(tuán)隊(duì)針對這一痛點(diǎn)展開技術(shù)攻關(guān),提出更智能的數(shù)據(jù)處理方法。

1位架構(gòu)實(shí)現(xiàn)算力優(yōu)化

新模型摒棄傳統(tǒng)8位或16位浮點(diǎn)數(shù)存儲權(quán)重的方式,轉(zhuǎn)而采用“1位架構(gòu)”。其核心創(chuàng)新在于將模型權(quán)重簡化為-1、0、1三種離散值,使推理過程僅需基礎(chǔ)加減法運(yùn)算。這種設(shè)計(jì)極大降低了內(nèi)存占用與CPU處理負(fù)擔(dān),實(shí)驗(yàn)數(shù)據(jù)顯示該架構(gòu)在保持性能的同時,內(nèi)存需求減少至傳統(tǒng)方案的1/16,能耗降低超90%。研究團(tuán)隊(duì)強(qiáng)調(diào),此方法使普通計(jì)算機(jī)或移動設(shè)備即可運(yùn)行高效AI模型,無需依賴專業(yè)GPU硬件。

BitNet b1.58模型與專用運(yùn)行環(huán)境

為適配1位架構(gòu),團(tuán)隊(duì)開發(fā)了配套運(yùn)行時環(huán)境bitnet.cpp。該系統(tǒng)針對離散權(quán)重矩陣優(yōu)化內(nèi)存分配與指令調(diào)度,支持20億參數(shù)規(guī)模的模型在單核CPU上穩(wěn)定運(yùn)行。測試結(jié)果表明,新模型在CPU環(huán)境下的推理速度接近傳統(tǒng)GPU方案,且模型精度損失控制在可接受范圍內(nèi)。在MNIST、GLUE等基準(zhǔn)測試中,其性能表現(xiàn)與同類GPU模型相當(dāng),部分場景下甚至實(shí)現(xiàn)超越。

本地化部署提升隱私與能效

該技術(shù)突破為AI應(yīng)用帶來雙重價值。在隱私保護(hù)層面,用戶數(shù)據(jù)無需上傳云端即可完成處理,支持完全離線的智能助手開發(fā)。研究團(tuán)隊(duì)在樹莓派等邊緣設(shè)備上成功部署聊天機(jī)器人系統(tǒng),響應(yīng)延遲低于300毫秒,且支持?jǐn)嗑W(wǎng)運(yùn)行。在能效層面,單個推理任務(wù)的耗電量較傳統(tǒng)方案減少92%,單次交互能耗不足0.03Wh。這一特性使其在移動終端、物聯(lián)網(wǎng)設(shè)備等場景中具備顯著優(yōu)勢。

免責(zé)聲明:本網(wǎng)轉(zhuǎn)載自合作媒體、機(jī)構(gòu)或其他網(wǎng)站的信息,登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性。本網(wǎng)所有信息僅供參考,不做交易和服務(wù)的根據(jù)。本網(wǎng)內(nèi)容如有侵權(quán)或其它問題請及時告之,本網(wǎng)將及時修改或刪除。凡以任何方式登錄本網(wǎng)站或直接、間接使用本網(wǎng)站資料者,視為自愿接受本網(wǎng)站聲明的約束。
相關(guān)推薦
鴻蒙電腦正式亮相

鴻蒙電腦正式亮相

5月8日,華為技術(shù)有限公司在廣東省深圳市舉辦鴻蒙電腦技術(shù)與生態(tài)溝通會,搭載鴻蒙操作系統(tǒng)的鴻蒙電腦在會上正式亮相,這代表國產(chǎn)操作系統(tǒng)在個人電腦(PC)領(lǐng)域?qū)崿F(xiàn)重要突破。記者從會上了解到,鴻蒙電腦研發(fā)歷經(jīng)5年布局,集結(jié)上萬名工程師、聯(lián)合20多家研究所共同完成,積累超過2700項(xiàng)核心專利。鴻蒙操作系統(tǒng)是由華為公司開發(fā)的全場景智能操作系統(tǒng),于2015年立項(xiàng),用不到10年的時間走完同行30年的歷程。2019年,華為公司正式對外發(fā)布鴻蒙操作系統(tǒng),2021年...
臺積電應(yīng)對新臺幣升值壓力 要求供貨商下修成本

臺積電應(yīng)對新臺幣升值壓力 要求供貨商下修成本

5月7日消息,據(jù)業(yè)界消息,目前臺積電已要求供貨商提出成本下修計(jì)劃,以因應(yīng)新臺幣升值影響。根據(jù)業(yè)界人士的說法,臺積電原本要求供貨商明年裸晶圓(Raw wafer)至少降價 30%。如今因匯兌壓力急速上升,據(jù)悉臺積電已擴(kuò)大要求多家供貨商提早于本月繳交新報價。市場預(yù)期,新臺幣每升值 1%,營業(yè)利益率恐下降 0.4 個百分點(diǎn)。臺積電 2025 年第二季展望是合并營收介于 284 億至 292 億美元。若以新臺幣 32.5 元兌 1 美元匯率假設(shè),毛利率介于 57%~59%,營業(yè)利...
英特爾股東通過新任CEO陳立武薪酬方案

英特爾股東通過新任CEO陳立武薪酬方案

5月7日消息,英特爾股東投票通過了新任CEO陳立武的薪酬方案,根據(jù)方案,陳立武將獲得最高達(dá)3億人民幣的股票獎勵!該獎勵將與公司股價表現(xiàn)掛鉤,分階段發(fā)放!在股東會議中,陳立武闡述了其任內(nèi)的三大戰(zhàn)略重點(diǎn):重振人工智能業(yè)務(wù)、提升產(chǎn)品競爭力以及推進(jìn)組織架構(gòu)優(yōu)化。陳立武特別強(qiáng)調(diào),英特爾將充分發(fā)揮其在PC和數(shù)據(jù)中心市場的傳統(tǒng)優(yōu)勢,聚焦于開發(fā)更具市場競爭力的產(chǎn)品和技術(shù)。同時,公司正在實(shí)施管理層級精簡計(jì)劃,旨在提升決策效率并降低運(yùn)營成本。在AI...
特朗普政府?dāng)M放寬AI芯片出口限制 重塑半導(dǎo)體貿(mào)易政策

特朗普政府?dāng)M放寬AI芯片出口限制 重塑半導(dǎo)體貿(mào)易政策

據(jù)知情人士透露,特朗普政府計(jì)劃撤銷拜登時期實(shí)施的AI芯片出口限制措施,原定于5月15日生效的"人工智能擴(kuò)散規(guī)則"將暫停執(zhí)行。此舉旨在調(diào)整半導(dǎo)體貿(mào)易政策,推動更開放的國際貿(mào)易環(huán)境,同時美國商務(wù)部將制定新規(guī)強(qiáng)化海外芯片管控。拜登政府去年推出的限制政策將芯片出口國分為三類進(jìn)行分級管控,引發(fā)科技業(yè)及多國反對。AMD首席執(zhí)行官蘇姿豐強(qiáng)調(diào),需平衡國家安全與產(chǎn)業(yè)競爭力;英偉達(dá)CEO黃仁勛警告,失去中國市場將造成重大損失。新政策擬取消分級制...
騰訊與烏茲別克斯坦攜手合作,微信支付將打通烏茲別克斯坦

騰訊與烏茲別克斯坦攜手合作,微信支付將打通烏茲別克斯坦

根據(jù)烏茲別克斯坦數(shù)字技術(shù)部最新公告,中國互聯(lián)網(wǎng)科技巨頭騰訊集團(tuán)副總裁馬斌率代表團(tuán)與該國數(shù)字技術(shù)部核心管理層展開高層對話,雙方就數(shù)字經(jīng)濟(jì)領(lǐng)域多維合作達(dá)成系列共識。會談期間,騰訊代表團(tuán)系統(tǒng)考察了烏茲別克斯坦IT產(chǎn)業(yè)園區(qū)的政策支持體系,重點(diǎn)包括針對入駐企業(yè)的稅收減免機(jī)制、數(shù)字服務(wù)出口促進(jìn)方案以及外資科技企業(yè)準(zhǔn)入路徑。代表團(tuán)還深入調(diào)研了國家統(tǒng)一信息整合平臺Uzinfocom的運(yùn)營架構(gòu),對該國數(shù)字化基礎(chǔ)設(shè)施建設(shè)取得的技術(shù)突破給...

推薦閱讀

熱文

Copyright © 能源界