熱搜： 機(jī)器人 irobot 工業(yè)機(jī)器人機(jī)器人產(chǎn)業(yè)聯(lián)盟佳士科技機(jī)器人展覽發(fā)那科機(jī)械手 ABB 碼垛機(jī)器人

英特爾升級(jí)多顯卡 AI 推理，Battlematrix 整體性能最高提升 80%

日期：2025-08-13 來(lái)源：IT之家評(píng)論：0

標(biāo)簽： 人工智能科技 AI

科技媒體 WccfTech （8 月 11 日）發(fā)布博文，報(bào)道稱英特爾為其銳炫 Pro 系列 GPU 的 Battlematrix 項(xiàng)目，發(fā)布首個(gè)重磅軟件更新 LLM Scaler v1.0，重點(diǎn)優(yōu)化了 AI 推理能力。

IT之家曾于 5 月報(bào)道，英特爾在 COMPUTEX 2025 臺(tái)北國(guó)際電腦展上，推出銳炫 Arc Pro B50 和 B60 兩張顯卡之外，還推出了 Project Battlematrix 推理工作站平臺(tái)，支持最多 8 張銳炫 Pro 顯卡并具備軟件包支持，能運(yùn)行高達(dá) 150B 參數(shù)的中等規(guī)模且精度高的 AI 模型。

Battlematrix 平臺(tái)集成硬件與定制化軟件棧，優(yōu)化推理性能和企業(yè)部署體驗(yàn)；而 LLM Scaler 是基于 vLLM 框架開發(fā)的 AI 大模型推理容器，支持多 GPU 擴(kuò)展、長(zhǎng)序列高效推理及多模態(tài)任務(wù)。

LLM Scaler v1.0 重點(diǎn)優(yōu)化了 vLLM 推理框架，對(duì)于 32B KPI 模型，40K 序列長(zhǎng)度下性能提升可達(dá) 1.8 倍；70B KPI 模型同條件下提升高達(dá) 4.2 倍，8B 至 32B 規(guī)模模型輸出吞吐量較上版提升約 10%。

該版本還引入分層在線量化，有效降低顯存占用，并支持管道并行、數(shù)據(jù)并行、多模態(tài)模型及嵌入、重排序等功能，提升模型適應(yīng)性與擴(kuò)展性。

為便于企業(yè)級(jí)運(yùn)維，LLM Scaler v1.0 集成了 XPU Manager 工具，支持 GPU 電源管理、固件升級(jí)、診斷及顯存帶寬檢測(cè)。

新容器基于 Linux 平臺(tái)，充分利用多 GPU 擴(kuò)展和 PCIe 點(diǎn)對(duì)點(diǎn)數(shù)據(jù)傳輸，實(shí)現(xiàn)最高 80% 的整體性能提升，系統(tǒng)同時(shí)具備 ECC、SRIOV、遙測(cè)與遠(yuǎn)程固件更新等可靠性與可管理性特性，滿足企業(yè)級(jí)部署需求。

英特爾強(qiáng)調(diào)，新軟件棧遵循行業(yè)標(biāo)準(zhǔn)，兼容主流開發(fā)流程，oneCCL 基準(zhǔn)測(cè)試工具的集成也為開發(fā)者調(diào)優(yōu)和性能評(píng)測(cè)提供了便利，進(jìn)一步豐富了 Battlematrix 平臺(tái)的生態(tài)支持。

根據(jù)英特爾路線圖，本季度內(nèi)還將發(fā)布更為穩(wěn)固的容器版本，進(jìn)一步優(yōu)化 vLLM 服務(wù)能力。預(yù)計(jì)到今年第四季度，Battlematrix 項(xiàng)目將實(shí)現(xiàn)全功能版本落地，推動(dòng)大模型推理平臺(tái)的持續(xù)升級(jí)，為專業(yè)領(lǐng)域用戶帶來(lái)更高效、更易用的 AI 解決方案。

聲明：凡資訊來(lái)源注明為其他媒體來(lái)源的信息，均為轉(zhuǎn)載自其他媒體，并不代表本網(wǎng)站贊同其觀點(diǎn)，也不代表本網(wǎng)站對(duì)其真實(shí)性負(fù)責(zé)。您若對(duì)該文章內(nèi)容有任何疑問(wèn)或質(zhì)疑，請(qǐng)立即與中國(guó)機(jī)器人網(wǎng)(baoxianwx.cn)聯(lián)系，本網(wǎng)站將迅速給您回應(yīng)并做處理。
電話：021-39553798-8007

更多>相關(guān)資訊

0 條相關(guān)評(píng)論

推薦圖文

迅雷將在杭州成立AI全	加州大學(xué)科學(xué)家發(fā)明了
深圳又一制造業(yè)總部基	水下機(jī)器人在漁業(yè)中的
哈工程水下機(jī)器人再奪	里程碑！荊州市首臺(tái)機(jī)

推薦資訊

點(diǎn)擊排行

?

• 國(guó)務(wù)院常務(wù)會(huì)議審議通過(guò)《關(guān)于深入實(shí)施“人工智	• 200多家企業(yè)已參展！高交會(huì)亞洲人工智能與機(jī)器
• 國(guó)家安全部：警惕人工智能數(shù)據(jù)投毒，0.01% 虛假	• 達(dá)美航空重申：不會(huì)用 AI 為乘客提供個(gè)性化票價(jià)
• 谷歌“虛擬衛(wèi)星”AI 模型問(wèn)世：可提供近乎實(shí)時(shí)	• 谷歌通過(guò)機(jī)器學(xué)習(xí)判斷用戶年齡：你的搜索行為、
• 國(guó)內(nèi)首個(gè)，MiniMax 大模型通過(guò)人機(jī)辯論圖靈測(cè)試	• 央視聚焦！科大訊飛多語(yǔ)種AI透明屏亮相2025世界
• 達(dá)明機(jī)器人聯(lián)合海峽經(jīng)濟(jì)科技合作中心亮相2025 W	• 飛槳入選中國(guó)人工智能產(chǎn)業(yè)創(chuàng)新成果展，百度打造

国产精品久久久久久久小说,国产国产裸模裸模私拍视频,国产精品免费看久久久无码,风流少妇又紧又爽又丰满,国产精品,午夜福利

英特爾升級(jí)多顯卡 AI 推理，Battlematrix 整體性能最高提升 80%

英特爾升級(jí)多顯卡 AI 推理，Battlematrix 整體性能最高提升 80%