全球 AI 競賽再添新參與者,這次是一整個國家。瑞士正式發(fā)布了國家級開源大語言模型(LLM)Apertus,希望其能成為 OpenAI 等企業(yè)所提供模型的替代選擇。“Apertus”源自拉丁語,意為“開放”,該模型由瑞士洛桑聯(lián)邦理工學院(EPFL)、蘇黎世聯(lián)邦理工學院(ETH Zurich)以及瑞士國家超級計算中心(CSCS)聯(lián)合研發(fā),這三家機構均為公共機構。
“當前,Apertus 是領先的公共 AI 模型:由公立機構打造,服務于公共利益。這是我們迄今為止最有力的證明 ——AI 完全可以成為像公路、供水、供電一樣的公共基礎設施。”推動 AI 成為公共基礎設施的核心倡導者約書亞?譚(Joshua Tan)表示。
瑞士研發(fā)團隊將 Apertus 設計為完全開源模式,用戶可查看其訓練過程的各個環(huán)節(jié)。除模型本身外,團隊還同步公開了訓練過程的完整文檔、源代碼,以及所使用的數(shù)據集。Apertus 的研發(fā)嚴格遵循瑞士數(shù)據保護法與版權法,對于希望遵守歐洲相關法規(guī)的企業(yè)而言,它或許是更優(yōu)選擇之一。瑞士銀行家協(xié)會此前曾指出,本土研發(fā)的大語言模型具有“巨大的長期潛力”,因為這類模型能更好地契合瑞士嚴格的本地數(shù)據保護法規(guī)與銀行保密制度。目前,瑞士各銀行已在使用其他 AI 模型滿足業(yè)務需求,未來是否會轉向 Apertus,仍有待觀察。
據IT之家了解,Apertus 向所有用戶開放使用:科研人員、AI 愛好者,乃至企業(yè)均可基于該模型進行二次開發(fā),根據自身需求定制功能。例如,用戶可借助它開發(fā)聊天機器人、翻譯工具,甚至是教育或培訓類應用。Apertus 的訓練數(shù)據涵蓋 1000 多種語言,總 token 量達 15 萬億,其中非英語數(shù)據占比 40%,包括瑞士德語、羅曼什語等瑞士本土語言。瑞士官方的聲明稱,該模型的訓練僅使用公開可獲取的數(shù)據,且其數(shù)據爬蟲在網站上遇到機器可讀的“拒絕爬取”請求時,會予以尊重。需注意的是,此前已有 Perplexity 等 AI 企業(yè)被指控爬取網站數(shù)據,并繞過用于阻止爬蟲的協(xié)議;部分 AI 企業(yè)還因未經許可使用新聞機構及創(chuàng)作者的內容訓練模型,面臨法律訴訟。
目前,Apertus 提供兩種參數(shù)規(guī)模的版本,分別為 80 億參數(shù)與 700 億參數(shù)。用戶可通過瑞士電信(Swisscom,瑞士信息通信技術企業(yè))或 AI 平臺 Hugging Face 獲取該模型。