焦點(diǎn)熱門:百川智能發(fā)布 70 億參數(shù)量開源中英文大模型
在多個(gè)中英文權(quán)威評(píng)測榜單上,baichuan-7B 均取得了優(yōu)異的成績。
王小川的大模型,首次公開亮相。
(相關(guān)資料圖)
2023 年 6 月 15 日,被稱為「中國 ChatGPT 夢之隊(duì)」的百川智能公司,推出了 70 億參數(shù)量的中英文預(yù)訓(xùn)練大模型——baichuan-7B。
baichuan-7B 不僅在 C-Eval、AGIEval 和 Gaokao 中文權(quán)威評(píng)測榜單上,以顯著優(yōu)勢全面超過了 ChatGLM-6B 等其他大模型,并且在 MMLU 英文權(quán)威評(píng)測榜單上,大幅領(lǐng)先 LLaMA-7B。
目前 baichuan-7B 大模型已在 Hugging Face、Github 以及 Model Scope 平臺(tái)發(fā)布。
01 多個(gè)最具影響力中文評(píng)估基準(zhǔn) 7B 最佳
為了驗(yàn)證模型的各項(xiàng)能力,baichuan-7B 在 C-Eval、AGIEval 和 Gaokao 三個(gè)最具影響力的中文評(píng)估基準(zhǔn)進(jìn)行了綜合評(píng)估,并且均獲得了優(yōu)異成績。
在中文 C-EVAL 的評(píng)測中,baichuan-7B 的綜合評(píng)分達(dá)到了 42.8 分,超過了 ChatGLM-6B 的 38.9 分,甚至比某些參數(shù)規(guī)模更大的模型還要出色。
C-EVAL 評(píng)測截圖,時(shí)間為 2023-06-15
C-Eval 評(píng)測基準(zhǔn)由上海交通大學(xué)、清華大學(xué)以及愛丁堡大學(xué)聯(lián)合創(chuàng)建,是面向中文語言模型的綜合考試評(píng)測集,覆蓋了 52 個(gè)來自不同行業(yè)領(lǐng)域的學(xué)科。
在 AGIEval 的評(píng)測里,baichuan-7B 綜合評(píng)分達(dá)到 34.4 分,遠(yuǎn)超 LLaMa-7B、Falcon-7B、Bloom-7B 以及 ChatGLM-6B 等其他開源模型。
AGIEval 評(píng)測基準(zhǔn)由微軟研究院發(fā)起,旨在全面評(píng)估基礎(chǔ)模型在人類認(rèn)知和問題解決相關(guān)任務(wù)上的能力,包含了中國的高考、司法考試,以及美國的 SAT、LSAT、GRE 和 GMAT 等 20 個(gè)公開且嚴(yán)謹(jǐn)?shù)墓俜饺雽W(xué)和職業(yè)資格考試。
在 GAOKAO 評(píng)測中,baichuan-7B 的綜合評(píng)分達(dá)到了 36.2 分,顯著領(lǐng)先于同參數(shù)規(guī)模的各種其他預(yù)訓(xùn)練模型。
GAOKAO 評(píng)測基準(zhǔn)是復(fù)旦大學(xué)研究團(tuán)隊(duì)創(chuàng)建的評(píng)測框架,以中國高考題目作為數(shù)據(jù)集,用于測試大模型在中文語言理解和邏輯推理能力方面的表現(xiàn)。
02 MMLU 英文評(píng)估基準(zhǔn)表現(xiàn)大幅領(lǐng)先 LLaMA-7B
baichuan-7B 不僅在中文方面表現(xiàn)優(yōu)異,在英文上表現(xiàn)同樣亮眼。在 MMLU 的評(píng)測中 baichuan-7B 綜合評(píng)分高達(dá) 42.5 分,大幅領(lǐng)先英文開源預(yù)訓(xùn)練模型 LLaMA-7B 的 34.2 分以及中文開源模型 ChatGLM-6B 的 36.9 分。
MMLU 由加州大學(xué)伯克利分校等知名高校共同打造,集合了科學(xué)、工程、數(shù)學(xué)、人文、社會(huì)科學(xué)等領(lǐng)域的 57 個(gè)科目,主要目標(biāo)是對(duì)模型的英文跨學(xué)科專業(yè)能力進(jìn)行深入測試。其內(nèi)容廣泛,從初級(jí)水平一直涵蓋到高級(jí)專業(yè)水平。
03 baichuan-7B是如何打造
訓(xùn)練語料對(duì)大模型的訓(xùn)練結(jié)果至關(guān)重要。在構(gòu)建預(yù)訓(xùn)練語料庫方面,百川智能以高質(zhì)量中文語料為基礎(chǔ),同時(shí)融合了優(yōu)質(zhì)的英文數(shù)據(jù)。在數(shù)據(jù)質(zhì)量方面,通過質(zhì)量模型對(duì)數(shù)據(jù)進(jìn)行打分,對(duì)原始數(shù)據(jù)集進(jìn)行篇章級(jí)和句子級(jí)的精確篩選;在內(nèi)容多樣性方面,利用自研超大規(guī)模局部敏感哈希聚類系統(tǒng)和語義聚類系統(tǒng),對(duì)數(shù)據(jù)進(jìn)行了多層次多粒度的聚類,最終構(gòu)建了包含 1.2 萬億 token 的兼顧質(zhì)量和多樣性的預(yù)訓(xùn)練數(shù)據(jù)。相較于其他同參數(shù)規(guī)模的開源中文預(yù)訓(xùn)練模型,數(shù)據(jù)量提高了超過 50%。
在萬億優(yōu)質(zhì)中英文數(shù)據(jù)的基礎(chǔ)上,為了更好地提升訓(xùn)練效率,baichuan-7B 深度整合了模型算子來加快計(jì)算流程,并針對(duì)任務(wù)負(fù)載和集群配置,自適應(yīng)優(yōu)化了模型并行策略以及重計(jì)算策略。通過高效的訓(xùn)練過程調(diào)度通信,baichuan-7B 成功地實(shí)現(xiàn)了計(jì)算與通信的高效重疊,進(jìn)而達(dá)到了超線性的訓(xùn)練加速,在千卡集群上訓(xùn)練吞吐達(dá)到 180+Tflops 的業(yè)界領(lǐng)先水平。
同時(shí),已有的開源模型窗口長度在 2K 以內(nèi),對(duì)于一些長文本建模任務(wù),如需要引入外部知識(shí)做搜索增強(qiáng)的場景,更長的處理長度有助于模型在訓(xùn)練與推理階段捕獲越多的上下文信息,2K 的處理長度存在比較大的制約。baichuan-7B 基于高效的 attention 算子優(yōu)化實(shí)現(xiàn)了萬級(jí)別超長動(dòng)態(tài)窗口的擴(kuò)張能力,本次開源的預(yù)訓(xùn)練模型開放了 4K 上下文窗口,使模型應(yīng)用場景更加廣泛。
此外,baichuan-7B 還對(duì)模型訓(xùn)練流程進(jìn)行了深度優(yōu)化,采用了更科學(xué)且穩(wěn)定的訓(xùn)練流程和超參數(shù)選擇,使得 baichuan-7B 模型的收斂速度大大提升。與同等參數(shù)規(guī)模的模型相比,baichuan-7B 在困惑度(PPL)和訓(xùn)練損失(training loss)等關(guān)鍵性能指標(biāo)上表現(xiàn)更加優(yōu)秀。
04 免費(fèi)可商用,清華北大率先使用助力研究
秉持開源精神,baichuan-7B 代碼采用 Apache-2.0 協(xié)議,模型權(quán)重采用了免費(fèi)商用協(xié)議,只需進(jìn)行簡單登記即可免費(fèi)商用。
baichuan-7B 此次開源的內(nèi)容十分豐富,包含了推理代碼、INT4 量化實(shí)現(xiàn)、微調(diào)代碼,以及預(yù)訓(xùn)練模型的權(quán)重。其中,微調(diào)代碼方便用戶對(duì)模型進(jìn)行調(diào)整和優(yōu)化;推理代碼與 INT4 量化實(shí)現(xiàn)則有助于開發(fā)者低成本地進(jìn)行模型的部署和應(yīng)用;預(yù)訓(xùn)練模型權(quán)重開源后,用戶則可以直接使用預(yù)訓(xùn)練模型進(jìn)行各種實(shí)驗(yàn)研究。
據(jù)了解,北京大學(xué)和清華大學(xué)兩所頂尖大學(xué)已率先使用 baichuan-7B 模型推進(jìn)相關(guān)研究工作,并計(jì)劃在未來與百川智能深入合作,共同推動(dòng) baichuan-7B 模型的應(yīng)用和發(fā)展。
清華大學(xué)互聯(lián)網(wǎng)司法研究院院長、計(jì)算機(jī)系教授劉奕群認(rèn)為,baichuan-7B 模型在中文上的效果表現(xiàn)十分出色,它免費(fèi)商用的開源方式展現(xiàn)出開放的態(tài)度,不僅貢獻(xiàn)社區(qū),也推動(dòng)技術(shù)發(fā)展。團(tuán)隊(duì)計(jì)劃基于 baichuan-7B 模型開展司法人工智能領(lǐng)域的相關(guān)研究。
北京大學(xué)人工智能研究院助理教授楊耀東認(rèn)為,baichuan-7B 模型的開源將對(duì)于中文基礎(chǔ)語言模型的生態(tài)建設(shè)及學(xué)術(shù)研究產(chǎn)生重要推動(dòng)作用,同時(shí)他也表示將持續(xù)關(guān)注相關(guān)領(lǐng)域探索,并且在中文大語言模型的安全和對(duì)齊上進(jìn)行進(jìn)一步深入研究。
百川智能 CEO 王小川表示:「本次開源模型的發(fā)布是百川智能成立 2 個(gè)月后的第一個(gè)里程碑,對(duì)百川智能而言是一個(gè)良好的開局。baichuan-7B 模型,不僅能為中國的 AGI 事業(yè)添磚加瓦,也為世界大模型開源社區(qū)貢獻(xiàn)了新的力量?!?/p>
開源地址:
Hugging Face:https://huggingface.co/baichuan-inc/baichuan-7BGithub:https://github.com/baichuan-inc/baichuan-7BModel Scope:https://modelscope.cn/models/baichuan-inc/baichuan-7B/summary標(biāo)簽:
- 焦點(diǎn)熱門:百川智能發(fā)布 70 億參數(shù)量開源中英文大模型
- 深宮計(jì)劇情簡介_深宮計(jì)介紹 天天快消息
- 上交所:本周對(duì)退市未來、退市輔仁、退市運(yùn)盛、退市中昌、退市澤達(dá)、退市紫晶等退市整理股票進(jìn)行重點(diǎn)監(jiān)控
- 陜西省自然資源廳與陜西省氣象局聯(lián)合發(fā)布地質(zhì)災(zāi)害氣象風(fēng)險(xiǎn)黃色預(yù)警【Ⅲ級(jí)/較重】【2023-06-16】_焦點(diǎn)熱議
- 6.16.中財(cái)網(wǎng)晚七點(diǎn):明日要聞、利好/利空消息-更新中
- 中國平安(02318.HK)6月16日注銷7000.68萬股已回購的A股|天天速看料
- 每日速訊:如何申請(qǐng)?zhí)詫毜赇佔(zhàn)?cè)_如何申請(qǐng)?zhí)詫毜赇?/a>
- 消息!江蘇省宿遷市2023-06-11 23:41發(fā)布雷暴大風(fēng)黃色預(yù)警
- 焦點(diǎn)熱文:新華社聚焦貴州鄉(xiāng)村體育火爆:是樂子,更是路子!
- 微創(chuàng)機(jī)器人港股漲13.83%-速看
- 精選!郵儲(chǔ)銀行零陵區(qū)支行開展防范非法集資宣傳月活動(dòng)
- 天津公安交管部門服務(wù)中考考生便利出行
- 冼夫人2_冼夫人 天天訊息
- 全球今頭條!降檔了:美國派巡航導(dǎo)彈核潛艇訪問韓國
- 環(huán)球快報(bào):百里鎮(zhèn)開展防范非法集資宣傳活動(dòng)
- 環(huán)球微動(dòng)態(tài)丨包庇許杰輝?王偉忠回應(yīng):不實(shí)指控會(huì)依法追究
- 簡單護(hù)士辭職申請(qǐng)信醫(yī)院
- 世界快資訊丨“云端”相約,安仁鎮(zhèn)學(xué)校與烏魯木齊市七十三中學(xué)聯(lián)合教研
- 今日熱議:廣州啟動(dòng)氣象災(zāi)害(暴雨)Ⅳ級(jí)應(yīng)急響應(yīng) 多區(qū)暴雨黃色預(yù)警生效
- 動(dòng)力參數(shù)亮眼/調(diào)校有待提升 凱翼昆侖500試駕體驗(yàn)
- 浙商證券:降息前后迎來貴金屬主升浪 能源金屬處于大底部_全球報(bào)資訊
- 當(dāng)前時(shí)訊:返利優(yōu)惠券
- 漳州薌城區(qū):“寸土”也能生“寸金” 每日焦點(diǎn)
- 世紀(jì)恒通:6月15日融資買入1079.51萬元,融資融券余額3953.74萬元 當(dāng)前快訊
- 重慶-成都,深藍(lán)S7超級(jí)增程城際穿越活動(dòng)即將開啟 天天簡訊
- 【快播報(bào)】向險(xiǎn)而行!看武警防化兵演練現(xiàn)場
- win7快捷鍵大全很詳細(xì)_win7快捷鍵大全 全球速讀
- 世界速看:打底襪連褲襪_打底襪
- 走紅一周年,東方甄選的“得”與“失”
- 威爾泰6月16日打開漲停
- 韓國電信公布未來五年非基礎(chǔ)設(shè)施投資預(yù)算撥出12萬億韓元
- 冰墩墩設(shè)計(jì)者給北京四中學(xué)生回信:祝??蓯蹔^進(jìn)的中國少
- 江蘇南通發(fā)現(xiàn)1人檢測結(jié)果呈陽性 系外地返通人員
- 湖南郴州報(bào)告2例香港返湘人員新冠肺炎確診病例
- 廣西百色疫情社區(qū)傳播鏈基本阻斷
- 廣西新增1例本土確診病例 本輪本土疫情累計(jì)報(bào)告確診病例
- 葫蘆島市兩醫(yī)院不再收治非綏中地區(qū)患者 就醫(yī)患者閉環(huán)管理
- 蘇州14日新增本土確診1例,無癥狀感染者3例 詳情及軌跡公布
- 2021年北京空氣質(zhì)量創(chuàng)歷史最優(yōu) 首次全面達(dá)標(biāo)
- 化屋村火起來了
- 國家藥監(jiān)局:“小金盾”不是質(zhì)量認(rèn)證標(biāo)志
- 大霧!湖南18條高速通行受影響 157個(gè)收費(fèi)站臨時(shí)交通管制
- “0蔗糖”就是無糖、不渴不用喝水等謠言入選2021年度十大
- 廣西:監(jiān)督推動(dòng)鄉(xiāng)村振興政策項(xiàng)目資金落地見效
- 各國動(dòng)植物“精靈”慶冬奧 你能猜到她是誰嗎?
- 二七廠蝶變:科技自立自強(qiáng)
- 從貨擔(dān)郎到日售數(shù)千斤 蘭州手藝人40余載“滾”元宵留年
- 大陸學(xué)生在臺(tái)度春節(jié):不一樣的年味與團(tuán)圓
- 廣東惠州全市全部封控管控解除
- 為人民健康提供可靠保障
- 青海藏族女孩小拉毛春節(jié)“重生記”
- 讓群眾遇事不煩辦事不難
- 黑河市疫情期間發(fā)放6500份元宵餃子“暖心包”
- 市場監(jiān)管總局:全國已建成869個(gè)進(jìn)口冷鏈?zhǔn)称芳斜O(jiān)管倉