首頁 | 資訊 | 財經(jīng) | 公益 | 彩店 | 奇聞 | 速遞 | 前瞻 | 提點 | 網(wǎng)站相關 | 科技 | 熱點 | 生活 |
      通義千問宣布開源

      發(fā)稿時間:2023-08-05 03:19:40 來源: 經(jīng)濟觀察網(wǎng)


      (相關資料圖)

      經(jīng)濟觀察網(wǎng) 記者 錢玉娟

      繼海外開源大模型體系推出并實現(xiàn)商用化后,8月3日,阿里云宣布其自研的大模型通義千問正式開源,成為首個宣布大模型開源的大型中國互聯(lián)網(wǎng)科技公司。具體來看,通義千問70億參數(shù)的通用模型Qwen-7B和對話模型Qwen-7B-Chat,均上架在AI模型社區(qū)魔搭ModelScope,開源、免費、可商用。

      據(jù)了解,魔搭社區(qū)是阿里云在2022年牽頭發(fā)起的一個AI模型社區(qū),借此服務AI開發(fā)者。官方數(shù)據(jù)顯示,目前魔搭社區(qū)聚集了超20家頂尖人工智能機構貢獻的1000多款開源模型,是中國大模型開源的第一門戶。

      不過,在此之前的6月,由王小川創(chuàng)立的人工智能創(chuàng)新科技公司百川智能,先后推出了70億規(guī)模參數(shù)的Baichuan-7B開源模型,以及號稱擁有130億的參數(shù)規(guī)模的Baichuan-13B模型,率先成為國內(nèi)推行完全開源、免費可商用的大模型創(chuàng)業(yè)公司。

      在加入魔搭社區(qū)的開發(fā)者飛鯨看來,盡管通義千問開源的模型參數(shù)只有70億,但經(jīng)過微調(diào)后,模型的數(shù)學推理能力表現(xiàn)不錯,“對于一些常見的加減乘除應用題,答得還可以?!?/p>

      伴隨通義千問開源消息發(fā)出,兩個模型在社區(qū)上架后,應用開發(fā)者等用戶既可從魔搭社區(qū)直接下載模型,也可通過阿里云靈積平臺訪問和調(diào)用Qwen-7B和Qwen-7B-Chat兩個模型。當用戶使用上述開源大模型體系的過程中,阿里云會提供包括模型訓練、推理、部署、精調(diào)等在內(nèi)的全套服務。

      今年4月推出自研大模型通義千問后,今年7月,阿里云宣布將促進中國大模型生態(tài)的繁榮作為首要目標,向大模型創(chuàng)業(yè)公司提供智能算力、開發(fā)工具等服務。

      談及當前國內(nèi)外開源的模型,飛鯨認為對包括他在內(nèi)的開發(fā)者們幫助極大,“可以基于自己的業(yè)務領域需求,做finetune(微調(diào))或者和本地知識庫對接,實現(xiàn)快速地業(yè)務落地?!?/p>

      飛鯨告訴記者,在一些垂直領域并不需要參數(shù)量很高、通用能力很強的模型,而是“希望一些小甜點”,他舉例到,比如幾十到百億左右參數(shù)規(guī)模的模型,結合垂直領域數(shù)據(jù),就可以發(fā)揮很好的價值。

      阿里云方面認為,開源大模型可以幫助用戶簡化模型訓練和部署的過程,用戶不必從頭訓練模型,只需下載預訓練好的模型并進行微調(diào),就可快速構建高質(zhì)量的模型。

      (責任編輯:劉暢 )

      標簽:

      責任編輯:mb01

      網(wǎng)站首頁 | 關于我們 | 免責聲明 | 聯(lián)系我們

      生活晚報網(wǎng)版權所有

      Copyright @ 1999-2017 www.8x5.com.cn All Rights Reserved豫ICP備2022016495號-7

      聯(lián)系郵箱:939 674 669@qq.com