久久精品精选,精品九九视频,www久久只有这里有精品,亚洲熟女乱色综合一区
    分享

    王小川公布最新大模型,號稱全球最長上下文,是GPT-4的14倍|鈦媒體焦點

     獨角戲jlahw6jw 2023-10-30 發布于江西
    王小川公布最新大模型,號稱全球最長上下文,是GPT-4的14倍|鈦媒體焦點

    搜狗創始人、百川智能創始人兼CEO 王小川

    國內大模型技術競爭加速,繼訊飛星火、智譜推出最新產品之后,百川也迎來了新的大模型成果。

    鈦媒體獲悉,10月30日上午,王小川創立的 AI 大模型公司“百川智能”宣布,推出Baichuan2-192K大模型,其上下文窗口長度高達192K,能夠處理約35萬個漢字。

    百川智能稱,Baichuan2-192K是目前全球最長的上下文窗口,也是目前支持長上下文窗口最優秀大模型Claude2(支持100K上下文窗口,實測約8萬字)的4.4倍,更是GPT-4(支持32K上下文窗口,實測約 2.5萬字)的14倍(1400%)。這不僅在上下文窗口長度上超越Claude2,在長窗口文本生成質量、長上下文理解以及長文本問答、摘要等方面的表現也全面領先Claude2。

    據悉,Baichuan2-192K將以API調用和私有化部署的方式提供給企業用戶。目前百川智能已經啟動該大模型的API內測,并開放給法律、媒體、金融等行業的核心合作伙伴。

    王小川公布最新大模型,號稱全球最長上下文,是GPT-4的14倍|鈦媒體焦點

    據悉,百川智能成立于2023年4月10日,由搜狗公司創始人、前CEO王小川創立。其核心團隊由來自搜狗、Google、騰訊、百度、華為、微軟、字節等知名科技公司的AI頂尖人才組成。目前,百川智能的團隊規模170余人,其中碩士及碩士以上學歷員工占比近70%,研發人員占比超80%。

    過去200多天,百川智能平均每28天發布一款大模型,已連續Baichuan-7B/13B,Baichuan2-7B/13B四款開源可免費商用大模型及Baichuan-53B、Baichuan2-53B兩款閉源大模型,在寫作、文本創作等領域能力已達到行業較好水平。目前,Baichuan-7B/13B兩款開源大模型在多個權威評測榜單均名列前茅,累積下載量超過600萬次。

    對于建立 AI 大模型公司,王小川曾表示,其團隊已有的技術工具可以用來建造大模型,公司的競爭對手就是大公司的開源方案。王小川還認為,整個團隊不用太大,百人足夠。

    8月31日,百川智能率先通過國家《生成式人工智能服務管理暫行辦法》備案,是首批八家公司中唯一一家今年成立的大模型初創公司,并于9月25日開放Baichuan2-53B API接口,正式進軍To B企業端領域,開啟商業化進程。

    10月17日,百川智能宣布已完成A1輪3億美元的戰略融資,阿里、騰訊、小米等科技巨頭及多家頂級投資機構均參投了本輪。加上天使輪的5000萬美元,百川智能累計融資額已達3.5億美元(約合人民幣25.43億元)。

    百川智能未透露當前具體估值,僅表示本輪融資后,公司躋身于科技獨角獸行列。根據一般定義,獨角獸估值超過10億美元(約合人民幣72.66億元)。

    此次發布的Baichuan2-192K,百川智能表示在Dureader、NarrativeQA、LSHT、TriviaQA等10項中英文長文本問答、摘要的評測集上表現優異,有7項取得SOTA,顯著超過其他長窗口模型,全面領先Claude2。

    王小川公布最新大模型,號稱全球最長上下文,是GPT-4的14倍|鈦媒體焦點

    百川方面指出,擴大上下文窗口能有效提升大模型性能是人工智能行業的共識,但是超長上下文窗口意味著更高的算力需求和更大的顯存壓力。目前,業內有很多提升上下文窗口長度的方式,包括滑動窗口、降采樣、小模型等。這些方式雖然能提升上下文窗口長度,但對模型性能均有不同程度的損害,換言之都是通過犧牲模型其他方面的性能來換取更長的上下文窗口。而本次百川發布的Baichuan2-192K通過算法和工程的優化,實現了窗口長度和模型性能之間的平衡,做到了窗口長度和模型性能的同步提升。

    算法方面,百川智能提出了一種針對RoPE和ALiBi動態位置編碼的外推方案,在保證分辨率的同時增強了模型對長序列依賴的建模能力,而且當窗口長度擴大,Baichuan2-192K的序列建模能力持續增強;工程方面,在自主開發的分布式訓練框架基礎上,百川智能整合優化多個技術,獨創了一套全面的4D并行分布式方案,能夠根據模型具體的負載情況,自動尋找最適合的分布式策略,極大降低了長窗口訓練和推理過程中的顯存占用。

    Baichuan2-192K便能夠與更多的垂直場景深度結合,真正在人們的工作、生活、學習中發揮作用,助力行業用戶更好的降本增效。比如它可以幫助基金經理總結和解釋財務報表,分析公司的風險和機遇;幫助律師識別多個法律文件中的風險,審核合同和法律文件;幫助技術人員閱讀數百頁的開發文檔,并回答技術問題;還能幫助科員人員快速瀏覽大量論文,總結最新的前沿進展等。

    目前,Baichuan2-192K以API調用的方式開放給百川智能的核心合作伙伴,已經與財經類媒體及律師事務所等機構達成了合作,稱不久后將全面開放。

    王小川團隊表示,百川智能Baichuan2-192K在算法和工程上針對長上下文窗口進行創新,驗證了長上下文窗口的可行性,為大模型性能提升開拓出了新的科研路徑。同時,其更長的上下文還將為行業探索Agent、多模態應用等前沿領域打下良好技術基礎。

    (本文首發鈦媒體App,作者|林志佳)

      本站是提供個人知識管理的網絡存儲空間,所有內容均由用戶發布,不代表本站觀點。請注意甄別內容中的聯系方式、誘導購買等信息,謹防詐騙。如發現有害或侵權內容,請點擊一鍵舉報。
      轉藏 分享 獻花(0

      0條評論

      發表

      請遵守用戶 評論公約

      類似文章 更多

      主站蜘蛛池模板: 国产精品普通话国语对白露脸| 92精品国产自产在线观看481页| 少妇又爽又刺激视频| 成人国产精品日本在线观看| 色欲色香天天天综合网WWW| 亚洲高清成人av在线| 亚洲精品无码成人AV电影网| 日韩深夜免费在线观看| 国产高跟黑色丝袜在线| 国产在线播放专区av| 又爽又黄又无遮挡的视频| 日本深夜福利在线观看| 果冻传媒MV国产推荐视频| 欧洲中文字幕一区二区| 精品无码国产自产拍在线观看| 日本一道一区二区视频| 免费久久人人爽人人爽AV| 亚洲欧美人成电影在线观看| 久久久亚洲AV波多野结衣| 欧美一本大道香蕉综合视频| 少妇被躁爽到高潮无码人狍大战| AV喷水高潮喷水在线观看COM| 欧美国产日韩A在线观看 | 国产偷国产偷亚洲高清人| 成人啪精品视频网站午夜| 激情综合色综合啪啪开心| 又色又爽又黄的视频网站| 亚洲精品无码成人A片九色播放| 亚洲精品无码中文久久字幕| 国产性色的免费视频网站| 日韩系列精品无码免费不卡| 最新AV中文字幕无码专区| 国产精品午夜福利视频| 日韩精品一区二区三区视频| 国产成A人片在线观看视频下载 | 亚洲中文字幕精品久久久久久动漫| 国产成人啪精品午夜网站| 欧美成人免费全部| 99精品人妻少妇一区二区| 亚洲AVAV天堂AV在线网阿V| 久久亚洲精品无码播放|