久久精品精选,精品九九视频,www久久只有这里有精品,亚洲熟女乱色综合一区
    分享

    太強了!各個行業的AI大模型!金融、教育、醫療、法律..

     mrjiangkai 2024-08-25 發布于上海

    一、醫療領域大模型

    1、DoctorGLM

    基于ChatGLM-6B的卓越中文問診模型,它融合了海量的中文醫療對話數據集進行精準微調,采用lora、p-tuningv2等前沿技術實現高效部署。

    項目地址:https://github.com/xionghonglin/DoctorGLM

    論文地址:https:///abs/2304.01097

    2、BenTsao (本草)

    該項目集大成者,開源了多款經過中文醫學指令微調的大語言模型,涵蓋LLaMA、Alpaca-Chinese、Bloom等,皆以醫學知識圖譜和醫學文獻為基礎,結合ChatGPT API精心打造,實現了中文醫學指令微調數據集的精準訓練,極大提升了醫療領域問答的準確性與實用性。

    項目地址:https://github.com/SCIR-HI/Huatuo-Llama-Med-Chinese

    論文地址:https:///abs/2304.06975

    3、Med-ChatGLM

    該項目同樣基于中文醫學指令微調,對ChatGLM-6B模型進行了深度優化,微調數據與BenTsao項目一脈相承,確保了模型在醫療領域的卓越表現。

    項目地址:https://github.com/SCIR-HI/Med-ChatGLM

    4、BianQue (扁鵲)

    該項目開創性地推出了生活空間健康大模型,深度整合了當前開源的中文醫療問答數據集,結合自建的生活空間健康對話大數據,構建了千萬級別的扁鵲健康大數據BianQueCorpus,基于此精心打造了ChatGLM-6B為初始化的BianQue模型,全面提升了模型在醫療與健康領域的應用價值。

    項目地址:https://github.com/scutcyr/BianQue

    5、HuatuoGPT (華佗)

    該項目鼎力推出醫療大模型HuatuoGPT,其中包括了基于Baichuan-7B訓練的HuatuoGPT-7B與基于Ziya-LLaMA-13B-Pretrain-v1的HuatuoGPT-13B,旨在提供全方位、高標準的醫療智能服務。

    項目地址:https://github.com/FreedomIntelligence/HuatuoGPT

    論文地址:https:///abs/2305.15075

    6、QiZhenGPT該項目通過啟真醫學知識庫的精妙運用,構建了獨具匠心的中文醫學指令數據集,進一步在Chinese-LLaMA-Plus-7B、CaMA-13B、ChatGLM-6B等尖端模型上精心調整指令,顯著提升了模型在中文醫療環境中的實用效果。

    項目地址:https://github.com/CMKRG/QiZhenGPT

    7、ChatMed

    該項目創新性地發布了中文醫療大模型ChatMed-Consult,以ChatMed_Consult_Dataset中超過50萬的中文醫療在線問診數據及ChatGPT的精準回復作為訓練基石,基于LlaMA-7b并通過LoRA技術進行了細致微調。

    項目地址:https://github.com/michael-wzhu/ChatMed

    8、ShenNong-TCM-LLM(神農)

    該項目推出了中文中醫藥領域的杰出模型ShenNong-TCM-LLM,以中醫藥知識圖譜為基礎,運用實體為核心的自指令方法,通過ChatGPT生成了豐富的2.6萬+中醫藥指令數據集ChatMed_TCM_Dataset,再基于LlaMA底座,借助LoRA技術進行了精準微調。

    項目地址:https://github.com/michael-wzhu/ShenNong-TCM-LLM

    9、XrayGLM

    該項目開創了中文多模態醫學數據集與模型的先河,尤其在醫學影像診斷與多輪交互對話中展現出卓越的潛能。

    項目地址:https://github.com/WangRongsheng/XrayGLM

    10、MedicalGPT

    該項目隆重推出了醫療大模型MedicalGPT,集成了增量預訓練、有監督微調、RLHF(獎勵建模、強化學習訓練)和DPO(直接偏好優化)等前沿技術。

    項目地址:https://github.com/shibing624/MedicalGPT

    11、Sunsimiao(孫思邈)

    該項目推出了中文醫療大模型Sunsimiao,該模型以baichuan-7B和ChatGLM-6B為堅實底座,在數十萬條高質量的中文醫療數據中進行了精心微調。

    項目地址:https://github.com/thomas-yanxin/Sunsimiao

    12、CareLlama(關懷羊駝)

    項目地址:https://github.com/itsharex/CareLlama

    該項目推出了醫療大模型CareLlama,并匯集了數十個公開可用的醫療微調數據集和開放可用的醫療大語言模型,旨在為醫療LLM的快速發展注入強勁動力。

    13、DISC-MedLLM

    該項目由復旦大學發布,針對醫療健康對話式場景精心設計了醫療領域大模型與數據集。模型通過DISC-Med-SFT數據集在Baichuan-13B-Base基礎上進行指令微調,有效匹配了醫療場景下的人類偏好,縮小了通用語言模型輸出與真實世界醫療對話之間的差距。項目地址:https://github.com/FudanDISC/DISC-MedLLM

    論文地址:https:///abs/2308.14346

    14、PMC-LLaMA

    本項目公開了前沿的醫療大模型PMC-LLaMA,其中包含MedLLaMA_13B預訓練版本與PMC_LLaMA_13B指令微調版本,為醫療領域帶來了革新的技術突破。

    項目地址:https://github.com/chaoyi-wu/PMC-LLaMA

    論文地址:https:///abs/2304.14454

    15、ChatDoctor

    ChatDoctor,一款基于LLaMA訓練的醫療大模型,其開源特性讓更多人能夠領略醫療科技的魅力。

    項目地址:https://github.com/Kent0n-Li/ChatDoctor

    論文地址:https:///abs/2303.14070

    16、MING (明醫)

    項目地址:https://github.com/189569400/MedicalGPT-zh

    MING,一個基于bloomz-7b指令微調而成的醫療大模型,其卓越的性能在醫療問答、智能問診等方面得到了充分體現。

    17、IvyGPT

    IvyGPT,一款醫療大模型,經過高質量的醫學問答數據監督微調和人類反饋強化學習訓練,展現了出色的智能醫療處理能力。

    項目地址:https://github.com/WangRongsheng/IvyGPT

    18、PULSE

    本項目開源了中文醫療大模型PULSE,該模型采用約4,000,000個中文醫學與通用領域指令微調數據進行優化,支持廣泛的醫療領域自然語言處理任務,包括健康教育、醫師考試問題解答、報告解讀、醫療記錄結構化以及模擬診斷和治療等。

    項目地址:https://github.com/openmedlab/PULSE

    19、HuangDI (皇帝)

    HuangDI,一款中醫大模型,其獨特之處在于融合了中醫教材、網站數據與Ziya-LLaMA-13B-V1基座模型,打造出具有深厚中醫知識理解力的預訓練模型,并通過海量中醫古籍指令對話數據與通用指令數據進行微調,實現中醫古籍知識問答的精準能力。

    項目地址:https://github.com/Zlasejd/HuangDI

    20、ZhongJing (仲景)

    ZhongJing,一個旨在傳承中醫精髓與現代技術相結合的中醫大模型。該項目不僅弘揚了中醫的博大精深,還通過現代技術創新,為醫學領域提供了可信賴和專業的工具,是中醫與AI融合的杰出代表。項目地址:https://github.com/pariskang/CMLM-ZhongJing

    21、TCMLLM

    該項目旨在通過大型模型技術,實現中醫臨床輔助診療(包括病證診斷、處方推薦等)以及中醫藥知識問答等多項任務,引領中醫知識問答與臨床輔助診療等領域的飛躍性進步。當前,我們已針對中醫臨床智能診療中的處方推薦問題,發布了TCMLLM-PR這一中醫處方推薦大模型。該模型通過整合真實世界的臨床病歷、醫學典籍與中醫教科書等海量數據,精心構建了包含68k數據條目的處方推薦指令微調數據集,并在ChatGLM大模型上進行深度優化與微調。

    項目地址:https://github.com/2020MEAI/TCMLLM

    22、OpenBioMed

    該項目致力于開源多模態生物醫學大模型,涵蓋了BioMedGPT這一多模態生物醫藥大模型、DrugFM和MolFM等多模態小分子基礎模型,以及CellLM等細胞表示學習模型。

    項目地址:https://github.com/PharMolix/OpenBioMed

    論文地址:https:///abs/2308.09442

    PromptCBLUE醫療評測基準

    PromptCBLUE是一個針對中文醫療場景的評測基準,通過二次開發CBLUE基準,將16種不同的醫療場景NLP任務全面轉化為基于提示的語言生成任務,為中文醫療領域的研究提供了有力的支持。

    項目地址:https://github.com/michael-wzhu/PromptCBLUE

    論文地址:https:///abs/2308.04823

    中文醫療模型評估基準CMB

    A Comprehensive Medical Benchmark in Chinese(CMB)是一項綜合性的中文醫療模型評估基準,它涵蓋了不同臨床職業、不同職業階段考試中的多項選擇題(CMB-Exam)以及基于真實病例的復雜臨床診斷問題(CMB-Clin),為中文醫療模型的評估提供了全面的參考。

    論文地址:https:///abs/2308.08833

    項目地址:https://github.com/FreedomIntelligence/CMB

    二、4大心理健康領域大模型

    1、MeChat

    該項目致力于開源中文心理健康支持對話大模型與數據集。該模型基于ChatGLM-6B LoRA 16-bit指令進行了細致的微調。同時,我們通過ChatGPT技術將真實的心理互助QA改寫為多輪的心理健康支持多輪對話,構建了含有56k個多輪對話的豐富數據集。該數據集的主題、詞匯和篇章語義豐富多樣,特別適用于長程多輪對話的應用場景。

    項目地址:https://github.com/qiuhuachuan/smile

    **2、SoulChat (靈心)**該項目開源了心理健康大模型SoulChat(靈心)。該模型源于ChatGLM-6B的深厚底蘊,經過百萬規模心理咨詢領域的中文長文本指令與多輪共情對話數據的精心微調,得以誕生。它不僅僅是一個模型,更是人們心靈的守護者,靜靜傾聽,深情理解。

    項目地址:https://github.com/scutcyr/SoulChat

    3、MindChat(漫談)

    這一項目致力于開源心理大模型MindChat。經過人工精心清洗的約20萬條高質量多輪心理對話數據,涵蓋了工作、家庭、學習、生活、社交、安全等多個層面,為模型的訓練提供了豐富的素材。MindChat期望從心理咨詢、心理評估、心理診斷、心理治療四個維度,為人們帶來心靈的慰藉與解脫,提升整體的心理健康水平。

    項目地址:https://github.com/X-D-Lab/MindChat

    4、QiaoBan(巧板)

    在兒童情感陪伴領域,QiaoBan這一兒童情感對話大模型應運而生。它基于開源通用大模型,融合了通用域人機對話、單輪指令數據以及專為兒童設計的情感陪伴對話數據,經過精心微調,最終形成了這款專為兒童量身打造的情感陪伴大模型。

    項目地址:https://github.com/HIT-SCIR-SC/QiaoBan

    三、10大法律領域微調模型及2大評測基準

    1、LawGPT_zh(獬豸)

    這一中文法律通用模型源自ChatGLM-6B與LoRA 16-bit指令的精心融合。數據集方面,項目團隊不僅利用了現有的法律問答數據集,更通過self-Instruct技術,基于法條和真實案例構建了高質量的法律文本問答數據,大幅提升了模型在法律領域的表現,確保了回答的專業性和可靠性。

    項目地址:https://github.com/LiuHC0428/LAW-GPT

    2、LaWGPT

    LaWGPT系列模型在通用中文基座模型的基礎上,增添了法律領域的專有詞表和大規模中文法律語料,極大地增強了模型在法律領域的基礎語義理解能力。結合法律領域對話問答數據集、中國司法考試數據集的指令精調,LaWGPT對法律內容的理解和執行能力得到了顯著提升。

    項目地址:https://github.com/pengxiao-song/LaWGPT

    3、LexiLaw

    LexiLaw,這一中文法律大模型,以ChatGLM-6B為架構基礎,經過法律領域數據的精心微調,使得其在法律咨詢與支持方面展現出卓越的性能和專業性。無論是法律從業者、學生還是普通用戶,LexiLaw都能為他們提供準確、可靠的法律咨詢服務,助力他們在法律問題的海洋中乘風破浪。

    項目地址:https://github.com/CSHaitao/LexiLaw

    4、Lawyer LLaMA

    這一項目開源了法律領域的指令微調數據和基于LLaMA訓練的中文法律大模型Lawyer LLaMA。Lawyer LLaMA以其卓越的性能和深度,為法律領域帶來了前所未有的創新與突破。LLaMA經過大規模法律語料庫的預訓練,深入系統地學習了中國的法律知識體系。在此基石之上,我們借助ChatGPT的智慧,搜集了一系列針對中國國家統一法律職業資格考試客觀題的分析和法律咨詢的回答,并通過對這些寶貴數據的指令微調,使模型具備了將法律知識靈活應用于各種具體場景的能力。

    探索詳情,請訪問項目地址:https://github.com/AndrewZhe/lawyer-llama

    深入研讀,可訪問論文地址:https:///abs/2305.15062

    5、HanFei (韓非)

    HanFei-1.0作為國內首個全參數訓練的法律大模型,擁有高達7b的參數量,其功能涵蓋法律問答、多輪對話、文章撰寫、檢索等多元化需求。

    項目地址:https://github.com/siat-nlp/HanFei

    6、ChatLaw

    北京大學開源的法律大模型系列——ChatLaw,依托海量的法律新聞、論壇、法條、司法解釋、法律咨詢、法考題及判決文書等原始文本,構建了豐富的對話數據。ChatLaw-13B和ChatLaw-33B便是基于姜子牙-13B、Anima-33B的卓越訓練成果。同時,ChatLaw-Text2Vec更是利用93萬條判決案例,基于BERT訓練出相似度匹配模型,精準匹配用戶提問與對應法條。

    項目地址:https://github.com/PKU-YuanGroup/ChatLaw

    論文地址:https:///abs/2306.16092

    7、Lychee (律知)

    我們開源了基于GLM-10B模型的中文司法領域大模型Law-GLM-10B,經過30GB中文法律數據的指令微調,展現出卓越的司法領域應用能力。

    項目地址:https://github.com/davidpig/lychee_law

    8、wisdomInterrogatory (智海-錄問)

    由浙江大學、阿里巴巴達摩院及華院計算攜手打造的法律大模型,該模型基于Baichuan-7B進行了法律領域數據的深度預訓練與指令微調,并獨具匠心地設計了知識增強的推理流程。

    項目地址:https://github.com/zhihaiLLM/wisdomInterrogatory

    9、JurisLMs

    該項目基于豐富的中文法學語料庫,精心訓練了一系列法律領域的語言模型,包括:

    1. AI Judge——一款可解釋的法律判決預測模型,由GPT2在法學語料上深化預訓練,并結合法條適用模型(基于BERT的分類器)微調而成,不僅能精準預測判決結果,更能闡述法院的審理觀點;

    2. AI Lawyer——一款智能法律咨詢模型,通過主動學習在有限的數據上進行精細微調,能夠針對用戶咨詢,精確匹配并應用相應的法律法規進行回答。

    項目地址:https://github.com/seudl/JurisLMs

    10、夫子·明察司法大模型

    該模型匯聚了法律領域的智慧,致力于司法領域的深度應用與探索。以ChatGLM為基石,我們精心構建了一個中文司法大模型,它依托海量的中文無監督司法語料與精準的有監督司法微調數據。這款模型功能豐富,涵蓋法條檢索、案例分析、三段論推理判決以及司法對話等,致力于為用戶提供全面且精準的法律咨詢與解答服務。

    項目地址:https://github.com/irlab-sdu/fuzi.mingcha

    在法律評測領域,LEXTREME作為一個多語言的法律評測基準,覆蓋24種語言,擁有11個評測數據集,其權威性和全面性備受認可。

    項目地址:https://github.com/JoelNiklaus/LEXTREME

    論文地址:https:///abs/2301.13126

    另一法律評測基準LexGLUE,專注于英文法律評測,以其獨特的視角和深度在業界獲得了廣泛認可。

    項目地址:https://github.com/coastalcph/lex-glue

    論文地址:https:///abs/2110.00976

    四、10大金融領域微調模型及3大評測基準

    1、BBT-FinCUGE-Applications

    該項目不僅開源了中文金融領域語料庫BBT-FinCorpus,還推出了知識增強型大模型BBT-FinT5及評測基準CFLEB,展現了其在金融領域的深厚積累。

    論文地址:https:///abs/2302.09432

    項目地址:https://github.com/ssymmetry/BBT-FinCUGE-Applications

    2、Cornucopia (聚寶盆)

    該項目憑借對公開和爬取的中文金融領域問答數據的深入挖掘,構建了獨特的指令數據集,并對LLaMA系模型進行了精準指令微調,顯著提升了模型在金融領域的問答效果。

    項目地址:https://github.com/jerry1993-tech/Cornucopia-LLaMA-Fin-Chinese

    3、XuanYuan (軒轅)

    作為國內首個開源的千億級中文對話大模型,軒轅更是針對中文金融領域進行了深度優化。它基于BLOOM-176B進行了針對性預訓練與微調,既能處理通用領域問題,又能提供全面且準確的金融信息與建議。

    項目地址:https://github.com/Duxiaoman-DI/XuanYuan

    論文地址:https:///abs/2305.12002

    4、PIXIU (貔貅)項目地址:https://github.com/chancefocus/PIXIU

    論文地址:https:///abs/2306.05443 本項目公開了金融領域的指令微調數據集FIT,以及大型模型FinMA與評估基準FLARE,為金融領域注入了智能化新動力。

    5、FinGPT

    本項目貢獻了多個金融領域的大模型,涵蓋ChatGLM2-6B+LoRA和LLaMA2-7B+LoRA等,并匯集了金融新聞、社交媒體、財報等多維度中英文訓練數據。項目地址:https://github.com/AI4Finance-Foundation/FinGPT

    論文地址:https:///abs/2306.06031

    6、FLANG

    本項目傾力打造了金融大模型FLANG,為金融行業的智能化發展再添新翼。項目地址:https://github.com/SALT-NLP/FLANG

    論文地址:https:///abs/2211.00083

    10、FinEval

    FinEval,一個專注于金融知識的評測基準,匯聚了4,661道高質量多項選擇題,覆蓋金融、經濟、會計、證書等多個領域,涉及34個不同學術科目。項目地址:https://github.com/SUFE-AIFLM-Lab/FinEval

    論文地址:https:///abs/2308.09975

    金融領域評測基準:FLARE

    FLARE,一個專為金融領域打造的評測基準,它涵蓋了金融知識理解和預測等任務,助力金融行業智能化發展。項目地址:https://github.com/chancefocus/PIXIU

    論文地址:https:///abs/2306.05443

    金融領域評測基準:CFLEB

    CFLEB,一個面向中文金融領域的評測基準,包含了語言生成與理解的多項任務,為中文金融領域智能化評測提供了有力工具。項目地址:https://github.com/ssymmetry/BBT-FinCUGE-Applications

    論文地址:https:///abs/2302.09432

    金融領域評測基準:FLUE

    FLUE,作為金融評測基準的新星,匯集了5個金融領域數據集,為金融智能化評測提供了全新視角。項目地址:https://github.com/SALT-NLP/FLANG論文地址:https:///abs/2211.00083

    五、兩大教育領域引領潮流的大模型

    1、桃李 (Taoli)

    該項目引領了國際中文教育領域的潮流,通過開源大模型,匯集了500余冊國際中文教育教材與教輔書、漢語水平考試試題以及漢語學習者詞典等資源,構建了國際中文教育資源庫。精心設計的88000條高質量問答數據集,讓模型在國際中文教育場景中靈活應用知識。

    項目地址:https://github.com/blcuicall/taoli

    2、EduChat

    該項目在教育垂直領域展現出了卓越的對話能力,其大模型融合了多樣化的教育資源,并通過指令微調、價值觀對齊等方法,為教育場景下的出題、作業批改、情感支持等提供了全面支持。它服務于教師、學生和家長,致力于實現智能化、個性化的教育。

    項目地址:https://github.com/icalk-nlp/EduChat

    論文地址:https:///abs/2308.02773

    六、自媒體領域的創新之作

    1、MediaGPT

    該項目展示了中文自媒體領域的新銳力量,通過在大規模自媒體語料上進行預訓練,系統地學習自媒體知識體系。借助ChatGPT等技術,MediaGPT在抖音運營、短視頻創作等領域展現出卓越的實際應用能力。

    項目地址:https://github.com/IMOSR/MediaGPT

    七、電商領域的佼佼者

    1、EcomGPT

    該項目推出的電商大模型EcomGPT,憑借其出色的性能,在電商領域內脫穎而出。基于BLOOMZ在電商領域的指令微調數據集,EcomGPT在多個電商評測數據集上超越了ChatGPT,為電商領域帶來了智能化的新體驗。

    項目地址:https://github.com/Alibaba-NLP/EcomGPT

    論文地址:https:///abs/2308.06966

    八、政務領域的智慧選擇

    YaYi (雅意)

    該項目推出的多領域大模型YaYi (雅意),憑借其百萬級高質量領域數據和上百種自然語言指令任務,為媒體宣傳、輿情分析、公共安全等領域提供了智慧化的解決方案。

    項目地址:https://github.com/wenge-research/YaYi

    九、天文地理領域的璀璨之星

    1、StarGLM該項目正式發布了天文大模型StarGLM,它依托于司天工程的豐富語料與知識庫,經過精細訓練而成。StarGLM的誕生,旨在破解大語言模型在天文知識及前沿變星領域所面臨的挑戰,從而進一步夯實了未來在天文多模態任務中的基礎,并為望遠鏡陣列中的司天大腦(數據智能處理系統)的部署鋪平了道路。

    項目詳情可訪問:https://github.com/Yu-Yang-Li/StarGLM

    2、K2

    K2,這款地球科學大模型,其靈感源于LLaMA,并巧妙地融合了地球科學文獻與維基百科的精髓。進一步的指令微調,更是在GeoSignal數據集的滋養下得以實現。

    項目鏈接:https://github.com/davendw49/k2

    相關論文:https:///abs/2306.05064

    天文地理領域的璀璨之星——GeoGLUE

    GeoGLUE,這一由阿里巴巴達摩院與高德聯袂推出的地理語義理解評測基準,旨在點燃地理文本處理技術的火花,推動社區共榮。多個核心場景被精心提煉,包括地圖搜索、電商物流、政府登記與金融交通等,每個場景都圍繞六大核心任務展開:門址地址要素解析、地理實體對齊、Query-POI庫召回、Query-POI相關性排序、地址Query成分分析以及WhereWhat切分。

    項目詳情:https:///datasets/damo/GeoGLUE/summary

    相關論文:https:///abs/2305.06545

    十、交通領域的璀璨新星

    1、TransGPT (致遠)

    TransGPT,這一交通領域的明星大模型,以“致遠”為名,寓意深遠。它深植于真實交通行業,致力于實現多種實用功能,包括交通情況預測、智能咨詢助手、公共交通服務、交通規劃設計、交通安全教育、協助管理、交通事故報告與分析以及自動駕駛輔助系統等。TransGPT作為通用常識交通大模型,為道路工程、橋梁工程、隧道工程、公路運輸、水路運輸、城市公共交通運輸、交通運輸經濟、交通運輸安全等行業提供了廣博的通識知識。以之為基石,可以靈活運用于各種交通應用場景。

    項目鏈接:https://github.com/DUOMO/TransGPT

    十一、網絡安全領域的守護者

    1、AutoAudit

    AutoAudit,這款網絡安全大模型,猶如網絡安全領域的守護者,以強大的自然語言處理能力為安全審計和網絡防御提供了堅實的后盾。它具備分析惡意代碼、檢測網絡攻擊、預測安全漏洞等能力,為安全專業人員提供了不可或缺的支持。

    項目鏈接:https://github.com/ddzipp/AutoAudit

    十二、科技前沿的兩大模型

    1、TechGPT

    TechGPT,這款科研領域的巨星模型,其潛力與應用價值正逐步被發掘。在未來的科研道路上,它將發揮出無可替代的作用。我們榮幸地宣布,我們已成功開源了一款卓越的科技大模型——TechGPT。該模型專注于計算機科學、材料、機械、冶金、金融及航空航天等十余種專業領域,深度集成了領域術語抽取、命名實體識別、關系三元組抽取等先進功能。不僅如此,TechGPT還擁有文本關鍵詞生成、標題生成摘要、文本領域識別等自然語言理解和生成能力,進一步拓展了其在機器閱讀理解、基礎常識問答、基于上下文的知識問答等多個場景的應用。其出色的文案生成、中英互譯以及簡單代碼生成功能,無疑將為科研人員和技術開發者提供極大的便利。

    項目地址:https://github.com/neukg/TechGPT

    2、開源科技論文大模型——Mozi(墨子)

    這款模型專為科技文獻問答和情感分析設計,旨在為用戶提供精準的文獻解答與深入的情感洞察。

    項目地址:https://github.com/gmftbyGMFTBY/science-llm

    論文地址:https://github.com/gmftbyGMFTBY/science-llm/blob/main/asset/mozi_technical_report.pdf

    ??附:大模型數據集&評測基準匯總

    • C-Eval 圖片 [paper] 圖片

      • C-Eval是一個由上海交通大學發布的中文基礎模型評測基準,包含了13948個多項選擇題,涵蓋了人文,社科,理工,其他專業四個大方向,52個學科,從中學到大學研究生以及職業考試。

    • AGIEval 圖片 [paper] 圖片

      • AGIEval是一個由微軟發布的評測基準,用于評估大模型在人類認知任務中的表現,包含了20個面向普通考生的官方、公開、高標準入學和資格考試,包括普通大學入學考試 (中國高考和美國SAT考試)、法學院入學考試、數學競賽和律師資格考試、國家公務員考試等。

    • Xiezhi (獬豸) 圖片 [paper] 圖片

      • Xiezhi是一個由復旦大學發布的綜合的、多學科的、能夠自動更新的領域知識評測基準,包含了哲學、經濟學、法學、教育學、文學、歷史學、自然科學、工學、農學、醫學、軍事學、管理學、藝術學這13個學科門類,516個具體學科,249587道題目。

    • CMMLU 圖片 [paper] 圖片

      • CMMLU是一個綜合性的中文評測基準,專門用于評估語言模型在中文語境下的知識和推理能力。CMMLU涵蓋了從基礎學科到高級專業水平的67個主題。它包括:需要計算和推理的自然科學,需要知識的人文科學和社會科學,以及需要生活常識的中國駕駛規則等。此外,CMMLU中的許多任務具有中國特定的答案,可能在其他地區或語言中并不普遍適用。因此是一個完全中國化的中文測試基準。

    • MMCU 圖片 [paper] 圖片

      • MMCU是一個綜合性的中文評測基準,包括來自醫學、法律、心理學和教育等四大領域的測試。

    • CG-Eval 圖片 [paper] 圖片

      • CG-Eval是一個由甲骨易AI研究院與LanguageX AI Lab聯合發布的針對中文大模型生成能力的評測基準。包含了科技與工程、人文與社會科學、數學計算、醫師資格考試、司法考試、注冊會計師考試等六個大科目類別下的55個子科目的11000道不同類型問題。CG-Eval包含一套復合的打分系統:對于非計算題,每一道名詞解釋題和簡答題都有標準參考答案,采用多個標準打分然后加權求和;對于計算題目,會提取最終計算結果和解題過程,然后綜合打分。

    • CBLUE 圖片 [paper] 圖片

      • CBLUE是一個中文醫學語言理解評測基準,包含8個中文醫療語言理解任務。

    • PromptCBLUE 圖片 [paper] 圖片

      • PromptCBLUE是一個面向中文醫療場景的評測基準,通過對CBLUE基準進行二次開發,將16種不同的醫療場景NLP任務全部轉化為基于提示的語言生成任務。

    • LAiW 圖片 [paper] 圖片

      • LAiW 是一個中文法律大模型評測基準,針對3大能力設計13個基礎任務:1)法律 NLP 基礎能力:評測法律基礎任務、 NLP 基礎任務和法律信息抽取的能力,包括法條推送、要素識別、命名實體識別、司法要點摘要和案件識別 5 個基礎任務;2)法律基礎應用能力:評測大模型對法律領域知識的基礎應用能力,包括爭議焦點挖掘、類案匹配、刑事裁判預測、民事裁判預測和法律問答 5 個基礎任務;3)法律復雜應用能力:評測大模型對法律領域知識的復雜應用能力,包括司法說理生成、案情理解和法律咨詢 3 個基礎任務。

    • LawBench 圖片 [paper] 圖片

      • LawBench 是一個面向中國法律體系的法律評測基準。LawBench 模擬了司法認知的三個維度,并選擇了20個任務來評估大模型的能力。與一些僅有多項選擇題的現有基準相比,LawBench 包含了更多與現實世界應用密切相關的任務類型,如法律實體識別、閱讀理解、犯罪金額計算和咨詢等。

    • LegalBench 圖片 [paper] 圖片

      • LegalBench 是一個面向美國法律體系的法律評測基準,包含162個法律推理任務。

    • LEXTREME 圖片 [paper] 圖片

      • LEXTREME是一個多語言的法律評測基準,包含了24種語言11個評測數據集。

    • LexGLUE 圖片 [paper] 圖片

      • LexGLUE是一個英文法律評測基準。

    • CFBenchmark 圖片 [paper] 圖片

      • CFBenchmark是一個旨在評估大語言模型在中文金融場景下輔助工作的評測基準。CFBenchmark的基礎版本包括3917個金融文本涵蓋三個方面和八個任務,從金融識別、金融分類、金融生成三個方面進行組織。

    • FinanceBench 圖片 [paper] 圖片

      • FinanceBench是一個用于評估開放式金融問題問答的評測基準,包含 10,231 個有關上市公司的問題,以及相應的答案。

    • FinEval 圖片 [paper] 圖片

      • FinEval是一個金融知識評測基準,包含了4,661個高質量的多項選擇題,涵蓋金融、經濟、會計和證書等領域,34個不同的學術科目。

    • FLARE 圖片 [paper] 圖片

      • FLARE是一個金融評測基準,包含了金融知識理解和預測等任務。

    • CFLEB 圖片 [paper] 圖片

      • CFLEB是一個中文金融評測基準,包含兩項語言生成任務和四項語言理解任務。

    • FLUE 圖片 [paper] 圖片

      • FLUE是一個金融評測基準,包含5個金融領域數據集。

    • GeoGLUE [paper] 圖片

      • GeoGLUE是一個由阿里巴巴達摩院與高德聯合發布的地理語義理解能力評測基準,旨在推動地理相關文本處理技術和社區的發展。本榜單提煉了其中多個典型場景:地圖搜索、電商物流、政府登記、金融交通,并設計了六個核心任務:門址地址要素解析、地理實體對齊、Query-POI庫召回、Query-POI相關性排序、地址Query成分分析、WhereWhat切分。

    • OWL-Bench 圖片 [paper] 圖片

      • OWL-Bench 是一個面向運維領域的雙語評測基準。它包含 317 個問答題和 1000 個多選題,涵蓋了該領域的眾多現實工業場景,包括信息安全、應用、系統架構、軟件架構、中間件、網絡、操作系統、基礎設施和數據庫這九個不同的子領域。以確保 OWL-Bench 能夠展現出多樣性。

    • DevOps-Eval 圖片 圖片

      • DevOps-Eval是由螞蟻集團聯合北京大學發布的面向DevOps領域的大語言模型評測基準。

    總結

    本文全面概述了當前垂直領域模型與評測基準,涵蓋了12個領域,57個領域微調模型,并配備了豐富的評測數據集,以供各界參考與借鑒。圖片

    參考文獻


    1、https://github.com/luban-agi/Awesome-Domain-LLM

      本站是提供個人知識管理的網絡存儲空間,所有內容均由用戶發布,不代表本站觀點。請注意甄別內容中的聯系方式、誘導購買等信息,謹防詐騙。如發現有害或侵權內容,請點擊一鍵舉報。
      轉藏 分享 獻花(0

      0條評論

      發表

      請遵守用戶 評論公約

      類似文章 更多

      主站蜘蛛池模板: 欧美激情一区二区久久久| 少妇被粗大的猛进出69影院| 国内熟妇人妻色在线视频 | 成年视频人免费网站动漫在线| 熟睡人妻被讨厌的公侵犯| 日韩精品中文字幕有码| 久久国产精品成人影院| 国产精品未满十八禁止观看| 国产日韩久久免费影院| 色翁荡熄又大又硬又粗又视频| 亚洲人成电影网站 久久影视| 亚洲中文字幕无码爆乳APP| 美女自卫慰黄网站| 老子午夜精品无码| 国产一区二区一卡二卡| 国产午夜无码视频在线观看| 最新偷拍一区二区三区| 女人被黑人躁得好爽视频| 亚洲日韩性欧美中文字幕| 国产精品毛片无码| 国产精品爆乳在线播放第一人称| 一夲道无码人妻精品一区二区| 亚洲欧美中文日韩V在线观看| 在线a级毛片无码免费真人| 亚洲精品无码中文久久字幕| 午夜大片免费男女爽爽影院| 内射毛片内射国产夫妻| 18禁超污无遮挡无码网址| 国产精品视频午夜福利| 又大又粗又爽A级毛片免费看| 成在人线AV无码免观看| 亚洲乱理伦片在线观看中字| 亚洲中文在线精品国产| 把女人弄爽大黄A大片片 | 精品国产美女福到在线不卡| 中文字幕在线精品国产| 无码AV中文字幕久久专区| 国产一区二区三区日韩精品| 又湿又紧又大又爽A视频男| 日韩欧国产精品一区综合无码| 日韩放荡少妇无码视频|