清華大學發布《大語言模型綜合性能評估報告》：GPT-4第一，文心一言更懂中文

2023-08-10 23:52:13閱讀()IT之家

近日，清華大學新聞與傳播學院教授、博士生導師沈陽所在團隊發布了《大語言模型綜合性能評估報告》(下文簡稱“報告”)，報告顯示總得分率GPT-4第一，百度文心一言在三大維度20項指標中綜合評分國內第一，超越ChatGPT，其中中文語義理解排名第一，部分中文能力超越GPT-4。

據了解，報告本次評估選取了GPT-4、ChatGPT 3.5、文心一言、通義千問、訊飛星火、Claude、天工7個大語言模型，圍繞生成質量、使用與性能、安全與合規三大維度，全面考察大語言模型上下文理解、中文語義理解、誤導信息識別、邏輯推理、內容安全性、隱私保護等20項指標。綜合來看，文心一言語義理解能力突出，特別是具備更好的中文理解能力，更懂中國文化，同時時效性強、內容安全把握細微，這源于其知識增強、檢索增強和對話增強的技術創新。

在生成質量方面，基于對語義理解、輸出表達、適應泛化的綜合評測，文心一言得分率76.98%，僅次于GPT-4，領先于包括ChatGPT在內的其他大語言模型。其中，在部分中文語義理解方面，文心一言以92%的得分率排名榜首。

在安全合規方面，基于對內容安全性、偏見和公平性、隱私保護等綜合評測，文心一言得分率 78.18%，與GPT-4并列排名第一。

點擊展開全文∨

掃一掃，手機繼續看

特別聲明：文章多為招考官網轉載，如有侵權請聯系！
部分數據為彩果考試網(www.jcz9c.cn)收集整理，轉載或復制請注明出處！-彩果考試網-

上一篇：報告稱大學生返鄉就業比例上升

下一篇：工信部要求開展App備案，2024年4月前完成

黄色一级视屏-黄色一级小视频-黄色一级影片-黄色一级在线-永久在线视频-又污又黄又无遮挡的网站国产

清華大學發布《大語言模型綜合性能評估報告》 ：GPT-4第一，文心一言更懂中文

清華大學發布《大語言模型綜合性能評估報告》：GPT-4第一，文心一言更懂中文