最新科學大模型浦科化學(ChemLLM),發布即開源!
這是上海 AI 實驗室最新開源成果,它基于書生 · 浦語 2.0 強大的基座模型能力,通過注入海量化學專業數據,使大模型獲得理解和處理化學相關專業任務的知識與能力。
值得一提的是,在獲得化學能力同時,大模型的數理學科及推理能力還得到增強。
目前該模型支持免費商用。
化學領域超越 ChatGPT
浦科化學具備專業的化學知識能力。
可以精準翻譯研究論文中的各種專業名詞:
還能回答高中化學試題,并給出解釋。
在多項測試中,浦科化學的表現都大幅超過其他模型。
研究人員通過 3 個任務來測試模型專業能力:
分子名稱轉換
分子性質預測
反應産物預測
這些任務分别涉及化學物質的表示、性質和轉化,是化學研究的基礎和核心。
分子名稱轉換要求模型能夠在不同分子表示方式之間進行準确轉換,如 SMILES、IUPAC 名稱、分子式等。
分子性質預測方面,要求模型能根據分子的結構和組成,預測其化學性質,如沸點、密度、溶解度等。
反應産物預測方面,要求模型能根據給定的反應物和反應條件預測反應産物的結構。
結果顯示,浦科化學在這三項任務上均表現出色,分别獲得 22.0、49.0 和 7.0 的分數,遠超過其他同規模模型的水平,并超越了 GPT-3.5,證明浦科化學在理解和處理化學知識方面具備強大能力。
泛理科能力湧現
在化學能力提升的同時,浦科化學在數學、物理及推理方面的能力也都得到提升。
研究人員使用 MMLU(大規模多任務語言理解數據集)作爲測試集來評估浦科化學在通用場景下的性能,對語言模型的多項任務能力進行測試評估,并将浦科化學與其他同等規模的模型進行比較,以評估化學訓練數據對基礎模型的影響。
評測結果顯示,浦科化學在大學化學任務上得分爲 47.0,超越了所有其他模型。
研究人員發現,盡管沒有對浦科化學進行數學和物理學科的訓練,模型在大學數學、大學物理、STEM(科學、技術、工程和數學)類等相關領域上也獲得了最佳成績。
同時,浦科化學在形式邏輯任務上也達到了最高水平。
上述結果表明,當對大模型進行進行化學專業訓練時,其數理及推理能力也能得到增強。
有趣的是,浦科化學在道德場景、人文科學類、社會科學類等分項任務上也展現了優異的平均性能,這說明,對大模型進行專業某個學科的知識訓練,不僅不會讓大模型 " 分心 ",反而有助于其道德水平及一般任務水平的提升。
據了解,上海 AI for Science 團隊面向化學、物理、生命、地球等科學領域,通過深入研究各學科基礎理論,結合最新人工智能理論,探索 AI 驅動重大科學問題的研究範式,加速人工智能在化學、藥物研發、新材料、氣象等領域的滲透與落地。
其中,AI for Chemistry 方面的研究以語言模型爲核心,通過大模型連接智能化實驗設備,全方位提升實驗效率,從而實現化學研究的自動化和智能化。相關研究範式的創新,将助推科學發現速度,實現更大的社會效益。
未來,基于浦科化學模型,人工智能可爲化學研究提供智能化輔助,如化學合成路徑規劃、化學反應條件優化、實驗結果自動化分析等,從而提升化學研究的效率和質量。
開源地址:
https://huggingface.co/AI4Chem/ChemLLM-7B-Chat
— 完 —
點這裏關注我,記得标星哦~
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~