大模型企業化應用需要解決的問題

以下文章來源于 AI 探索時代，作者 DFires

作者 | DFires

來源 | Al 探索時代，管理智慧

咨詢合作 | 13699120588

文章僅代表作者本人觀點，圖片來源于 pixabay

" 企業級大模型應用要比想象中的複雜的多，技術是爲業務服務"

在企業級應用場景中，大模型的落地是一個系統性問題或者說是工程，同時涉及到業務，資源 ( 包括人力，資金，技術等 ) ，現有的技術架構等多個領域，而非是單一的大模型本身的問題。

而太多的人太過關注于技術和模型本身，而這樣的結果就是一葉障目，不見泰山。

思考一下，如果讓你負責大模型技術的引入，并做一份詳細的方案，你應該怎麽做？

下面就來讨論一下大模型在企業級應用場景中的問題。

企業引入大模型所面臨的問題

企業引入大模型的前提是其能夠對業務進行賦能，能夠提升當前業務的效能，或者開辟新的業務線。

如果抛開這個前提，那麽引入大模型是否是一個好的選擇就是一個需要思考的問題。

爲什麽說企業引入大模型是一個系統性的問題，因爲它涉及到多個方面，需要有一套完整的企業級解決方案，而不是一時的心血來潮。

企業引入大模型需要考慮哪些問題？

企業引入大模型主要需要從兩個方面考慮，一是業務側；二是技術側。但同時還要結合公司技術實力，資金，人力，運營成本等多個方面進行考慮。

業務側

任何技術都是爲業務服務的，因此如果一項技術對業務沒有幫助，那麽技術的存在就沒有任何意義。

所以，企業引入大模型之前，首先要考慮大模型是否能解決業務問題；其次就是，怎麽把技術和業務相結合。

技術側

技術側需要考慮的問題就比較多了；主要包括以下幾個方面，模型的選擇與評估，訓練數據的準備，模型訓練和微調，知識庫的搭建，模型優化與部署，模型的使用等。

模型引入方案

首先關于模型的評估與選擇，怎麽選擇一個模型，選擇哪個模型？模型的評估标準是什麽？

模型的選擇不隻是一個純粹的技術問題，它是業務和技術的結合；選擇模型首先考慮的是滿足業務需求，其次需要考慮的是選擇商業模型還是開源模型。

在企業應用中，商業模型的優勢是技術門檻低，但在一些垂直領域的應用中，表現可能不盡人意。

開源模型的優勢是，可以完全定制化，可以根據業務需要使用自身的業務數據進行訓練和微調；缺點是技術難度較高，維護成本高。

因此，在一些比較垂直的領域内，使用開源模型比較好；而在一些比較普通和邊緣化的業務，使用第三方商業模型比較好。

當然，某些第三方的商業模型也提供了訓練和微調的接口，用戶可以根據自己的需求在其模型之上進行重新訓練或微調。

但如果對數據安全有要求，那麽還是使用開源模型本地部署比較好。

其次關于模型的評估，自從人工智能産生以來，模型評估就是一個有争議的話題；因爲随着技術的發展，人工智能也有了很大的變化，從機器學習到深度學習，以及現在的生成式人工智能。

不同的技術階段對應着不同的任務類型，比如在機器學習和深度學習階段，人工智能技術的主要領域是分類任務和預測任務 ( 回歸模型 ) ；這種基于監督學習的機器模型有一個明确的标準。

比如，一個分類的機器學習模型，是否能識别貓和狗，這是一個很明确的結果。

但在生成式 AI 時代，模型生成的文字，圖片是一個沒有标準的結果；你可以說它好，我也可以說它不好。

因此，根據這些就提出了幾個評估标準：

在分類模型中，主要有準确率，召回率等；在文本生成領域，主要有 BLEU 和 METEOR 指标；圖像生成領域又有 Perceptual Loss，Frechet Inception Distance 等方法。

市場上的評估工具：SuperCLUE，Ragas，MMLU，Open LLM Leaderboard，C-Eval 等

在垂直領域内，模型的訓練數據是必不可少的；而模型的訓練和微調又需要大量的 GPU 和能源需求；目前一款合格的企業級模型，訓練一次的成本少說也要大幾十萬。

最重要的是，模型的訓練一次很難獲得好的結果，可能需要多次的訓練，甚至到最終都無法訓練出一款合格的大模型。

而模型的優化和部署問題，不能像個人使用那樣，随便找一台服務器即可；而是要通過使用并行計算框架，使用分布式部署的方式，使得大模型能夠支撐高并發和高可用。

根據不同的并行方式，又會有不同的實現方式和框架。

比如，Data Parallel, ZeRO，DeepSpeed 等

最後，由于大模型天生的知識滞後性；因此，本地知識庫的搭建是必不可少的一個過程。而怎麽用本地知識庫解決大模型的幻覺問題，也是一個值得思考的問題。

由此可見，一套企業級的大模型應用方案，需要考慮很多問題；不隻是技術上的，還有非技術上的。

怎麽選擇，訓練和微調一個大模型不難，難的是怎麽訓練出一個合格的，可以應用于企業服務的大模型才難。