DeepSeek-R1的“天賦異稟”
為各行各業(yè)注入了全新變量
中國電信政企信息服務(wù)事業(yè)群
迅速組建DeepSeek攻堅隊
深度融合行業(yè)數(shù)據(jù)
憑借“強化學(xué)習(xí)”與“知識蒸餾”
兩大核心技術(shù)
成功完成了41個行業(yè)大模型的升級
為產(chǎn)業(yè)智能化進程按下加速鍵
強化學(xué)習(xí),小模型撬動大效能
此次升級以“輕量化部署、場景精準(zhǔn)適配、推理效率提升”為目標(biāo),通過技術(shù)創(chuàng)新推動大模型從通用能力向行業(yè)縱深拓展,為千行百業(yè)提供低成本、高效率的智能化解決方案。以下將通過行業(yè)大模型的13個典型代表,展示本次攻堅成果。
此次升級將強化學(xué)習(xí)(RL)與行業(yè)知識深度融合,在保證專業(yè)性的同時大幅降低算力門檻。通過強化學(xué)習(xí)訓(xùn)練,在教育、衛(wèi)健、能源、政法公安、交通等多個領(lǐng)域取得了顯著成果。
教育行業(yè)
通過純強化學(xué)習(xí)訓(xùn)練,讓1.5B小模型在數(shù)學(xué)解題準(zhǔn)確率上超越傳統(tǒng)7B模型,響應(yīng)速度提升40%。這種“小模型、大智慧”的技術(shù)路徑,使得基層教育機構(gòu)也能享受AI紅利。
衛(wèi)健行業(yè)
其打造的1.5B輕量化導(dǎo)診模型,以85.1的綜合得分反超大參數(shù)模型基線,僅需500條脫敏數(shù)據(jù)即完成訓(xùn)練,為基層醫(yī)療機構(gòu)提供了高效的智能導(dǎo)診解決方案。
能源行業(yè)
在能源行業(yè)問答領(lǐng)域,通過對9700條蒸餾數(shù)據(jù)集的訓(xùn)練,7B模型的準(zhǔn)確率提升12.2%。升級后的模型能夠快速解答復(fù)雜的能源行業(yè)問題,顯著提升了能源行業(yè)的智能化應(yīng)用水平。
政法公安行業(yè)
通過強化學(xué)習(xí),Qwen-7B模型在法律領(lǐng)域的準(zhǔn)確率提升9%,顯著增強了模型在法律知識理解和復(fù)雜案件推理中的表現(xiàn)。
交通行業(yè)
在交通政策法規(guī)問答場景中,強化學(xué)習(xí)顯著提升了模型的效果,證明了思維鏈和獎勵強化對模型進行微調(diào)是提升交通行業(yè)大模型行之有效的方法。
知識蒸餾,數(shù)據(jù)煉金術(shù)賦能行業(yè)智能
面對行業(yè)高質(zhì)量數(shù)據(jù)稀缺難題,此次升級采用“大模型反哺小模型”的數(shù)據(jù)生態(tài),通過知識蒸餾技術(shù),顯著提升了各行業(yè)大模型的性能,其中在政務(wù)、車企、工業(yè)、文宣、農(nóng)業(yè)、住建、要客、應(yīng)急等領(lǐng)域的效果尤為突出。
政務(wù)行業(yè)
通過DeepSeek-V3生成高質(zhì)量思維鏈數(shù)據(jù),僅用200條標(biāo)注數(shù)據(jù)即讓14B模型意圖識別準(zhǔn)確率增加15%,為政務(wù)熱線領(lǐng)域的多輪對話意圖識別提供了高效解決方案。
車企行業(yè)
其借助DeepSeek-V3補全的行業(yè)推理數(shù)據(jù),使14B小模型在智能座艙分類任務(wù)中以92.7的綜合得分超越未微調(diào)的千億級大模型,精準(zhǔn)識別智能座艙用戶提出的導(dǎo)航、娛樂等問題分類。
工業(yè)行業(yè)
通過SFT訓(xùn)練,模型在工業(yè)領(lǐng)域的專業(yè)性顯著提升,輸出的內(nèi)容更加貼近實際應(yīng)用場景的需求,邏輯嚴(yán)密且重點突出。
文宣行業(yè)
通過行業(yè)數(shù)據(jù)蒸餾后的模型,在文旅問答和路徑規(guī)劃任務(wù)中表現(xiàn)優(yōu)異,問答評分達(dá)到87.1的綜合得分,路徑規(guī)劃評分接近DeepSeek-V3-671B和GLM-4-PLUS的水平。
農(nóng)業(yè)行業(yè)
通過對4408條農(nóng)業(yè)數(shù)據(jù)的訓(xùn)練,14B模型的綜合得分從83.7提升至87.2,升級后的模型能夠快速解答復(fù)雜的農(nóng)業(yè)問題,為農(nóng)業(yè)領(lǐng)域的智能化轉(zhuǎn)型提供了有力支撐。
住建行業(yè)
通過使用高質(zhì)量行業(yè)數(shù)據(jù),在工地施工規(guī)范告警中達(dá)到高質(zhì)量實時預(yù)警,微調(diào)后的模型在深度推理上效果提升明顯,能夠運用在住建領(lǐng)域的工地施工規(guī)范告警中,達(dá)到高質(zhì)量實時預(yù)警目的。
要客行業(yè)
在國防動員、資源分配方案生成與選擇任務(wù)中,使用蒸餾數(shù)據(jù)進行SFT微調(diào)顯著提升了模型的思考、推理與回答能力,SFT后的模型在方案生成任務(wù)中表現(xiàn)優(yōu)異。
應(yīng)急行業(yè)
通過DeepSeek-R1蒸餾得到的推理數(shù)據(jù),顯著提升了模型在應(yīng)急行業(yè)數(shù)據(jù)中的準(zhǔn)確率,SFT后的模型準(zhǔn)確率提高13%,在14B的模型上效果遠(yuǎn)超未微調(diào)的DeepSeek-V3模型。
基于中國電信
“數(shù)據(jù)安全可控、模型快速迭代、
服務(wù)靈活擴展”的一體化能力
政企信息服務(wù)事業(yè)群將繼續(xù)深耕行業(yè)場景
加速行業(yè)大模型規(guī)?;涞?/p>
全面賦能“新質(zhì)生產(chǎn)力”高質(zhì)量發(fā)展