今日,科大訊飛發(fā)布了當前全國產(chǎn)算力平臺上唯一的深度推理大模型——訊飛星火X1。該模型中文數(shù)學能力國內(nèi)第一,并率先應用于教育、醫(yī)療等剛需場景。
一直以來,訊飛星火堅持走全國產(chǎn)化路線。盡管在全國產(chǎn)算力平臺上訓練深度推理模型遭遇了諸多挑戰(zhàn),但科大訊飛攜手華為,成功攻克了訓練推理強交互、高吞吐推理優(yōu)化以及國產(chǎn)算子優(yōu)化等一系列難題,最終成功訓練出我國首個基于全國產(chǎn)算力訓練的具備深度思考和推理能力的大模型——訊飛星火X1。
發(fā)布會上,科大訊飛研究院的研究員們依次展示了訊飛星火X1解答高考題、AIME競賽題以及高中奧賽題的表現(xiàn)。訊飛星火X1不僅準確給出了這些題目的答案,還對解題思路和步驟進行了詳細拆解。與通用大模型相比,其解題過程更接近人類的“慢思考”方式。
過程中,訊飛星火X1充分展現(xiàn)深度推理模型的三大典型特征:化繁為簡,將復雜問題分步拆解簡化;進行自我探索和反思驗證;基于答案正確與否的優(yōu)質(zhì)反饋信息進行強化訓練。
值得一提的是,訊飛星火X1在近期參加的小初高(含競賽)、大學(含競賽)、AIME、MATH 500等多項“考試”中成績十分亮眼,用更少的算力,實現(xiàn)了業(yè)界一流的效果,多項指標國內(nèi)第一。
訊飛星火X1率先在教育等真實場景中實現(xiàn)了應用落地。去年1024,科大訊飛聯(lián)合中國教育科學研究院發(fā)布了基于“問題鏈”的高中數(shù)學智能教師助手。同時也正面向全國百個試點區(qū)域、聯(lián)合千名優(yōu)秀教研員和老師打造上萬個優(yōu)秀案例。目前,星火X1已經(jīng)部署上述試點區(qū)域,并廣獲好評,體驗過的老師們紛紛表示,X1在一題多解、教學知識關聯(lián)、拓展學生高階思維等方面表現(xiàn)出色。訊飛星火X1也將成為學生和家長的幫手,隨著相關技術的深度融入,科大訊飛AI學習機學習推薦和診斷將變得更加精準,解題思路和知識鏈條將更加清晰,后續(xù)也將持續(xù)升級。
醫(yī)療領域,訊飛星火X1的模型策略已取得初步驗證成效,可使得?戚o助診斷和復雜病歷內(nèi)涵質(zhì)控的準確率均達90%。發(fā)布會上,科大訊飛還宣布將在今年上半年正式發(fā)布基于訊飛星火X1的醫(yī)療大模型升級版,確保其深層次診斷推理效果和質(zhì)控能力業(yè)界領先。
同時,訊飛星火4.0 Turbo底座能力再次迎來全新升級,圖文、數(shù)學和長文本能力顯著提升,并首發(fā)混域知識搜索技術,進一步解決行業(yè)、企業(yè)痛點。據(jù)介紹,基于訊飛星火X1的高質(zhì)量合成數(shù)據(jù),訊飛星火4.0 Turbo的數(shù)學能力變得更強,可以在數(shù)學教學、金融分析和科研推演等工作中更好的幫助用戶。
根據(jù)第三方數(shù)據(jù),2024年,訊飛星火在大模型中標數(shù)量和中標金額上取得“雙第一”,尤其是在能源、金融、汽車、運營商等行業(yè),與客戶共同打磨了近百個智能體應用。
科大訊飛還推出了業(yè)界首個具備端到端語音到語音同傳能力的大模型——星火語音同傳大模型,最快語音同傳時延小于5秒。
技術測試結(jié)果顯示,即便將訊飛的語音同傳技術和國外最優(yōu)競品的交傳技術對比,訊飛語音同傳在內(nèi)容完整度、信息準確度以及語言質(zhì)量上都處于領先水平,同時星火語音同傳大模型還可以最快實現(xiàn)僅5秒的同傳時延,達到人類專家譯員的水平。
發(fā)布會最后,科大訊飛透露,針對語音到語音的同傳場景,訊飛翻譯機將會配置耳機、音箱、麥克風,在2025年推出商務套裝,滿足用戶在不同的商務洽談場景的使用需求。