11月24日,DataFunCon 2023在深圳舉辦,本次大會以“大模型時代的變與不變”為主題,探討大模型的技術變革、產業實踐及未來發展趨勢。作為金融科技的代表性企業,奇富科技首席算法科學家費浩峻和大模型專家楊劍受邀出席,與多位技術專家共同探討大模型發展路徑,分享奇富科技大模型的技術特性及實踐成果。
奇富科技大模型專家楊劍出席DataFunCon 2023
楊劍采用深入淺出的語言,把金融行業大模型比作一輛復雜構造的汽車。業務理解是這輛汽車的中控,技術儲備是汽車的框架,而安全合規則是汽車的方向盤。在這輛大模型汽車上,金融行業獨有數據充當燃料,邏輯推理則是發動機和動力系統,算力儲備就如同汽車的輪胎,保證汽車可持續行駛。行業規范和安全隱私保護則構成了大模型汽車行駛的道路,而復雜的金融業務場景則是指示牌,引導汽車按照規律行駛。
金融行業大模型有著比其他行業大模型更高的復雜性。就像高速上行駛的汽車需要不斷調整方向和車速,以適應不同時間、不同地點的道路狀況,金融行業大模型也需要及時調整以適應多樣化的復雜業務場景。由于金融行業大模型的容錯率極低,一次錯誤的決策可能導致無法估量的時間和成本損耗,因此對于這輛“汽車”而言,方向的準確性至關重要。此外,考慮到金融行業的特殊性,其合規要求相對于其他行業更為嚴格,這使得大模型汽車必須在規范要求的道路內行駛,不能隨意越線。
為了更好地處理多樣化的復雜業務場景,確保金融行業大模型的安全規范應用,楊劍提出了一系列觀點。
首先,他強調金融行業大模型必須要由人來駕馭,強調了人機協同的必要性。大模型作為對人的一系列反饋、幫助和建議,需要在實踐中與人類合作,共同推動業務的發展。
其次,金融行業大模型容錯率低的特性,也決定了其需要更高的可靠性。因此,奇富科技將大模型應用主要集中在若干領域優先嘗試,如營銷系統識別、AI客服、代碼SQL糾錯、AIGC自動化投放、風險輔助識別等幾個場景,以提高大模型的可靠性和穩定性。
奇富科技大模型專家楊劍出席DataFunCon 2023
第三,建設金融行業大模型必須具備軟硬實力。在軟實力方面,需要具備深入而敏銳的業務場景洞察,以及嚴格的合規把控。在硬實力方面,多維度且數量充沛的數據、深厚的技術積淀、可持續調用的充足算力都必不可少。
以奇富科技為例。從業務場景洞察上看,奇富科技通過深耕業務,將金融業務流程拆分成一系列可智能化場景的能力,在業務理解、數據理解、技術拆解、技術賦能四個角度上,都具備成熟的方法論和實踐經驗。
在數據方面,奇富科技通過利用海量數據,如金融圖譜數據、用戶對話數據、金融行為數據、高頻問答數據以及行業報告數據,幫助大模型理解信貸業務的場景、產品與規律。金融領域大模型不僅僅是算力、數據和參數規模的比拼,更需要進行差異化、精確化的數據篩選,以提高參與訓練的數據質量。奇富科技通過低質過濾、冗余去除、質量打分、數據分類、隱私消除、數據篩選、token切分排序拼接等多個步驟,最終壓縮篩選數據集合,挑選最可信可用的集合進行后續訓練和優化。
在技術儲備方面,奇富科技擁有多模態和NLP領域的長期技術積累。其涵蓋全場景的語音機器人,專屬場景的圖文識別,大規模應用于風險管理、意圖識別、廣告營銷場景的自然語言處理,以及規?;闹R圖譜,都為大模型的發展提供了堅實的技術基礎。通過這些經驗,奇富科技在金融領域大模型建設中展現了較為完善的方法論和實踐經驗,為應對多樣化、復雜的業務場景提供了有力的支持。
在金融大模型落地的實踐中,奇富科技通過大模型的強大賦能實現了令人矚目的業務成效。在電銷系統中,語義分析和線索挖掘幫助提升電銷線索識別準確率高達98%,同時將轉化率提高超過5%。在智能營銷環節,大約70%的圖片素材由大模型生成,并通過大模型對素材進行標注和多維度評級,以實現廣告投放的優化。在通話質檢環節,大模型自動化質檢實現了100%覆蓋,將檢出率提高了15%。在語音機器人話術生成場景,生成話術優質率已達70%。
奇富科技在大模型建設中所形成的方法論和實踐經驗,為整個金融行業提供了寶貴的參考。楊劍總結,在復雜多變的金融業務場景中,只有通過深刻理解業務、精準利用數據、不斷創新技術,才能充分釋放出大模型的潛力,發揮出其對于業務的巨大價值。