app download
feedback
go to top
Ads Service
ad-news2
ad-news2

開源模型加速建構智慧生態

2025-03-28 13:18:02 文章来源: 新華網
33次阅读
新闻取自各大新闻媒体,新闻内容并不代表本网立场!

如果讓你說出今年人工智慧領域最轟動的一件事情,那大部分人的答案應該是DeepSeek的橫空出世。今年2月初,DeepSeek在140個國家和地區的應用市場下載排行榜同時登頂,並以開源策略充分展現其技術自信。

開源大模型是指由研究機構或公司開發並公開發布的大規模預訓練模型,其原始碼、參數權重甚至是訓練資料(或資料產生方法)都開放透明,任何人都可以存取、使用、修改和分發。

「DeepSeek是一款完整的開源模型,將各個環節包括數據、代碼、權重、推理鏈的運行思路、工程構建方法都開放出來,讓更多人願意參與進去。」賽迪研究院信軟所軟體產業研究室副主任黃文鴻解釋,由此可見,DeepSeek開放程度之高前所未有,這也是其一發布就產生巨大影響的原因之一。

降低生態建構成本

DeepSeek對於我國人工智慧產業發展最大的意義在於,其建構了基於自主研發基座大模型的開發生態,從軟硬體的適配到應用推廣甚至產品宣傳,都是全球廠商和開發者共同完成的,極大降低了生態建設成本。例如,微軟、英偉達、亞馬遜、英特爾、AMD等全球科技巨頭相繼宣布上線了DeepSeek開源模型推理服務,國內廠商諸如騰訊雲、阿里雲均支援DeepSeek的一鍵部署和呼叫。

「這就像安卓作業系統是開源軟體一樣,因為開源具有良好的適配性,手機、晶片、智慧家庭等各類廠商紛紛接入,讓安卓成為行動互聯網時代能夠與蘋果IOS系統並駕齊驅的通用技術底座。」黃文鴻告訴記者,互聯網企業、車企、三大運營商等其基礎上將提高其市場基礎,後續

除DeepSeek以外,我國還有不少開源模型在業界引起廣泛關注。就在DeepSeek-R1發布前,上海AI新創公司MiniMax發布了其開源模型MiniMax-01,首次採用線性注意力機制,實現了技術突破;阿里巴巴最新開源的通義千問QwQ-32B推理模型,在數學、代碼及通用能力的多項權威評測集中表現良好,穩居全球範圍最先進的自由式社群模式。

「這些都彰顯了開源對科技生態的推動作用,吸引了業內各方支持,形成良好的技術分享氛圍。」黃文鴻認為,資訊科技領域具有強者恆強的發展規律,我國在開源模型上是有先發優勢的,必須進一步築牢技術「護城河」。但目前各行各業真正懂開源模型的人才並不多,基於開源大模型的下游企業,以及做工程優化、模型調優的研發人員相對較少,高校應該培養更多相關人才,共同促成“創新—共享—再創新”,助力產業生態更加完備。

阿里雲高級總監朱迅垚認為,開源理念在產業界還沒有形成廣泛共識,但DeepSeek和通義千問的成功會讓大家逐步認識到,開源模型將成為推動我國人工智慧發展最強勁的引擎。下一步,建議從國家到地方再到企業,以更積極的態度擁抱開源,同時在佈局智能算力、構建高品質數據集、上雲用雲等方面加快創新步伐,緊跟世界先進水平。

推動應用落地

DeepSeek發布以來,各行各業都在探索將其融入自身業務場景。 「開源模型憑藉其低成本、高性能、高開放度的技術優勢,加速了人工智慧在產業的普及速度。」黃文鴻說。

今年2月,恆生電子大模型應用全面接取DeepSeek,在金融投研、合規、營運、投資等業務場景中取得較好效果。例如,在投資銀行業務中,利用DeepSeek-R1理解能力,可自動解析招股書、盡調報告等複雜文檔,實現財務資料校驗、合規風險提示的秒級回應。

通義千問開源模型Qwen系列更是憑藉其多模態、全尺寸的技術能力,以及由數量龐大的開發者和中小企業匯聚起的良好生態,加快賦能千行百業。截至目前,阿里已開源200多款模型,包括文字生成模型、視覺理解/生成模型、語音理解/生成模型、文生圖及視訊模型等多模態,涵蓋從0.5B到110B參數的各類尺寸。

去年4月,中國科學院國家天文台人工智慧工作小組發布了基於Qwen打造的新一代天文大模型「星語3.0」。目前已成功接入國家天文台興隆觀測站望遠鏡陣列Mini“司天”,可實現自主控制望遠鏡進行觀測、分析觀測結果,聰明地給出下一步觀測建議,這是大模型在天文觀測領域的首次應用。 「從預測蛋白質結構到合成標靶藥物,再到發現新的病毒種類,大模型與科研相結合帶來了許多突破性成果。」朱迅垚說。

DeepSeek也好,通義千問也罷,我國開源模型正以其寬鬆的開發許可和低成本的訓練方式,提升人工智慧在業界的應用廣度。

商業模式仍需明晰

以ChatGPT為代表的閉源模型,其商業模式被稱為“token(令牌)經濟”,即透過向用戶提供API服務,基於token用量計價,然後來賺取利潤。那麼,開源模型又是如何獲利的呢?

對此,黃文鴻向記者分享了幾個案例。 Meta公司推出的Llama大模型透過開源可以吸引更多企業和開發者加入其生態,為後續廣告收入創造機會。

市場上也出現了開源閉源並行的模型產品。具體而言,首先開放出來相對基礎的能力,培養使用者使用習慣,而更高效能的模式則需付費使用。還有的開源模型會與雲端服務綁定販售,相當於模型是免費的,收取的只是算力費用。 「這種模式就好比你想用IOS系統就必須配備蘋果手機。再有更相似的案例是,谷歌透過安卓系統吸引用戶,再透過販售谷歌信箱、谷歌地圖等增值服務收取費用。」黃文鴻補充道。

在朱迅垚看來,許多做開源模型的企業具有濃厚的技術理想主義色彩,他們的初衷未必完全是奔著商業化去的。 「通義千問大模型在全球擁有超過10萬個衍生模型和上億次下載量,這些都是免費提供給用戶的。但正因為開源,大量開發者被吸引過來,阿里雲的模型服務和配套算力服務得到更多開發者青睞,開發者跟廠商形成一個'開源—應用—反饋'的良性循環。」

開源模式的發展仍處於初期階段,如何形成健康成熟的商業模式產業仍在探索中。 「企業做開源模型肯定是想獲利的,要摸索出一條正向循環發展路徑,在科技普惠和商業變現間尋找到平衡點,讓產業鏈上各個環節的參與者都能受益,確保開源模式持續穩定運轉下去。」黃文鴻建議。

评论

0