您現(xiàn)在的位置是:gi?i thích t? l? cá c??c bóng ?á >>正文
gi?i thích t? l? cá c??c bóng ?á
t? l? cá c??c bóng ?á indo8166人已圍觀
簡介專題:2025 INCLUSION·外灘大會:重塑創(chuàng)新增長炒股就看金麒麟分析師研報,權(quán)威,專業(yè),及時,全面,助您挖掘潛力主題機(jī)會!新浪科技訊 9月13日下午消息,在2025Inclusion·外灘大會...
專題:2025 INCLUSION·外灘大會:重塑創(chuàng)新增長
炒股就看金麒麟分析師研報,權(quán)威,專業(yè),及時,全面,助您挖掘潛力主題機(jī)會!
新浪科技訊 9月13日下午消息,在2025 Inclusion·外灘大會“Data meets AI:智能時代的雙引擎”見解論壇上,產(chǎn)學(xué)界的多位權(quán)威專家給出了新解法:數(shù)據(jù)驅(qū)動了AI發(fā)展,AI也讓數(shù)據(jù)迎來了新一輪的進(jìn)化,雙引擎融合驅(qū)動才是演進(jìn)方向。
復(fù)旦大學(xué)教授肖仰華指出,當(dāng)前大模型發(fā)展正面臨嚴(yán)峻的“數(shù)據(jù)墻”困境,無標(biāo)簽語料對模型性能提升的貢獻(xiàn)日益減弱,更大規(guī)模數(shù)據(jù)帶來的性能提升與所需的訓(xùn)練開銷相比性價比顯著降低。他認(rèn)為,大模型數(shù)據(jù)科學(xué)需要從專家經(jīng)驗階段發(fā)展到量化科學(xué)、直至自進(jìn)化階段?!按竽P偷臄?shù)據(jù)gi?i thích t? l? cá c??c bóng ?á實踐需要屠呦呦式的研究,從海量雜亂的數(shù)據(jù)中提取出決定模型能力的關(guān)鍵成分”。
肖仰華分享了通過語法復(fù)雜度指標(biāo)和累積分布采樣方法篩選高質(zhì)量語料的實踐,實驗表明,從100億個token的財經(jīng)語料中僅篩選20%的高質(zhì)量數(shù)據(jù)進(jìn)行訓(xùn)練,對模型進(jìn)行持續(xù)預(yù)訓(xùn)練,相比于全量數(shù)據(jù)持續(xù)預(yù)訓(xùn)練,在領(lǐng)域問答任務(wù)上的準(zhǔn)確率提升1.7%。
上海交通大學(xué)特聘教授翟廣濤強(qiáng)調(diào)無論是精煉數(shù)據(jù)還是合成數(shù)據(jù),都需要質(zhì)量優(yōu)先,而數(shù)據(jù)質(zhì)量分析要從“體驗質(zhì)量”入手,考慮人的體驗,也考慮機(jī)器的體驗,進(jìn)而在數(shù)據(jù)為中心的范式下進(jìn)一步提升大模型性能。
海天瑞聲CEO李科從產(chǎn)業(yè)實踐角度分享了全球AI數(shù)據(jù)行業(yè)的發(fā)展趨勢。他認(rèn)為,數(shù)據(jù)產(chǎn)業(yè)正在經(jīng)歷從勞動密集型向技術(shù)密集型和知識密集型的重大轉(zhuǎn)型。通過動捕數(shù)據(jù)、自動gi?i thích t? l? cá c??c bóng ?á駕駛標(biāo)注、思維鏈數(shù)據(jù)集等多個實際案例,李科展示了高質(zhì)量數(shù)據(jù)如何服務(wù)千行百業(yè)。
上海庫帕思科技有限公司董事長山棟明說,模型之變引領(lǐng)“數(shù)據(jù)質(zhì)變”,他表示高質(zhì)量數(shù)據(jù)集應(yīng)滿足VALID2(鮮活度、真實性、大樣本、完整性、多樣性、高知識密度)要求,并詳細(xì)介紹了語料數(shù)據(jù)在方法論、基礎(chǔ)設(shè)施和行業(yè)生態(tài)三個方面的體系化重構(gòu)探索。(羅寧)

責(zé)任編輯:常福強(qiáng)
Tags:
相關(guān)文章
原極氪副總裁朱凌加入沃爾沃汽車亞太區(qū),擔(dān)任首席運營官
gi?i thích t? l? cá c??c bóng ?á新浪科技訊 9月4日下午消息,沃爾沃近日宣布,自2025年9月1日起,朱凌正式加入沃爾沃汽車亞太區(qū),擔(dān)任首席運營官COO),并直接向亞太區(qū)總裁兼首席執(zhí)行官CEO)袁小林匯報。資料顯示,朱凌畢業(yè)于浙江大...
閱讀更多
拍我AI宣布接入谷歌Nano Banana,創(chuàng)意視頻生成免費6天
gi?i thích t? l? cá c??c bóng ?á新浪科技訊 9月5日上午消息,AI視頻生成平臺拍我AI宣布成接入谷歌NanoBanana谷歌 Gemini 2.5 Flash Image),同時開啟為期六天的限時免費活動——拍我AI免費開放日,持續(xù)...
閱讀更多
智元四足機(jī)器人D1系列發(fā)布,同步上線智元商城開售
gi?i thích t? l? cá c??c bóng ?á新浪科技訊 8月18日上午消息,智元機(jī)器人宣布推出三款四足機(jī)器人產(chǎn)品 ——聚焦文娛商演與教育科研領(lǐng)域的D1 Pro、D1 Edu,以及面向工業(yè)級應(yīng)用的D1 Ultra。目前,該系列產(chǎn)品同步登陸智元商城...
閱讀更多