Copyright ? www.livewu.com. All Rights Reserved
山東省人民政府 版權(quán)所有
來源: 2026-02-24 14:40:51
記者從山東省工信廳了解到,圍繞高端裝備、煙草制品業(yè)、農(nóng)副食品加工業(yè)、家具制造業(yè)、木材加工、皮革毛皮羽毛及其制品和制鞋業(yè)、儀器儀表制造業(yè)、廢棄資源綜合利用業(yè)等行業(yè),山東將開展語料庫揭榜掛帥項(xiàng)目申報(bào),重點(diǎn)推進(jìn)行業(yè)關(guān)鍵數(shù)據(jù)技術(shù)攻關(guān)、行業(yè)數(shù)據(jù)語料標(biāo)準(zhǔn)研制、高質(zhì)量行業(yè)語料庫打造、語料應(yīng)用場(chǎng)景落地等。
重點(diǎn)行業(yè)語料庫揭榜掛帥項(xiàng)目,聚焦工業(yè)制造重點(diǎn)行業(yè)的基礎(chǔ)理論研究、產(chǎn)品研發(fā)設(shè)計(jì)、生產(chǎn)管理運(yùn)行、過程質(zhì)量檢測(cè)等關(guān)鍵環(huán)節(jié)和特定場(chǎng)景的知識(shí)語料匯聚,基于結(jié)構(gòu)化數(shù)據(jù)(如數(shù)據(jù)庫中的表格數(shù)據(jù))、非結(jié)構(gòu)化數(shù)據(jù)(如文本、圖像、語音等)和半結(jié)構(gòu)化數(shù)據(jù)(如日志文件、XML文件等),通過清洗、去噪和統(tǒng)一格式,用于支持自然語言處理、計(jì)算機(jī)視覺、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等任務(wù),滿足行業(yè)大模型或場(chǎng)景大模型開發(fā)、訓(xùn)練和微調(diào)需求的高質(zhì)量語料庫。項(xiàng)目驗(yàn)收時(shí)行業(yè)相關(guān)語料庫數(shù)據(jù)量不低于10萬條,具有較高的數(shù)據(jù)質(zhì)量、領(lǐng)域覆蓋程度、潛在價(jià)值和應(yīng)用成效,項(xiàng)目驗(yàn)收時(shí)應(yīng)通過第三方測(cè)評(píng);同時(shí),山東鼓勵(lì)各行業(yè)語料庫項(xiàng)目加快語料資源優(yōu)化整合,積極開放公共語料。(大眾新聞?dòng)浾?付玉婷)