您現(xiàn)在的位置:首頁 > 綜合 > 特別關注 > 正文

科創(chuàng)板第三家!定增布局AI大模型 海天瑞聲擬募資7.9億用于訓練數(shù)據(jù)集建設

時間:2023-06-21 22:02:43    來源:科創(chuàng)板日報    

《科創(chuàng)板日報》6月21日訊(記者 張洋洋)云從科技、星環(huán)科技之后,又一家科創(chuàng)板公司定增投向大模型。

6月21日下午,海天瑞聲發(fā)布公告,擬定增募資不超過7.9億元,用于AI大模型訓練數(shù)據(jù)集建設項目、數(shù)據(jù)生產(chǎn)垂直大模型研發(fā)項目。


【資料圖】

此前的3月30日,“AI四小龍”之一的云從科技也披露了一份定增預案,公司擬向不超過35名發(fā)行對象發(fā)行股份不超過2.22億股,募集資金不超過36.35億元,扣除發(fā)行費用后擬全部用于云從“行業(yè)精靈”大模型研發(fā)項目。

緊接著6月7日,星環(huán)科技也發(fā)布定增預案公告,擬定增募資不超15.21億元,扣除發(fā)行費用后的募集資金凈額將用于數(shù)據(jù)分析大模型建設項目、智能量化投研一體化平臺建設項目、數(shù)據(jù)要素安全與流通平臺建設項目、AI知識助理建設項目以及研發(fā)及運營中心建設項目。

根據(jù)海天瑞聲今日的公告,本次定增項目擬建設AI大模型訓練數(shù)據(jù)集,即生產(chǎn)用于通用型、及各種垂直領域大模型訓練的海量、高品質(zhì)數(shù)據(jù)集;擬購置辦公樓作為建設大模型訓練數(shù)據(jù)研發(fā)生產(chǎn)基地,并購置數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)存儲和辦公等軟硬件設備。

具體而言,這些數(shù)據(jù)集產(chǎn)品具體可分為三大類:

通用及特定垂直領域的大語言模型訓練數(shù)據(jù)集,包括但不限于: 中文大模型預訓練語料數(shù)據(jù)集(含通用場景、特定場景、對話場景、指令 集等);多語言大模型預訓練語料數(shù)據(jù)集(含通用場景、對話場景、指令集等)。

多模態(tài)大模型訓練數(shù)據(jù)集:可應用于多語言圖文大模型訓練、多模態(tài)數(shù)字 人訓練、多語種語音大模型訓練、全場景自動駕駛大模型訓練等場景的跨模 態(tài)數(shù)據(jù)集。

大模型評測數(shù)據(jù)集:可應用于大模型的能力、任務、指標等方面的評測。

海天瑞聲稱,這次定增項目建成后,將提供可供大模型訓練和評測的不少于10個品類的專業(yè)數(shù)據(jù)集。

作為一家從事AI數(shù)據(jù)訓練的公司,今年以來,因大模型的爆火,海天瑞聲的股價也進一步抬升。年初至今,公司股價漲幅已達172.45%。

從具體的業(yè)務落地情況來看,根據(jù)海天瑞聲在互動平臺的回復,公司提供的訓練數(shù)據(jù)覆蓋智能語音(語音識別、語音合成等)、計算機視覺、自然語言等多個AI核心領域,可服務于包括具身智能等在內(nèi)的多場景人工智能應用的開發(fā)。

根據(jù)公司最新披露的調(diào)研紀要顯示,從目前一季度的情況來看,海天瑞聲的大模型訂單主要集中在強化學習階段的數(shù)據(jù)處理需求,例如對prompt的內(nèi)容回復續(xù)寫、機器生成內(nèi)容的評分等等。

但今日午后,ChatGPT概念股持續(xù)走弱,榮信文化、萬興科技、世紀天鴻均跌超10%,創(chuàng)業(yè)黑馬、中文在線、海天瑞聲等紛紛下挫。截至今日收盤,海天瑞聲跌8.72%,報收115元/股。

關鍵詞:

凡本網(wǎng)注明“XXX(非中國微山網(wǎng))提供”的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和其真實性負責。

特別關注