近日,由中國(guó)科學(xué)院自動(dòng)化研究所聯(lián)合武漢人工智能研究院研發(fā)的紫東太初4.0多模態(tài)推理大模型發(fā)布。自2021年首次推出以來,紫東太初已完成4次迭代,實(shí)現(xiàn)了從“純文本思考”“簡(jiǎn)單操作帶圖思考”到“細(xì)粒度多模態(tài)語(yǔ)義思考”的躍遷,邁向多模態(tài)深度推理的新階段。
中國(guó)科學(xué)院自動(dòng)化研究所研究員、武漢人工智能研究院院長(zhǎng)王金橋介紹,“細(xì)粒度多模態(tài)語(yǔ)義思考”是指大模型能像人一樣主動(dòng)深度思考,不僅能動(dòng)態(tài)適應(yīng)和處理更復(fù)雜的任務(wù),還能在視覺語(yǔ)義層面展現(xiàn)出清晰且可解釋的推理過程,實(shí)現(xiàn)“邊看、邊識(shí)、邊思”。
“比如在音頻理解中,用戶對(duì)紫東太初說‘我想掛一個(gè)呼吸科的號(hào)’,它能自動(dòng)操作APP并根據(jù)癥狀選擇門診;在視頻理解中,它能對(duì)180分鐘的長(zhǎng)視頻進(jìn)行片段精準(zhǔn)定位和內(nèi)容總結(jié)?!蓖踅饦蛘f,此外,它還能在真實(shí)場(chǎng)景中通過汽車、機(jī)器人等“動(dòng)手操作”。
據(jù)了解,紫東太初已在具身智能、低空經(jīng)濟(jì)、智慧醫(yī)療等多個(gè)產(chǎn)業(yè)中實(shí)現(xiàn)布局,為城市基礎(chǔ)設(shè)施與行業(yè)需求提供定制化解決方案。(記者劉禎)
Copyright ? 2001-2025 湖北荊楚網(wǎng)絡(luò)科技股份有限公司 All Rights Reserved
互聯(lián)網(wǎng)新聞信息許可證 42120170001 -
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證 鄂B2-20231273 -
廣播電視節(jié)目制作經(jīng)營(yíng)許可證(鄂)字第00011號(hào)
信息網(wǎng)絡(luò)傳播視聽節(jié)目許可證 1706144 -
互聯(lián)網(wǎng)出版許可證 (鄂)字3號(hào) -
營(yíng)業(yè)執(zhí)照
鄂ICP備 13000573號(hào)-1 鄂公網(wǎng)安備 42010602000206號(hào)
版權(quán)為 荊楚網(wǎng) m.hao-ang.com 所有 未經(jīng)同意不得復(fù)制或鏡像