Email:[email protected]
,提供了跨設(shè)備和平臺(tái)的手勢(shì)交互的通用框架和規(guī)范,,涵蓋了手勢(shì)識(shí)別、生成和理解的通用方法,,標(biāo)準(zhǔn)清單見(jiàn)表5,。
表5 ISO/IEC 30113系列標(biāo)準(zhǔn)清單
標(biāo)準(zhǔn)號(hào) | 標(biāo)準(zhǔn)名稱 |
ISO/IEC 30113-1:2015 | 信息技術(shù) 用戶界面 跨設(shè)備和方法的基于手勢(shì)的界面 第1部分:框架 |
ISO/IEC 30113-5:2019 | 信息技術(shù) 用戶界面 跨設(shè)備和方法的基于手勢(shì)的界面 第5部分:手勢(shì)界面標(biāo)記語(yǔ)言(GIML) |
ISO/IEC 30113-11:2017 | 信息技術(shù) 跨設(shè)備和方法的基于手勢(shì)的界面 第11部分:通用系統(tǒng)操作的單點(diǎn)手勢(shì) |
ISO/IEC 30113-12:2019 | 信息技術(shù) 用戶界面 跨設(shè)備和方法的基于手勢(shì)的界面。第12部分:通用系統(tǒng)操作的多點(diǎn)手勢(shì) |
ISO/IEC 30113-60:2020 | 信息技術(shù) 跨設(shè)備和方法的基于手勢(shì)的界面 第60部分:屏幕閱讀器手勢(shì)的通用指南 |
ISO/IEC 30113-61:2020 | 信息技術(shù) 跨設(shè)備和方法的基于手勢(shì)的界面 第61部分:屏幕閱讀器的單點(diǎn)手勢(shì) |
語(yǔ)音識(shí)別方面,,全國(guó)信標(biāo)委用戶界面分委會(huì)(TC28/SC35)制定了智能語(yǔ)音交互GB/T 36464和GB/T 41813系列標(biāo)準(zhǔn),,規(guī)定了智能語(yǔ)音交互系統(tǒng)通用功能架構(gòu)、移動(dòng)智能語(yǔ)音交互系統(tǒng)的術(shù)語(yǔ)定義和系統(tǒng)框架以及要求和測(cè)試方法,。
《國(guó)家新一代人工智能標(biāo)準(zhǔn)體系建設(shè)指南》和《國(guó)家人工智能產(chǎn)業(yè)綜合標(biāo)準(zhǔn)化體系建設(shè)指南(2024版)》都提出要建設(shè)自然語(yǔ)言處理,、智能語(yǔ)音、計(jì)算機(jī)視覺(jué),、生物特征識(shí)別,、人機(jī)交互/人機(jī)混合增強(qiáng)現(xiàn)實(shí)等關(guān)鍵技術(shù)標(biāo)準(zhǔn),推動(dòng)人工智能技術(shù)創(chuàng)新和應(yīng)用,。
3
生成式AI技術(shù)
2024年2月,,OpenAI發(fā)布了文生視頻人工智能模型Sora,,引起了廣泛關(guān)注。OpenAI將ChatGPT所用的Transformer算法,,與擴(kuò)散模型相融合,,形成了新的底層算法模型DiT,使Sora實(shí)現(xiàn)了對(duì)語(yǔ)言的深刻理解,,在視頻生成上表現(xiàn)出了很強(qiáng)的“涌現(xiàn)”能力,。
創(chuàng)建豐富和高體驗(yàn)度的虛擬和虛實(shí)結(jié)合內(nèi)容與場(chǎng)景,需要投入高昂的人力,、物力和時(shí)間成本,,極大限制了創(chuàng)新速度和規(guī)模,,是元宇宙發(fā)展的關(guān)鍵瓶頸,。生成式AI技術(shù)將為XR的3D模型、場(chǎng)景,、動(dòng)作和腳本的創(chuàng)建提供前所未有的自由度,,讓開(kāi)發(fā)者能夠?qū)W⒂谟脩趔w驗(yàn)創(chuàng)新,實(shí)現(xiàn)高質(zhì)量XR內(nèi)容,、場(chǎng)景和虛擬世界的快速構(gòu)建,。
此外,XR中的虛擬場(chǎng)景,、人物,,需要與用戶進(jìn)行有效的實(shí)時(shí)交互,提供高度定制化的體驗(yàn)感,。傳統(tǒng)方法只能實(shí)現(xiàn)預(yù)設(shè)式的基本交互功能,,而