紫金財經6月17日消息 近日,羅永浩數(shù)字人直播首秀創(chuàng)下超1300萬人次觀看、GMV突破5500萬元的行業(yè)新紀錄,部分核心品類帶貨量反超真人直播。這說明,數(shù)字人在直播帶貨領域,仍然有很大的空間可挖。
6月17日,在百度AI Day開放日上,百度官宣打造業(yè)界首個超頭主播羅永浩數(shù)字人,并發(fā)布了高說服力數(shù)字人的四大技術突破。
百度電商慧播星再次迭代,數(shù)字人帶貨媲美真人
百度副總裁、電商總經理平曉黎表示,今年4月百度發(fā)布的高說服力數(shù)字人已讓數(shù)字人帶入3.0時代,這是一個新的里程碑,標志著智能電商邁入新篇章。

在高說服力數(shù)字人的基礎之上,百度電商慧播星再一次迭代,圍繞慧播星首席體驗官羅永浩,發(fā)布了業(yè)界首個超頭主播的數(shù)字人,并實現(xiàn)了體驗、內容、視覺、效果的四大突破,使得數(shù)字人帶貨能力媲美真人。
百度電商商業(yè)業(yè)務部負責人、數(shù)字人創(chuàng)新業(yè)務部負責人吳晨霞表示,為了支撐本次羅永浩數(shù)字人的突破,慧播星重磅升級了新版本,實現(xiàn)了劇本、動作、聲音、腳本、問答、互動等維度的全方位升級。
吳晨霞對羅永浩數(shù)字人的誕生過程進行了揭秘,通過羅永浩、朱蕭木的海量數(shù)據(jù)訓練生成數(shù)字人主播,同時結合商品特性與羅永浩人設量身定制直播劇本,實現(xiàn)了神形音容全模態(tài)高度統(tǒng)一,還原了羅永浩、朱蕭木的慣性動作、表情等,做到如同真人一樣自然。
在此基礎上,慧播星以大師級的創(chuàng)作能力,生成人物高光片段,復刻羅氏幽默,在直播中能夠接梗、玩梗,使得數(shù)字人表現(xiàn)力有了真人般的魅力。
慧播星作為業(yè)界首家實現(xiàn)「AI大腦」多智能體調度的產品,實現(xiàn)了靈活場控,并支持一個數(shù)字人直播間上線多種玩法,有效提升了用戶轉化。羅永浩數(shù)字人首秀大捷,標志著慧播星產品力邁向全新階段。
多模協(xié)同的數(shù)字人技術,人-物-場可自由交互
百度集團副總裁吳甜系統(tǒng)性地介紹了多模協(xié)同的數(shù)字人技術。百度研制的多模協(xié)同的數(shù)字人技術,基于文心 4.5T 實現(xiàn)了融合多模規(guī)劃與深度思考的劇本生成,由劇本驅動數(shù)字人多模協(xié)同,實現(xiàn)動態(tài)決策的實時交互,使數(shù)字人的“神、形、音、容、話”達到高度統(tǒng)一。最終呈現(xiàn)出一個具備高表現(xiàn)力,內容吸引人,人-物-場可自由交互的超擬真數(shù)字人。

吳甜表示,劇本生成技術包含臺詞生成、多模驅動和動態(tài)交互三部分。以羅永浩數(shù)字人劇本為例,基于文心大模型4.5 Turbo生成的劇本,充分展現(xiàn)了主播的個人特色,具備典型的羅氏幽默風格,并能夠實現(xiàn)雙人主播的內容協(xié)同,動態(tài)實現(xiàn)豐富的實時互動。
通過文本自控的語音合成大模型,實現(xiàn)高復原的語音合成能力,再結合直播臺詞及發(fā)音人特征,合成風格恰當、自然流暢的聲音。為解決羅永浩數(shù)字人直播雙人聲音配合的難點,百度采用對話上下文編碼器,將對話歷史輸入和當前對話進行語音合成的統(tǒng)一推理計算,最終實現(xiàn)流暢、自然的雙人對話效果。
在數(shù)字人形象生成以及驅動方面,通過結合多模態(tài)視頻理解、跨模態(tài)信號生成、視頻生成等技術,克服了高可控交互,高精度、長時間一致性保持等難點,實現(xiàn)了高一致性超擬真羅永浩數(shù)字人長視頻生成。
羅永浩擔任百度慧播星首席產品體驗官
會上,平曉黎正式宣布,羅永浩將正式擔任百度慧播星首席產品體驗官,羅永浩在入駐百度優(yōu)選進行真人直播帶貨外,其數(shù)字人也將不定期開播、常態(tài)化為用戶帶來更多福利。羅永浩的數(shù)字人作為新一代高說服力數(shù)字人的首秀,引發(fā)了用戶側的廣泛討論與行業(yè)熱議,特別是用戶的轉化效果媲美真人,意味著用戶對于數(shù)字人的接受度已經被驗證。

此外,百度電商還推出兩大計劃:夢蝶計劃將通過流量扶持,超頭主播數(shù)字人打造、預算扶持,實現(xiàn)百度優(yōu)選超頭主播的數(shù)量倍增;繁星計劃則將再次追加10萬個慧播星數(shù)字人,投入1億元數(shù)字人消費補貼、千萬級別的運營扶持,幫助更多的普通人、中小企業(yè)開啟數(shù)字人直播。