對話百度“自由畫布”創(chuàng)作團隊:多模態(tài)AI創(chuàng)作工具“立等可取”
“應(yīng)用來了”是百度世界大會2024年的主題。數(shù)據(jù)顯示,截至今年11月初,百度文心大模型的日均調(diào)用量已經(jīng)超過15億,相較一年前首次披露的5000萬次,增長約30倍。百度創(chuàng)始人李彥宏表示:“這條陡峭的增長曲線,代表著過去兩年中國大模型應(yīng)用的爆發(fā)?!?/p>
為了迎接AI應(yīng)用爆發(fā)的到來,百度一方面發(fā)布了兩大賦能應(yīng)用的AI技術(shù)——檢索增強的文生圖技術(shù)(iRAG)和無代碼工具“秒噠”;另一方面帶來了一款全模態(tài)AI創(chuàng)作工具,由百度文庫和百度網(wǎng)盤聯(lián)合開發(fā)的工具類智能體——“自由畫布”。
“自由畫布可以幫你完成從找資料到編輯,再到生成和分享的全部任務(wù)。每個人都可以成為漫畫家、短視頻導(dǎo)演。”李彥宏強調(diào)道,“這不是期貨,是立即可用的現(xiàn)貨?!?/p>
自由畫布是百度文庫、百度網(wǎng)盤聯(lián)合首創(chuàng)的內(nèi)容操作系統(tǒng),打通了公域與個人授權(quán)的私域內(nèi)容,通過“一拖一圈”的極簡操作,實現(xiàn)對全格式、全模態(tài)文件的混合理解、生成、創(chuàng)作,并支持對富媒體文檔的一鍵分享和存儲,實現(xiàn)輸入、編輯、創(chuàng)作、分享自由。
近日,記者采訪到了自由畫布的創(chuàng)作團隊,探秘自由畫布產(chǎn)生背后的故事。
百度文庫AI MAU超7000萬
自大模型發(fā)布之后,百度一直在用AI重構(gòu)各業(yè)務(wù)。據(jù)介紹,目前,百度文庫的AI用戶MAU突破7000萬,已經(jīng)成為國內(nèi)最大的AI原生產(chǎn)品。與此同時,百度文庫也推出了智能PPT、智能研報和智能畫本等AI能力。為了讓用戶更加方便地使用百度文庫AI能力,近期百度文庫還針對文庫首頁進行重新改版,除了提供專業(yè)權(quán)威的內(nèi)容搜索以外,也將AI能力進行整合,提供了智能對話、智能PPT多種AI工具箱,方便用戶使用文庫AI功能。
目前百度文庫團隊正在研發(fā)的重點,是全新的全模態(tài)的AI創(chuàng)作工具自由畫布。
“在AI能力發(fā)布后,世界上存在兩種邊際性的工具產(chǎn)品,第一類是WPS和Office的編輯器,這類的特點是創(chuàng)作成本非常高,它可以通過用戶意圖生成用戶想要的內(nèi)容。第二類是AI編輯器,這類編輯器特點是門檻相對比較低,可以生成大量文本,但是很難創(chuàng)意出來用戶想要的精準內(nèi)容,生成的大部分內(nèi)容用戶沒有辦法直接使用?!卑俣任膸霢I產(chǎn)品負責人鐘昊解釋道,百度自由畫布是未來的AI創(chuàng)作平臺,期望通過自由畫布產(chǎn)品,同時解決操作成本很高和無法精準生成內(nèi)容兩個難題,真正實現(xiàn)自由輸入和自由創(chuàng)作。
自由輸入的第一個層面是指用戶電腦本地、百度網(wǎng)盤以及網(wǎng)頁里面所有的素材,全部都可以自由拖入到自由畫布里面進行編輯;另外一個層面是指素材的模式和文件的格式,不只支持文本、音視頻、PDF,甚至支持URL更多內(nèi)容類型直接拖入到自由畫布里面。
“真正實現(xiàn)一拖一放,就可以把相關(guān)的編輯素材拖到自由畫布里面進行編輯?!辩婈徽f道,自由創(chuàng)作也分兩個層面,第一個層面是指自由畫布里面的多個素材或單個素材,全部或者部分內(nèi)容可以進行內(nèi)容創(chuàng)作;第二個層面是自由畫布可以生成多模態(tài)的內(nèi)容,不只是文本、文檔,還有音像視頻的內(nèi)容形式。
百度副總裁、百度文庫&百度網(wǎng)盤負責人王穎告訴記者,自由畫布的設(shè)計理念是解決從輸入到處理到輸出,多個不同內(nèi)容,跨模態(tài)多平臺操作,最后都可以在一個產(chǎn)品上實現(xiàn)。“過去Word、視頻、圖片都有不同的編輯系統(tǒng),沒有辦法在一個平臺實現(xiàn)融合;其次,用戶私有內(nèi)容(本地內(nèi)容)和網(wǎng)絡(luò)上的公域內(nèi)容很難融合,自由畫布則能充分理解本地知識和公網(wǎng)上知識,協(xié)同生成一個非常完整的知識?!?/p>
自由畫布產(chǎn)生的過程
自由畫布的設(shè)計理念其實經(jīng)歷了兩個階段。第一個階段,從去年3月份百度開始用AI重構(gòu)內(nèi)部業(yè)務(wù)的時候,文庫的重新定位是內(nèi)容創(chuàng)作和查找內(nèi)容的起點?!暗覀儼l(fā)現(xiàn)了一個比較大的問題,就是各種素材編輯器特別多,且分布在不同的平臺。發(fā)現(xiàn)這個問題之后,我們就堅定要做融合跨模態(tài)編輯器?!蓖醴f說道。
確定了融合的編輯器,百度文庫開始找一個品類做嘗試,看看路徑能否走通,于是就推出了PPT功能,后來發(fā)現(xiàn)用戶需求非常大,產(chǎn)品嘗試范圍逐漸擴大,到今年2、3月份,自由畫布的產(chǎn)品形態(tài)逐漸變得比較清晰。
“自由畫布不是第一天長成這個樣子的?!辩婈徽f道,在極小范圍測試時產(chǎn)品經(jīng)過幾輪迭代,最早時候的產(chǎn)品形式甚至不是畫布。在融合編輯下進行灰度測試時,發(fā)現(xiàn)用戶使用融合編輯器的自由和開放程度比產(chǎn)品經(jīng)理想的還要多。例如,有的用戶會把自己收藏的文章段落、自己拍攝過的圖片視頻,或者在網(wǎng)上找到的截圖,統(tǒng)統(tǒng)放到一個文檔里面編輯使用,然后用AI生成他想要的文檔、圖片、圖文結(jié)合的海報或者視頻。最后才有了今天自由畫布的產(chǎn)品形態(tài)。
王穎表示,自由畫布主要從輸入、處理和輸出三個維度進行考慮。因為是內(nèi)容操作系統(tǒng),涉及輸入和輸出,所以一定要做多模態(tài)。在4月份的時候,把漫畫和繪本功能都做出來了,這中間其實是打通整個底層編輯器的過程,從文檔類的編輯器,向多模態(tài)的編輯器一點一點積累,逐漸形成了產(chǎn)品形式和產(chǎn)品雛形。
“在此過程中,我們面臨的一個較大問題就是公域和私域融合的問題,因為百度文庫是公域的,百度網(wǎng)盤是私域,所以從9月開始,百度文庫開始處理和百度網(wǎng)盤協(xié)同、打通的事情。”王穎透露,自由畫布的整個產(chǎn)品思路已經(jīng)清晰了,百度文庫和百度網(wǎng)盤底層能力的打通已經(jīng)準備好,用戶交互層面正在內(nèi)部迭代中,目標是在11月底對外體驗。
“無論是行業(yè)內(nèi)的人士,還是投資人,都覺得網(wǎng)盤和文庫應(yīng)該在一起?!蓖醴f說道,“首先,內(nèi)容生產(chǎn)就是創(chuàng)作、編輯和存儲與管理,創(chuàng)、編屬于文庫,存、管屬于網(wǎng)盤;其次,歸到網(wǎng)盤,希望從內(nèi)容生產(chǎn)的起點,到消費的終點,可以用‘網(wǎng)盤+文庫’成為跟用戶溝通的新媒介。未來好的AI能真正成為個人的助手,一定要懂你的私域的東西,而現(xiàn)在很多大模型都是抓取的公域知識,公私域的結(jié)合在未來場景一定很大?!?/p>
如果沒有大模型,百度網(wǎng)盤和百度網(wǎng)盤可能只能停留在功能項的融合層面。而大模型的出現(xiàn),讓產(chǎn)品的邊界發(fā)生了變化。王穎舉例說道,文庫從原來的檢索平臺變成可以創(chuàng)作的平臺,網(wǎng)盤從原來的存儲平臺變成既可以消費也可以創(chuàng)作的平臺。
“大模型讓產(chǎn)品邊界發(fā)生了變化,讓這兩件事(文庫和網(wǎng)盤)變成是一件事,因為創(chuàng)作和存儲本來就是循環(huán)的。另外,產(chǎn)生的數(shù)據(jù)還可以形成數(shù)據(jù)飛輪,讓產(chǎn)品變得越來越好。在做預(yù)訓練的時候,數(shù)據(jù)決定了模型的基礎(chǔ);后面模型的提升,則完全靠數(shù)據(jù)的質(zhì)量和精度?!蓖醴f說道。
商業(yè)化的變化
據(jù)了解,自由畫布主要定位于兩類人群,一類是年輕用戶,一類是專業(yè)用戶。專業(yè)用戶的使用深度比較高,使用產(chǎn)品時的痛點更強,他們希望有更好的產(chǎn)品、更高科技的產(chǎn)品,幫他解決問題。年輕用戶是原生的手機用戶,還沒有接受過傳統(tǒng)編輯工具的人,對簡單易用、高精尖的接受程度比較高。
“大模型對產(chǎn)品重構(gòu)在商業(yè)上帶來的變化就是,產(chǎn)品年收入同比增長了20%?!蓖醴f指出,網(wǎng)盤和文庫的商業(yè)模式天然就和大模型非常匹配,包括AI能力擴展邊界帶來更多的權(quán)益,可以開發(fā)出更多的產(chǎn)品組合,以及會讓付費率、轉(zhuǎn)化率提升。
目前百度文庫和百度網(wǎng)盤都有各自的會員體系,打通文庫和網(wǎng)盤而誕生的自由畫布在會員體系上是否會做打通?
“一年內(nèi)可能不會變成一個會員,但是兩個產(chǎn)品會有聯(lián)合會員。聯(lián)合給到用戶的時候,無論從用戶體驗上,還是商業(yè)模式上,都能感覺到網(wǎng)盤和文庫在一起提供服務(wù)?!蓖醴f解釋道,因為兩個產(chǎn)品各有側(cè)重,比如網(wǎng)盤強調(diào)存儲和消費,文庫強調(diào)內(nèi)容生產(chǎn)和創(chuàng)作。但是未來如果能實現(xiàn)生產(chǎn)和消費的端到端,一產(chǎn)品一票制也是有可能的。
對于未來的產(chǎn)品創(chuàng)新方向,鐘昊透露,首先在產(chǎn)品交互層面,會用LUI(語言用戶界面)+GUI(圖形用戶界面)的方式,變得非常自然,實現(xiàn)“指哪打哪”。現(xiàn)在不少用戶反映一些大模型應(yīng)用不好用,是因為用戶希望大模型作出局部調(diào)整的時候,在重新生成時大多數(shù)很難準確實現(xiàn)。其次,在數(shù)據(jù)模態(tài)上,用戶不只是有需求消費單一模態(tài)內(nèi)容的需求,而是衍生出相關(guān)的多模態(tài)內(nèi)容其實都需要。第三點是產(chǎn)品形態(tài)上,朝工具+內(nèi)容的結(jié)合,過去提供工具的產(chǎn)品只提供工具,提供內(nèi)容的產(chǎn)品只提供內(nèi)容,未來大模型是內(nèi)容和工具結(jié)合在一起的。