今年3月底的某一天,在北京創業的王登科,突然有了一個強烈的想法——克隆自己。
他很早就想做一個聊天機器人。今年以來,ChatGPT的爆火,llama和chatglm6b等開源模型的出現,讓他覺得,或許是時候了。
他決定試試看。
基於10萬條微信聊天記錄,280篇博客文章,他花了幾個晚上的時間,在chatglm-6b預訓練模型的基礎上,訓練出了自己的數字克隆人。而且,實現了像模像樣的聊天。在第一次對話中,他的克隆人就學會了罵人。
王登科第一次和他的聊天機器人對話時,對方說了髒話
為了讓AI更像自己,他又進行了多輪優化、訓練,最終得到了一個相對理想的版本。現在,所有人都可以在一個網頁上,跟他的數字版聊天。大部分時候,你幾乎很難區分,屏幕的另一側並非真人。
在王登科跟另一個“自己”瞎聊的同時,一些有野心的科技公司,正在緊鑼密鼓開發自己的大模型,然後試圖像流水線一樣批量生產AI克隆人。
小冰公司啟動了“GPT克隆人計劃”,要克隆一批跟真人性格、技能、聲音一樣的明星紅人;360創建了一個數字人廣場,在發布會上邀請“馬斯克”進行問答;國外的Forever Voices公司,為女網紅Caryn Marjorie創建的克隆人同時跟1000個“男友”聊天,每分鐘收費一美元;主打名人克隆聊天的Character.AI公司,APP上線一周下載量超過了ChatGPT。
這是一個潛在的大市場,已經被科技公司盯上。從野生網紅,到娛樂明星,再到科技圈大佬,人人皆可被AI克隆,然後被售賣。
這或許是一條流量變現的新路子,是一個全新的商業模式,也可能是人類社交網絡崩塌的開始。
連續創業者邱懿武,是浙大創業圈裡的活躍分子。
兩個月前,邱懿武用開源大模型,結合自己過去的交流和文章,做了一個“邱懿武GPT”。這是一個銅人形象的數字版分身,能模仿他的說話方式、語氣、個性跟人聊天。
他想用自己十多年的經驗和思考,去訓練一個更懂自己的永生體,然後用它去提供諮詢和交流。
這並非癡人說夢。 “大模型技術到了拐點,現在GPT4的表現,已經超越了圖靈測試,這意味著你已經區分不出來是人還是機器。”邱懿武對深AI說。
他迫切需要一個“分身”。自動去年啟動“造物雲”的創業項目後,他開始忙起來,很多時候感覺分身乏術。
他想開一門設計課程,傳授一些審美知識和設計技巧。他還想開一門創業課,把自己多年積累的經驗,總結的方法論,統一對外輸出。
現在,他認為GPT可以幫他完成這項繁瑣的工作。 “讓我的分身去全國各地開課,每天都可以講,我自己都不用出鏡。”他認為,以目前的技術,有些錄播課程完全可以用GPT分身出鏡,一些需要即時互動,甚至自己生成講課內容的課程,可能還得等技術更成熟一些。
事實上,已經有人擁有了自己的數字版分身,並開始打工賺錢了。
潤米諮詢創始人劉潤在抖音上有100多萬粉絲,據他介紹,從去年10月開始,由人工智能公司矽基智能為他定制的數字人上線,後期他出鏡口播的一些短視頻,都是由這個數字人完成。他只需要提前準備好口播的文字稿,錄好一段音頻,數字人就可以出鏡講解,你很難區分真假。
劉潤的口播短視頻頁面
通過這種方式,劉潤的時間精力被解放了。
這背後的技術原理不復雜。人工智能讓機器學習了劉潤之前的視頻,捕捉了他的神態、表情、動作,然後高像素模仿,生成跟真人出鏡一樣的視頻。目前,做類似技術的公司很多,實現起來難度不大。甚至在二手交易平台閒魚,你都可以找山寨商家定制一個自己的數字分身。
這只是初級版的數字分身。再往前進階,是AI克隆人。 AI克隆人是數字人中一個特別的類別。
美國的Forever Voices公司,從聲音克隆切入市場。創始人John H. Meyer提及自己的創業初心時,講過這樣一段故事:六年前他的父親離世,讓他經歷了人生中最艱難的時刻,直到今年4月,借助AI的力量,他用Forever Voices打造了一個聊天機器人,實現了跟父親的再次語音交談。
在對話框中,這個機器人有跟他父親完全一樣的聲音、語氣、說話方式。更重要的是,對方可以跟你實時互動,說的話不是提前錄製,而是即時生成的。
“用AI的形式保存自己,讓數百年後的幾代人與你交談。”John說。
就是在這個機器人的基礎上,Forever Voices為女網紅Caryn Marjorie打造了一個克隆人,粉絲可以花1美元/分鐘,和AI版的她聊天。 Caryn Marjorie在美國社交平台Snapchat上擁有近200萬粉絲,它由此實現了同時跟1000個男粉絲聊天,並在一周內賺到了72000美元。
女網紅Caryn Marjorie
這很大程度上得益於GhatGPT的誕生。 GhatGPT能理解用戶的意圖,跟真人一樣與你聊天。 Forever Voices就接入了GPT-4的API。
之前,無論是聲音克隆,還是形象仿真,都有一些局限。用AI聲音合成複制任何人的聲音,用深度偽造進行AI換臉,早已被騙子用來詐騙。但它們的使用場景有限,尤其是在實時互動上表現較差。
今年大火的生成式AI,讓機器使用自然語言處理(NLP)來理解和響應用戶的文本和語音消息,以更像人類的方式跟人類交流。並且,機器學習消化了被克隆對象的所有歷史資料,還可以從與用戶的交互中學習,並隨著時間的推移改進其響應效果。
從錄播模仿,到即時生成,AI打造的數字人越來越像真人,開始在更多場景裡解放生產力。從交互體驗的角度,機器學會了自我演繹,它不再是一個複讀機,更像一個“有血有肉”的具體的“人”。
科技公司研發新技術,讓AI克隆人變成現實,目的不是炫技,也不是要製造玩具。這或許,是一條流量變現的新路子。
Forever Voices公司為女網紅Caryn Marjorie打造的AI聊天機器人,只是其明星克隆人計劃的一部分。
這家公司瞄準大量公眾人物,如喬布斯、馬斯克、Taylor Swift等,建立他們的虛擬形象,讓人們體驗跟名人語音聊天的感覺。他們實現了讓AI版本的喬布斯,與AI版本的馬斯克對話。那段演示視頻吸引了大量用戶圍觀,讓這家公司火速出圈。
用戶如果想跟這些虛擬名人進一步聊天,需要按時長付費。這是一門幾乎穩賺不賠的生意,因為克隆人一旦被AI創造出來,可以同時跟成千上萬個人聊天,邊際成本為零。它實現了將流量規模化、批量化、流水線式的變現。 5月14日,女網紅Caryn Marjorie在社交媒體宣布,他的“男友”數量超過了1萬個。
在中國市場,小冰公司的探索更為激進。
小冰公司在5月16日宣布啟動“GPT克隆人計劃”,最短只要採集三分鐘數據,即可為明星紅人、專家學者或普通人創造源於本人性格、技能、聲音、外貌的AI克隆人。
明星紅人是其一大賣點。首批上線的AI克隆人中,關注度最高的一個,是此前爭議很大的女網紅“半藏森林”。
毫無疑問,網紅能帶來流量,用戶為之付費的意願也更高。根據小冰公司在6月1日公佈的數據,後台報名克隆人的網紅明星全網粉絲總數已超過5億。粉絲瘋狂湧入小冰公司開發的專屬APP,刺激了下載和使用。
在流量變現上,小冰公司非常直接。
按照小冰公司的規則,任何人都可以在小冰的平台上創造克隆人。克隆的對象可以是你自己,也可以是其他人。你可以用公開數據克隆一個周杰倫,也可以克隆一個馬斯克,然後跟他對話,還可以把它分享給其他人。
深AI和“周杰倫”的聊天記錄
這其中最神奇的地方在於,你創造的克隆人在加V認證後,可以有償對外“接單”。目前克隆人的“營業範圍”,主要是陪伴式在線聊天。當有人付費後,小冰平台抽走一部分,剩下的都是你的。
對於有粉絲基數的明星而言,這簡直是流量收割機。一個明星的精力再旺盛,工作室再龐大,也不可能做到即時回复粉絲私信,更別提長聊了。
克隆人能做到24小時在線,秒回消息,文字語音表情包靈活應用,關鍵是,它的知識儲備、說話方式,幾乎跟真人一樣。
情感、社交和偶像崇拜,是現代生活中最重要的精神需求。從製造偶像到復制偶像,AI創造了一種新的商業模式。小冰公司CEO李笛說,“實際上這是種C2C(消費者對消費者)的商業模式,也是目前為止在AI大模型普及後,出現的第一個C2C的商業模式。”
拋開背後的道德和法律爭議,這是一個看起來相當性感的商業模型。 AI虛擬聊天和情感陪伴,一直以來就是一個潛力巨大的市場。如今生成式AI技術的成熟,給這門生意添了一把火。
在Forever Voices和小冰公司推出產品之前,去年底國內就有一款叫Glow的產品小火了一把。
Glow的玩法是在應用中創建虛擬AI機器人,用戶可以創造屬於自己的機器人,設定人物背景、性格、價值觀等特徵,實現實時溝通、互動並建立情感連接。通過後續的對話訓練,還可以調整機器人的語氣、說話方式等等。
這款產品上線後,只用4個月時間,積累了接近500萬用戶。其背後的人工智能創業公司MiniMax,現已估值超過10億美金,晉升AI獨角獸序列。
邱懿武認為,AI克隆人商業化是一個必然的趨勢。 “這本質上就是IP授權,屬於虛擬經濟的一種,把人也數字化了。”
通過克隆自己,人類實現了自己商業價值的延伸。 “雖然我不是娛樂明星,但我把自己做設計的經驗總結成方法論,服務不了太多人,那就讓我的機器人去做好了。”他說。
他現在會有意識地把跟自己相關的數據記錄下來,以作為將來克隆自己的養料,目的是要讓自己的記憶留存在數字世界。
在《流浪地球2》中,劉德華飾演的圖恆宇,運用深度學習和數字孿生技術,讓自己逝去的女兒成為第一個擁有數字生命的人。數字生命就是將人的大腦中思維、記憶等所有數據,全部下載到計算機中,讓人的靈魂能夠在虛擬世界里永生。電影中,圖恆宇借助丫丫的數字生命,在千鈞一發之際拯救了地球的命運。
今年以來人工智能技術的突飛猛進,讓越來越多人覺得,科幻電影中的情節,或許會在某一天在真實世界上演。
不過在王登科看來,現在所謂的AI克隆,更像是扮演,而不是真正意義上的克隆。
劉潤數字人是真人寫好腳本後,用一個模型生成聲音,用另一個模型去讓聲音驅動虛擬形象,模擬人的口型和表情說話。
一些公司做的克隆人,是對文本大模型進行預訓練,然後結合名人的公開數據,對名人進行扮演。 AI對名人的扮演會更逼真,因為名人的數據更多。只要原本的底層模型足夠好,扮演名人就非常容易。
王登科認為,這都不是他想要的克隆。 AI只是根據人類輸入的信息在做反饋,還不能自主地跟人一樣去應對。
他想用大量本人產生的原始數據,從底層去訓練、改變模型的結構和參數,使模型本身就具備跟自己一樣的知識、性格、習慣、說話方式。這就像是在大模型上接入了一個有自己參數的插件。
但在試圖克隆自己的過程中,他陷入了一種矛盾心態。
“我某種程度上挺討厭AI克隆,它可能會消解人類存在的意義。提高效率是好事,效率提高到極致,就是不需要效率了,人也不需要創造了,那人存在的意義是什麼?”他對深AI說。
這不是一個技術問題,而是社會倫理問題。
如果有一天,AI克隆人變成科技巨頭的賺錢工具,變成普通人的商品和玩具,成為另類意義上的“電子寵物”,這對人類是更好還是更壞?
業界和監管層目前都沒有答案。不過,小冰公司的AI克隆人上線不到一周,就全部變成了不可見狀態,包括網紅“半藏森林”也已下線。此前在年輕人中低調傳播的Glow,也被限制下載。
AI克隆人還處在發展早期。對於人類而言,AI大模型就像一個黑盒子,人類還沒有徹底搞清楚它是如何運作。 “你扔進去一堆數據,一輪一輪跑,最後反饋出一個結果,但它到底訓練了什麼,改變了什麼,為啥參數變化了,沒人知道。”王登科說。
《大模型時代》作者龍志勇也對深AI說,大模型現階段就是靠做黑箱實驗來驗證能力,靠做黑箱訓練來提升能力。
永遠保持敬畏之心,或許是我們迎接AI時代最好的方式。
巴比特園區開放合作啦!
中文推特: https://twitter.com/8BTC_OFFICIAL