【港澳圖庫歷史全年記錄查詢】
【2024年新澳門六開彩開獎(jiǎng)結(jié)果】
【2024管家婆一肖一碼100精準(zhǔn)大全】
【澳門六開獎(jiǎng)結(jié)果2024開獎(jiǎng)記錄查詢最新】
【澳門彩庫論壇新網(wǎng)站香港王中王】
【新澳門開彩二四六藍(lán)月亮開獎(jiǎng)大全】
【一肖一碼準(zhǔn)選一碼】
【二四六天天好(944cc)246天彩246】
【澳門一碼一肖一特一中歷史】
【澳門彩歷史開獎(jiǎng)記著錄】
【2024澳門六開彩資料查詢最新開獎(jiǎng)結(jié)果】
【2024澳門大全免費(fèi)資料】
【今天新澳門今晚馬出什么】
【49629澳彩開獎(jiǎng)結(jié)果查詢鳳凰直播】
【澳門九龍資料免費(fèi)公開資料新手】
【香港6149澳門搖錢樹資料大全】
【贏彩票二四六天天彩旺角】
【555525con王中王555525順流而下鳳凰網(wǎng)】
【奧門2024免費(fèi)資料大全】
【202千年管家婆開獎(jiǎng)結(jié)果】
【2024年管家波婆一肖一碼】
【2024新澳彩四不像圖片】
【管家婆2024一碼一肖資料大全】
【48cccm澳彩資料圖管家婆】
【管家婆期期四肖四碼中特管家v】

金磊 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI

翻車,大翻車。

就在今天凌晨,谷歌版Her——Gemini Live正式發(fā)布。

畢竟明顯是對(duì)標(biāo)OpenAI家的GPT-4o,可以說是吸足了科技圈的眼球。

在官網(wǎng)發(fā)布的demo中,拍照問答功能的效果是這樣的:



它大致實(shí)現(xiàn)的功能,是用手機(jī)拍攝演唱會(huì)的海報(bào),并讓Gemini查看用戶的日歷,看看行程是否適合參加。

以及還可以基于此進(jìn)行一系列后續(xù)的操作,包括定時(shí)間查票價(jià)等等。

然而……當(dāng)來到發(fā)布會(huì)現(xiàn)場(chǎng)演示環(huán)節(jié)的時(shí)候,畫風(fēng)卻180°大變樣。

請(qǐng)看VCR:



視頻地址:https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA

  • 第一次:失敗了。
  • 第二次:失敗了。
  • 第三次:換手機(jī),成功了。

嗯……小哥表情,肉眼可見的有點(diǎn)慌。



就連知名科技媒體TechCrunch都配上了這樣的emoji:



甚至還有網(wǎng)友開啟了辣評(píng)模式:

我10秒鐘就能搜索我的日歷。



當(dāng)然,這只是今天Made by Google的一個(gè)小插曲。

關(guān)于Gemini Live的更多內(nèi)容,我們繼續(xù)往下看。

谷歌版Her的全貌

正如我們剛才提到的,Gemini Live和GPT-4o的功能十分相似。

除了“拍照問答”之外,它也可以做到實(shí)時(shí)對(duì)話,甚至在Gemini回復(fù)過程中進(jìn)行打斷。

據(jù)了解,目前Gemini Live的功能已經(jīng)在安卓系統(tǒng)中向Advanced訂閱者開放(僅限英語)。

未來幾周,這個(gè)功能會(huì)陸續(xù)擴(kuò)展到更多語言并且向iOS開放。

對(duì)話聲音方面,Gemini Live推出了10種新的聲音供選擇,效果是這樣的:



視頻地址:https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA

操作方面,由于Gemini已經(jīng)完全集成到了系統(tǒng)中,所以只需長(zhǎng)按電源按鈕或說“Hey Google”,就可以調(diào)用了。

例如在寫郵件的過程中,讓Gemini幫你生成配圖,效果如下:



不過對(duì)于這項(xiàng)功能,外媒們的評(píng)價(jià)卻是褒貶不一。

例如The Verge的一位作者在親測(cè)后給出的標(biāo)題是——

Gemini Live比Google快,但更尷尬。



具體原因是作者在一次為期三天的公路旅行中,汽車的音頻系統(tǒng)突然失效。

使用原先的谷歌助手尋找解決方案花費(fèi)了至少五分鐘,而Gemini Live僅耗時(shí)15秒。

但對(duì)話過程中的Gemini Live的持續(xù)發(fā)言和需要用戶主動(dòng)打斷的交互方式,卻讓作者感到尷尬。

他認(rèn)為:

聲音和說話方式過于人性化,以至于在打斷它時(shí)感到不自在。
與Gemini Live的互動(dòng)中投入了更多情感,而不是將其作為解決問題的工具。

無獨(dú)有偶,對(duì)于Gemini Live在云端運(yùn)行這個(gè)點(diǎn),華爾街日?qǐng)?bào)也給出了犀利的評(píng)價(jià)——

對(duì)話上的進(jìn)步,功能上的退步。



具體到技術(shù)層面,GPT-4o是一個(gè)端到端的系統(tǒng),但從谷歌發(fā)布的內(nèi)容來看,Gemini Live則并非如此。

而是將STT、VAD、LLM和TTS系統(tǒng)做了集成:



除此之外,谷歌所發(fā)布的新Pixel系列手機(jī)中,也出現(xiàn)了Gemini Live的身影。

包括Pixel 9 Pro Fold、Pixel 9、Pixel 9 Pro和Pixel 9 Pro XL。



AI功能方面,谷歌的Pixel手機(jī)在拍照上增加了一個(gè)叫“Add Me”的功能。

可以用增強(qiáng)現(xiàn)實(shí)(AR)和AI技術(shù),可以把兩張不同照片中的人物“塞”到一起。



谷歌為什么追不上OpenAI?

雖然谷歌這次發(fā)布Gemini Live,算是對(duì)OpenAI GPT-4o的一種應(yīng)戰(zhàn),但自從大模型時(shí)代拉開序幕以來,我們可以看到一個(gè)非常明顯的一種趨勢(shì)——

谷歌,跟不上OpenAI的腳步。

首先是在最為關(guān)鍵的ChatGPT發(fā)布的這個(gè)節(jié)點(diǎn)上,OpenAI成為了開拓者,但谷歌隨后發(fā)布的Bard,和這次Gemini Live很相似,后續(xù)出現(xiàn)了翻車情況。

而后近一年半多的時(shí)間來,似乎所有重磅模型、重磅應(yīng)用的發(fā)布,都是OpenAI在引領(lǐng)。

反觀谷歌這邊,不僅是技術(shù)呈現(xiàn)出步步慢的狀態(tài);甚至在輿論上,還出現(xiàn)了被OpenAI用一個(gè)人事變動(dòng)(Ilya離職)消息蓋過谷歌年度最大活動(dòng)(I/O大會(huì))熱度的情況。

那么谷歌在大模型時(shí)代為什么不行了?

對(duì)此,前谷歌CEOEric Schmidt(2001年至2011年任職)在斯坦福最新的演講中表達(dá)了他的觀點(diǎn):

谷歌非常重視工作與生活的平衡,例如允許員工居家辦公。
但創(chuàng)業(yè)公司,他們工作真的很拼。



視頻地址:https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA

甚至還有網(wǎng)友爆料稱:

我兄弟是谷歌頂級(jí)AI程序員,他有3個(gè)全職工作,每天只在谷歌這邊花2個(gè)小時(shí)。



那么你對(duì)此怎么看,歡迎在評(píng)論區(qū)留言討論。

參考鏈接:
[1]https://x.com/techcrunch/status/1823410187404743131?s=46&t=6eepxw1G6XRQ7VO0ANjJWg
[2]https://x.com/GoogleDeepMind/status/1823409674739437915
[3]https://blog.google/products/gemini/made-by-google-gemini-ai-updates/
[4]https://x.com/alexkehr/status/1823480786349383879?s=46&t=6eepxw1G6XRQ7VO0ANjJWg
[5]https://www.theverge.com/2024/8/13/24219736/gemini-live-hands-on-pixel-event
[6]https://blog.google/products/pixel/google-pixel-9-new-ai-features/#pixel9phones