歡迎光臨陜西驪山低速風(fēng)機動力制造有限公司官網(wǎng)!

全國咨詢熱線:

400-8888-888

舌頭分割手術(shù)視頻過程_舌頭分割手術(shù)視頻過程大全

所屬分類:維護方案 發(fā)布日期:2024-08-23 瀏覽次數(shù):7

  

  轉(zhuǎn)自舌頭分割手術(shù)視頻過程:新智元(AI_era)

  作者:胡祥杰

  

Jue Wang

Director of Megvii Research US

1新智元報道

【新智元導(dǎo)讀】孫劍之后,F(xiàn)ace++再迎來一名重量級計算機視覺研究者——王玨博士。他將領(lǐng)導(dǎo)Face++位于美國的研究院,與孫劍負責(zé)的中國研究院相呼應(yīng)。專訪中,王玨與新智元分享舌頭分割手術(shù)視頻過程了他對研究與應(yīng)用的看法:他習(xí)慣于一直看到技術(shù)的最終應(yīng)用場景,從而來確定技術(shù)的走向,而不是僅僅局限于技術(shù)的本身。針對創(chuàng)業(yè)公司缺乏數(shù)據(jù)的難題,王玨博士也給出了可行的解決方案建議,比如,將一個渲染引擎嵌入到機器學(xué)習(xí)的框架里面,使得渲染引擎能夠根據(jù)學(xué)習(xí)的需要動態(tài)生成數(shù)據(jù)。

根據(jù)新智元獲得的獨家消息,前Adobe首席科學(xué)家王玨已經(jīng)確認加盟國內(nèi)計算機視覺和深度學(xué)習(xí)初創(chuàng)企業(yè)曠視科技(Face++)。

這是繼2016年7月前微軟亞洲研究院(MSRA)視覺組的首席研究員、華人深度學(xué)習(xí)科研的領(lǐng)軍人物孫劍之后,又一名加入曠視科技的重量級研究員。根據(jù)曠視科技的介紹,2017年4月,在 Adobe 度過了 9 年半研究生涯的王玨博士低調(diào)離職,加入曠視(Face++)并帶領(lǐng)曠視美國研究院(Megvii Research US)。

王玨曾就讀清華,2007 年在美國華盛頓大學(xué)獲得博士學(xué)位,隨即加入 Adobe Research。憑借其出色的研究成果,在短短 6 年間,從助理研究員連升數(shù)級做到首席科學(xué)家 (Principal Scientist),據(jù)介紹,他是 Adobe Research 歷史上升職最快的科學(xué)家之一。

王玨同時在三個領(lǐng)域的最高級別會議和期刊發(fā)表論文:計算機視覺,計算機圖形學(xué) (包括 11 篇 SIGGRAPH ) 和人機交互,其研究成果廣泛應(yīng)用于 Adobe 的各項產(chǎn)品中,為 Adobe 近10年的影像處理軟件升級提供了強有力的技術(shù)支持。例如,2010年 Adobe 隆重發(fā)布的第一個商用動態(tài)視頻去背景技術(shù) Roto brush,以及2013年發(fā)布的第一款商用圖像去模糊工具 Shake Reduction, 都是由王玨主導(dǎo)完成的。

 舌頭分割手術(shù)視頻過程_舌頭分割手術(shù)視頻過程大全

  選擇曠視:孫劍不遠萬里到西雅圖親自邀請,“內(nèi)心是無法拒絕的”

2016年底,王玨博士萌生了離開 Adobe 的想法?!癆dobe Research 提供了一個非常舒適和優(yōu)越的研究環(huán)境,但是當舌頭分割手術(shù)視頻過程你已經(jīng)通過了它為你帶來的所有考驗之后,需要在一個新的環(huán)境里面繼續(xù)充實和提高自己?!?王玨這樣評價自己的離職訴求。

這個想法傳開后,王玨博士收到了許多公司的邀請,既有 Google, Facebook,以及騰訊和阿里這樣的行業(yè)巨頭,也有中美的多家創(chuàng)業(yè)公司。那么王玨博士最終選擇曠視的原因是什么呢舌頭分割手術(shù)視頻過程?王玨博士是這樣解釋的:

“主要是三個方面的原因。一是和曠視有天然的親近感。曠視是一幫有才華的清華年輕人創(chuàng)立的,在企業(yè)文化中有清華行勝于言,腳踏實地的價值觀。對于作為清華校友的我來講,對于這樣的文化有天然的熟悉和親近感。二是孫劍博士的誠意邀請。我和孫劍博士認識和同行多年,彼此都比較熟悉,他不遠萬里到西雅圖來邀請我,我內(nèi)心是無法拒絕的。第三是機遇。我個人覺得中國目前人工智能研究的環(huán)境,從數(shù)據(jù)規(guī)模到商業(yè)機會都比美國要好,但是在人才儲備上仍然不占優(yōu)勢。能夠幫助中國的人工智能公司,特別是初創(chuàng)公司更進一步,在美國吸引頂尖人才為我所用,對中國高科技發(fā)展是一件里程碑性質(zhì)的事情。這樣的機會在人生中并不多見,碰到了就應(yīng)該抓住”。

回顧自己的職業(yè)生涯,王玨博士深有感觸: “我個人的研究生涯是從美國公司在中國的研究院 (微軟亞洲研究院)開始,現(xiàn)在又加入中國公司在美國的研究院。這樣一個交替,見證了中國科技和商業(yè)在過去 15 年的高速發(fā)展?!?

  不追求將招聘重心放在頂級專家上,對于初創(chuàng)公司來講,戰(zhàn)斗力決定一切

 舌頭分割手術(shù)視頻過程_舌頭分割手術(shù)視頻過程大全

王玨現(xiàn)在帶領(lǐng)曠視的美國研究院,與孫劍負責(zé)的曠視中國研究院相互呼應(yīng)。那么,曠視的這個美國研究院目標和定位是什么?

王玨在接受新智元的采訪時說:“曠視美國研究院肩負著多重使命。最基本的一點,就是要為公司開拓新的市場,發(fā)展新的業(yè)務(wù)提供強有力的技術(shù)支持。也就是說,美國研究院要對曠視北京研究院形成互補,需要獨立承擔(dān)一些新方向的研發(fā)工作,而不僅僅是對現(xiàn)有的研究內(nèi)容錦上添花。在此之上,我們也希望通過自己的努力,提高曠視在世界范圍內(nèi)AI產(chǎn)業(yè)和科研中的話語權(quán)。最后,要為公司吸引一些在海外的優(yōu)秀人才為我所用。”

他還說,目前團隊在快速擴張中,我們的目標是在較短時間內(nèi)形成一個有戰(zhàn)斗力的團隊。這個團隊將包括多領(lǐng)域的精兵強將:計算機視覺,圖形學(xué),計算攝像學(xué),機器學(xué)習(xí)以及多媒體等,當然我們也十分注重團隊的層次感,要既有老將,也有新兵,既有科學(xué)家,也有工程師。

在人才招聘的標準上,王玨有著獨特的觀點,他說,我認為的最佳招聘是為公司找到契合度最高的人才。我們首先希望候選人對我們在做的事情有高度認同感。其次,我們希望候選人除了在學(xué)術(shù)研究上已經(jīng)有所建樹之外,能夠有把東西真正搞work的強烈興趣和一定的工程能力。最后,要有那么一點點極客精神。對于即將畢業(yè)的研究生來說,發(fā)表多少論文不重要,我們希望看到候選人獨立思考和全身心投入解決一個問題的態(tài)度和過程。

  他接著說道,頂級的視覺專家你們新智元已經(jīng)報道過很多了,但是我們不追求將招聘重心放在頂級專家上。把10個頂級專家放在一起,未必能形成一個有戰(zhàn)斗力的團隊。對于初創(chuàng)公司來講,戰(zhàn)斗力決定一切。

曠視美國研究院成立兩個多月了,它的現(xiàn)狀是什么呢?王玨博士說:“我們的理念是行勝于言,認真做事。我特別喜歡公司發(fā)的筆記本上面的一句話: Talk is cheap, show me the code. 成立短短兩個多月,我們已經(jīng)成立了一個小的團隊,已經(jīng)為曠視的產(chǎn)品提供了多項技術(shù)輸出,學(xué)術(shù)界也將很快看到我們的論文和研究成果?!?關(guān)于未來,“我們希望能盡快聚攏一批優(yōu)秀的人,建立一個有意思的研究環(huán)境,一起做一些有意思而且有意義的大事情”。

  做視覺的覺得我是做圖形學(xué)的,做圖形學(xué)的覺得我是做視覺的,兩邊人都來了我就說自己做人機交互

在 Adobe 9 年多的時間里,王玨博士手把手帶領(lǐng)過 31 位博士實習(xí)生,發(fā)表了了 65 篇學(xué)術(shù)論文,獲得了 58 項美國專利,實現(xiàn)了 13 項重要技術(shù)的研發(fā)和產(chǎn)品轉(zhuǎn)換。在眾多的技術(shù)之中,王玨博士對2013年發(fā)布的去模糊技術(shù) Shake Reduction 情有獨鐘。這項技術(shù)由王玨博士在2012年 Adobe MAX 技術(shù)大會上向 5000 多名觀眾公開演示。然而,讓王玨博士記憶猶新的原因并不在此。

王玨博士回憶說:“在13年底的某一天,我被叫到一個會議室,見到了公司的多位高管。老板用投影儀投出了一張模糊的圖片,說祝賀你,F(xiàn)BI 用你的技術(shù)恢復(fù)了這張圖片的細節(jié),從而根據(jù)其中的線索在 Kansas 解救了兩名被綁架的兒童。聽到這個消息,我整個人感覺像是被電流擊中一般,好幾天都處于非??簥^的狀態(tài)”?!坝米约旱募夹g(shù)讓這個世界美好了一點點,這對于科研人員來講,是一件非常有幸福感的事情”。在此之后,F(xiàn)BI 曾多次使用該技術(shù)輔助案件的偵破工作。

王玨博士形容自己是經(jīng)常走在岔道上的人,因為他的研究興趣非常廣泛?!白鲆曈X的覺得我是做圖形學(xué)的,做圖形學(xué)的覺得我是做視覺的,兩邊人都來了我就說自己做人機交互。” 王玨博士這樣打趣自己。“我一直以來都不給自己的研究加太多的限制,只關(guān)注于做自己感興趣的事情,自己能做的事情,用心做”。形成這樣的研究風(fēng)格也和王玨博士的經(jīng)歷有關(guān),他在清華自動化系跟隨李衍達院士的課題組研究醫(yī)學(xué)成像,在微軟研究院跟隨王堅博士(現(xiàn)阿里巴巴技術(shù)委員會主席)做手寫筆、和徐迎慶老師(現(xiàn)清華美術(shù)學(xué)院信息藝術(shù)設(shè)計系主任)做動畫,在華盛頓大學(xué)電子工程系跟隨圖形學(xué)泰斗 Michael Cohen (1998年圖形學(xué)終身成就獎得主) 研究計算攝像學(xué),“好像從來沒有務(wù)過本專業(yè)的正業(yè)”。

長期跨領(lǐng)域的研究,使得王玨博士在研究上總是喜歡多思考一些問題。“比如在做一個算法的時候,我不僅會考慮算法性能,還會考慮算法能否支持有效的用戶交互,這往往是傳統(tǒng)的計算機視覺研究人員容易忽視的問題。而這,也許是算法是否能夠落地的關(guān)鍵?!?

王玨對新智元說:“做技術(shù)研究的時候,我習(xí)慣于一直看到技術(shù)的最終應(yīng)用場景,從而來確定技術(shù)的走向,而不是僅僅局限于技術(shù)的本身。比如從視頻分割這個視覺經(jīng)典問題講起。分割不是最終目的,有多種可能的應(yīng)用,而不同的應(yīng)用對于算法精度和復(fù)雜度的要求是不同的。在Adobe的時候,我們希望分割結(jié)果能夠直接應(yīng)用在好萊塢的電影制作上,那么這個應(yīng)用對于分割精度的要求就非常高。而全自動的算法無論如何總是會出錯的。如何能在交互環(huán)境下有效的進行視頻分割就成了一個有意思的問題,一方面要求算法能夠在少量用戶干預(yù)下快速收斂到精確結(jié)果,另一方面也要求系統(tǒng)提供一種直觀和有效的交互方式,使得算法能夠輔助用戶進行高效的工作?!?/p>

  “落地”,未來成功產(chǎn)品轉(zhuǎn)化率希望能做到 50%

在和王玨博士的交流中,“落地”這個詞出現(xiàn)了好幾次?!耙鲅芯浚紫纫芯壳宄约骸?,王玨博士這樣說?!把芯糠譃楹芏喾N,有理論研究,基礎(chǔ)技術(shù)研究,基于好奇心的探索性研究,也有面向應(yīng)用的研究。每個人的喜好和特長是不一樣的,應(yīng)該選擇適合自己的研究道路。我是一個比較純粹的實用主義者,所以特別喜歡應(yīng)用驅(qū)動的研究,通俗的講,就是能落地的研究?!?

在王玨博士看來,能落地首先是選題的問題。“偉大的實用技術(shù)都有一個最基本的要素,就是他們解決的問題一定是用戶的剛需。要做能落地的研究,首選需要理解和關(guān)注用戶的痛點。工業(yè)界實驗室之所以能誕生很多實用技術(shù),是因為他們更貼近用戶,理解什么是真正對用戶有價值的問題,而不是閉門造車?!?在進入 Adobe 規(guī)劃第一個項目之前,王玨博士花了一個月的時間走訪了多家使用 Adobe 產(chǎn)品的影視機構(gòu),觀察他們的工作流程,傾聽他們對現(xiàn)有產(chǎn)品的吐槽,這才將動態(tài)視頻去背景這個全行業(yè)的痛點作為首要研究的課題。

落地是一個艱難的過程。在王玨博士看來,一篇優(yōu)秀的學(xué)術(shù)論文最多只解決了一半的問題,在落地過程還有大量的細節(jié)難關(guān)需要攻克,而攻克這些問題既需要靈感和巧妙的解決問題的思路,也需要大量的工程經(jīng)驗與實踐積累。有的時候,甚至需要全盤推翻學(xué)術(shù)論文里面提出的解決方法。在2016年做全景圖拼接的邊緣正則化這個項目中,王玨博士帶領(lǐng)團隊在研究了學(xué)術(shù)界最新研究成果后,提出了一種巧妙的替代算法,實現(xiàn)了計算速度百倍的提升,也使得這個研究成果成為今天 Adobe Lightroom 里面廣受歡迎的新功能。

“有一次在一個國際會議上遇到一家大公司 AI lab的manager, 聊天的時候我感嘆我自己參與的項目只有大概 25% 的成功產(chǎn)品轉(zhuǎn)化率,那位 mananger 很驚訝,因為他們那里這個數(shù)字只有大概 10%?!?王玨博士未來的目標,就是將這個轉(zhuǎn)化率翻一倍,希望能達到 50%。

新智元對50%的成功產(chǎn)品轉(zhuǎn)化率感到好奇,王玨博士進一步解釋說,要達到這個目標,核心還是在團隊的構(gòu)建。如果單單是把10個頂級視覺專家放在一起,那么這個目標是沒法達到了。一方面是團隊必須包含從初期研發(fā)到最終落地所需要的全部人才,更重要的一點,是每個團隊成員都要認可研究落地這個共同目標,并為之努力。特別是對科學(xué)家來說,能夠放下身段,傾聽客戶的聲音,從客戶需求中去尋找自己的研究課題,才能保證研究的實用性。這也是華為精神在曠視內(nèi)部廣受推崇的原因。

  計算機視覺的未來:有必要跳出視覺的圈子,從大系統(tǒng)的角度來看視覺,才不會有“只緣生在此山中”的錯覺

作為在計算機視覺技術(shù)上有著多年積累的資深研究者,王玨博士也與新智元分享了他對當下這一技術(shù)發(fā)展趨勢的看法。

首先,今年的CVPR上,ImageNet大規(guī)模圖像識別比賽被宣布終止,有專家解讀說,未來業(yè)界會朝向視覺理解進軍。那么,王玨博士如何看待計算機視覺的未來?

他說:“計算機視覺近幾年發(fā)展很快,也有很多人預(yù)測未來的發(fā)展方向,我覺得他們說得都很有道理。我只想提一點,有的時候有必要跳出視覺的圈子,從大系統(tǒng)的角度來看視覺,才不會有“只緣生在此山中”的錯覺。最近比較火的無人車和無人店就是很好的兩個例子,兩個都是系統(tǒng)工程,視覺是重要一環(huán),但是如何將視覺技術(shù)和其他技術(shù)有效融合,才是其是否能成功的關(guān)鍵?!?/p>

從視覺本身這個領(lǐng)域來看,王玨博士覺得基于視頻的視覺理解是一個重要的中長期方向。他說,現(xiàn)實世界中沒有生物是通過一張靜態(tài)圖片來認知的,這個世界的很多規(guī)則和信息都包含著時序序列中。舉個簡單例子,你和一個人面對面交談,他的復(fù)雜情緒變化你很容易從微小的面部表情感知。而拍一張圖片,大家喊一句“茄子”就可以蒙混過關(guān)。對于視頻的精細化理解,目前還處于起步階段,還有很長的路要走。

  計算機視覺在中國存在過剩嗎?

計算機視覺技術(shù)在中國非常火熱,有資料統(tǒng)計,幾乎一半以上的AI公司都在這一領(lǐng)域發(fā)力,那么,在中國市場,這一技術(shù)存在過剩嗎?

王玨博士認為,計算機視覺技術(shù)做的人多是因為它確實有很明確的應(yīng)用場景,已經(jīng)有很多成功的商業(yè)化樣例。從這個角度來講,他不覺得有過剩。他說,其實在計算機應(yīng)用領(lǐng)域的研究上,產(chǎn)學(xué)研結(jié)合得非常緊密,如果有過剩的話市場機制會慢慢矯正。等到哪天學(xué)視覺的同學(xué)找工作比較困難了,那就是真正過剩了。

關(guān)于這一技術(shù)的落地,他認為,目前落得非常好的是人臉的識別和認證,這件事的價值非常大,可以對多個行業(yè)帶來巨大影響,現(xiàn)在是安防和金融,即將是零售和服務(wù)業(yè)。無人駕駛是另一個很清晰的落地點?!跋鄬τ卺t(yī)療,我更看好視覺在工業(yè)和農(nóng)業(yè)機器人領(lǐng)域的落地前景。相對于給人看病,我覺得先給農(nóng)作物看病更容易實現(xiàn)”,王玨說。

  最后,王玨博士也與新智元分享了他對數(shù)據(jù)的看法。他說,大公司會通過開源技術(shù),封閉數(shù)據(jù)來打擊潛在的競爭對手。對于初創(chuàng)公司,如果沒有明確在商業(yè)計劃書里面提到數(shù)據(jù)來源我會感到不可思議。其中的一個方案是可以想辦法造數(shù)據(jù)。對于計算機圖形學(xué)來說,這是一個機會。以前圖形學(xué)的渲染主要是給人看,未來會有越來越多的渲染是給機器看。一個有意思的問題是如何將一個渲染引擎嵌入到機器學(xué)習(xí)的框架里面,使得渲染引擎能夠根據(jù)學(xué)習(xí)的需要動態(tài)生成數(shù)據(jù)。這方面學(xué)術(shù)界已經(jīng)有一些嘗試,他感覺潛力十分巨大。

了解更多曠視美國研究院相關(guān)信息

  

  Power Human with AI.

  www.megvii.com

評論列表

還沒有評論,快來說點什么吧~

發(fā)表評論

真誠期待與您的合作

獲取報價·了解更多業(yè)務(wù)·7*24小時專業(yè)服務(wù)

聯(lián)系我們