本文梳理和比較了百度、騰訊、阿里巴巴三家人工智能實驗室的架構、研究方向及研究領域。總的來說,BAT各自AILab所關注的方向和定位有著明顯的差異,這也顯示了三家公司對AI的不同看法以及AI在三家公司內戰略地位的差異。
隨著阿里正式發布智能音箱“天貓精靈X1”,其2016年成立的人工智能實驗室也首次高調亮相。BAT的人工智能實驗室至此已讓人眼花繚亂。本文將為您梳理和比較百度、騰訊、阿里巴巴三家人工智能實驗室的架構、研究方向及研究領域,并希望能從中一窺這三巨頭的AI前進方向。
百度:人事動蕩,陸奇帶來研究院大調整
百度的AILab全稱是SiliconValleyAILab(硅谷人工智能實驗室),成立于2014年。
在百度硅谷人工智能實驗室的官方網站上,他們的自我介紹是:“硅谷AI實驗室的使命是開發AI技術,我們認為這將對至少1億人的生活產生重大影響。我們的研究建立在深度學習,大數據和高性能計算的強大組合之上。事實上,SVAIL擁有深度學習和系統研究團隊,能夠攜手共同探索最新的深度學習算法,以及通過新的硬件和軟件技術來尋找創新的方法來加速人工智能研究。”
正如他們自我介紹里所說,百度在硅谷的AILab專注于深度學習技術與國內較為知名的深度學習實驗室(IDL)功能類似。百度硅谷AILab在學術研究上較為活躍,經常在官方博客上介紹最新研究,比如最新的深度學習基準工具DeepBench。DeepBench是一種深度學習基準工具,用來評估深度神經網絡訓練中的基礎操作的表現,現在已經開源。
從這一點上看,百度硅谷AILab與谷歌大腦和Facebook的FAIR很像,他們專注于深度學習技術的研究,經常有前沿的技術成果放出。
從百度整個公司層面來看,正如大家看到的那樣,這些年來,百度人工智能的技術核心,還有一個關鍵詞——深度學習。四年前,也就是2013年1月,百度正式宣布成立深度學習研究院(IDL),李彥宏擔任院長,余凱任副院長。
同年,在美國百度也建立了人工智能團隊,還是以“深度學習”命名,叫“深度學習研究中心”,也叫“美研院”,第二年人數便從30多人擴充到超過100人。
2014年5月,百度在硅谷成立硅谷人工智能實驗室;同年7月,百度成立大數據實驗室。
從2014年到2017年,在人工智能上,百度研究院大致的劃分如下:百度研究院由吳恩達統領,其下轄四個實驗室:硅谷人工智能實驗室(SVAIL)、深度學習實驗室(IDL)、大數據實驗室(BDL)與AR實驗室。
不過2017年上半年,百度內部發生人事震蕩,迎來硅谷華人傳奇“陸奇”,但也失去了“深度學習大神”吳恩達。隨著吳恩達離職,陸奇擔任COO,百度的組織架構也迎來了一次大調整:百度研究院成為陸奇手下五大業務體系中AI技術平臺體系(AIG)的一個組成部分,由王海峰全面負責,吳恩達的接任者——林元慶,需要向負責人王海峰匯報。AIG成為繼IDG(百度智能駕駛事業群組)后百度最新的事業群組。AIG即AI技術平臺體系,將進一步深度整合包括NLP、KG、IDL、Speech、BigData等在內的百度核心技術。
陸奇的五大業務體系中,除了AI技術平臺(AIG)外,還有搜索、新興業務事業群組、IDG(智能駕駛事業群組)和FSG(金融服務事業群組)。
至此,百度研究院被正式“收編”。
騰訊:自帶應用的AILab
騰訊人工智能實驗室屬于技術工程事業群,與騰訊大數據等部門并列,是公司基礎AI技術的提供者。
張潼作為騰訊AILab第一負責人,帶領50余位AI科學家及200多位AI應用工程師團隊,專注于人工智能的基礎研究,主要包括計算機視覺、語音識別、自然語言處理和機器學習這四個垂直領域。
如果要用一句話來總結騰訊AILab的特點,那就是:Lab里面是自帶應用的,這和只專注技術的實驗室不一樣。
騰訊公司總裁劉熾平在宣布張潼加入騰訊時曾表示,“人工智能的高速發展除了依靠算法和計算能力的快速提升外,也離不開豐富的應用場景、海量的大數據及強大的計算能力。在過去18年里,騰訊在這些方面有了很多的積累,這對于我們AILab的發展來說是一個重要的基礎。”
從劉熾平對騰訊AILab定位可以看出,“豐富的應用場景、海量的大數據及強大的計算能力”是騰訊認為自己的優勢所在。騰訊AILab曾經喊出“學術有影響,工業有產出”的口號。
提起騰訊的AI,除了AILab,往往還能想到其它的部門,例如成立更早的優圖實驗室、微信模式識別中心、騰訊數據平臺、以及微信和香港科技大學的聯合實驗室。它們跟成立才滿一年的AILab之間是什么關系?
此前在接受新智元的專訪時,張潼曾表示,騰訊不同事業部旗下都在開展不同領域的AI研究。他們是協同關系。以AILab為例,張潼說:“技術工程事業群TEG一直以來是騰訊技術的基礎設施大本營,TEG是騰訊內部的技術支撐平臺,為公司提供全方位的運營解決方案和服務支持。因此,AILab的重點是基礎研究和應用探索的結合,為其他事業群提供一些AI底層技術支持,也會有一些的跨部門合作。打造全面AI能力,MakeAIEverywhere,讓真正的人工智能未來無處不在。”
AILab
成立時間:2016年
主任:張潼副主任:俞棟
2017年3月23日,騰訊任命張潼為AILab主任,新智元曾對此做過特別報道:騰訊任命張潼為AILab主任,“無”恩達時代BAT人工智能三國殺加入騰訊前,張潼博士曾經擔任美國新澤西州立大學教授、IBM研究院研究員、雅虎研究院主任研究員,百度研究院副院長和大數據實驗室負責人,期間參與和領導開發過多項機器學習算法和應用系統。
據AILab官網顯示,目前實驗室有超過50余位世界知名學院的AI科學家(90%為博士)、及200多位經驗豐富的AI應用工程師,力求做到“學術有影響,工業有產出”。
AILab研究方向:
與騰訊的業務場景相結合。比如騰訊在游戲方面有優勢,而游戲在目前很多AI研究中都扮演著重要角色,因為游戲產生的大量模擬數據可以用來開發AI能力,而其中的算法還可以沉淀下來,放到實際中去。前段時間在日本圍棋AI大賽中奪冠的絕藝就是例子。
騰訊比較重視內容生態,包括如何將用戶連接至最好的內容,這就需要推薦和搜索。另外,協助生成一些內容,比如說用機器人寫新聞(前有Dreamwriter,即將又要推出APP“新聞超秘”)。同時,圖象識別技術將幫助騰訊做內容理解和內容生成方面的東西。
社交相關。如人機交互,特別是用自然語言、語音實現交互,進而通過對話,完成一些特定場景的任務。在做通用對話仍有困難的現實條件下,騰訊希望在一些特定場景上實現對話。前不久騰訊發布的智能語音產品“騰訊云小微”可以看作是這一方向的最新實踐。
在云方面,騰訊也希望能提供一些基礎組件,放在云上,“讓小企業用到AI能力”。今年3月份騰訊DI-X深度學習平臺的推出可以看作是這方面努力的代表。在發布“騰訊云小微”的騰訊云峰會上,騰訊又推出了“智能云”,借此輸出AILab的技術。
研究領域:在騰訊AILab官網上,列出了四個研究領域:計算機視覺,語音識別,自然語言處理和機器學習。這四方面的技術將支撐AILab朝上述研究方向行進。
在AILab成立前,騰訊已有優圖實驗室、WhatLab、微信北京研發中心、智能計算與搜索實驗室四個人工智能相關的研發機構。AILab成立后不久,又成立了西雅圖AI實驗室。
騰訊優圖:
騰訊優圖是騰訊人工智能技術的支柱之一,創立于2012年,專注在圖像處理、模式識別、機器學習、數據挖掘等領域開展技術研發和業務落地。團隊成員將近百人,大都是來自于清華、北大、中科院、上海交大、浙大等頂級院校的博士、碩士。
2017年5月15日,香港中文大學終身教授賈佳亞博士加盟騰訊優圖實驗室。作為杰出科學家,賈佳亞教授將負責計算機視覺、圖像處理、模式識別、機器學習等人工智能領域的研究,及人工智能與各應用場景結合的深度探索。
這是2017年以來,繼張潼、俞棟之后,又一位加入騰訊的重量級人工智能領域頂級專家。
2017年4月,騰訊優圖實驗室在國際最權威、難度最高的海量人臉識別數據庫MegaFace中,以83.290%的最新成績在100萬級別人臉識別測試(Challenge1/FaceScrubidentification)中拔得頭籌。
此前,在國際權威人臉識別數據庫LFW上,騰訊優圖實驗室在無限制條件下人臉驗證測試(unrestrictedlabeledoutsidedata)中提交的最新成績為99.80%,提升了去年6月取得的99.65%的成績。
WhatLab:微信-香港科技大學人工智能聯合實驗室。以人工智能為主要研究方向,借助大數據拓展機器學習邊界。
微信北京研發中心:研究方向有語音識別、圖像分析、語義理解、微信大數據挖掘等,其研發成果廣泛應用于微信和騰訊其他產品中。對外提供的服務有微信語音識別、圖像分析、音頻指紋、微信語義客服機器人等。
微信模式識別中心也是一個研發中心,隸屬于微信北京研發中心。模式識別中心原先不屬于微信,其前身是騰訊研究院下屬模式識別小組,2010年9月成立。關于團隊的研究方向,據團隊負責人陳波介紹,主要分為語音和圖像兩個小組,語音研究對應的是手機上的麥克風,圖像對應的是手機攝像頭。除了科學研究團隊,模式識別中心還有一個工程團隊與微信產品團隊進行對接。
智能計算與搜索實驗室:成立于2015年,專注于搜索技術、自然語言處理、數據挖掘和人工智能四大研究領域。實驗室主要組織了技術與工程事業群里有學術志向的員工參與研究工作,同時與哈工大,中科大等高校展開合作,研究成果成功應用于微信、QQ、QQ音樂、QQ視頻等產品中。
騰訊西雅圖AI實驗室:2017年5月2日,騰訊宣布任命語音識別技術頂級專家俞棟博士為AILab(人工智能實驗室)副主任,并成立美國西雅圖AI實驗室。俞棟博士將負責西雅圖AI實驗室的運營及管理,推動騰訊在語音識別及自然語言理解等AI領域的基礎研究。
阿里:AILab偏向消費級產品
2017年7月5日,阿里巴巴舉辦智能音箱“天貓精靈”發布會,阿里巴巴人工智能實驗室(AILabs)負責人淺雪在接受專訪時說,阿里人工智能實驗,不僅有科學家團隊、算法團隊,還有產品經理,也有終端的負責人。相對來說,iDST是一個核心AI基礎技術的提供者,AILabs許多技術來自iDST。最大的區別在于,AILabs更多地偏向消費級產品。
“淺雪”,原名陳麗娟。根據此前公開的信息,她曾經擔任淘寶首任產品經理,一淘網運營總監,阿里智能云總監等職務。據內部人士透露,淺雪曾一手建立了阿里智能生活事業部。
由此看來,阿里巴巴的人工智能實驗室在有一個重要的特征——偏向消費級產品。這從負責人“淺雪”的職業經歷也可以看出來。
阿里巴巴人工智能實驗室
成立時間:2016年
首次亮相:2017年7月5日
負責人:陳麗娟
杰出科學家:王剛
阿里巴巴人工智能實驗室杰出科學家、前南洋理工大學教授王剛研究方向:消費級AI產品的研發。如實驗室的第一款智能語音終端設備“天貓精靈X1”,以及背后的智能語音助手和開發者平臺AliGenie。
據介紹,AliGenie開發者平臺有以下核心技術開放:深度學習、自然語言處理、搜索/推薦算法和知識表示及推理問答系統。阿里方面表示,"上述能力阿里將免費開放給開發者和硬件廠商,無需從頭搭建AI語音系統,節省在研發上的巨量投入,使開發者能夠更好的為用戶提供服務。"iDST(數據科學與技術研究院)
成立時間:2014年
院長:金榕
首席科學家:任小楓
計算視覺組負責人:華先勝
左起:任小楓、金榕、華先勝
任小楓是前亞馬遜資深主任科學家,他加盟阿里巴巴iDST后,除擔任首席科學家和副院長,同時負責阿里人工智能實驗室西雅圖團隊的搭建。
更多資訊請關注工業機器人頻道