近日,由斯坦福大學發起的機器閱讀理解領域頂級賽事SQuAD刷新了排名,AI的閱讀能力歷史上首次超越人類。阿里巴巴稱,其憑借82.440的精準率打破了世界紀錄,并且超越了人類82.304的成績。
(圖片來源:阿里科技)
此次技術的重大突破源于阿里巴巴研究團隊提出的“基于分層融合注意力機制”的深度神經網絡模型。該模型能夠模擬人類在做閱讀理解問題時的一些行為,包括結合篇章內容審題,帶著問題反復閱讀文章,避免閱讀中遺忘而進行相關標注等。
值得一提的是,該自然語言處理團隊還支撐了阿里巴巴整個生態的技術需求,由他們研發的AliNLP自然語言技術平臺每日調用1200億+次,Alitranx翻譯系統提供20個語種在線服務日調用量超過7億+次。
據悉,SQuAD比賽構建了一個包含10萬個問題的大規模機器閱讀理解數據集,文章來源于500多篇維基百科文章。人工智能在閱讀完數據集中的一篇短文之后,需要回答若干個基于文章內容的問題,然后與標準答案進行比對,得出精確匹配(ExactMatch)和模糊匹配(F1-score)的結果。
該比賽吸引了谷歌、卡內基·梅隆大學、斯坦福大學、微軟亞洲研究院、艾倫研究院、IBM、Facebook等知名企業研究機構和高校的深度參與。