超強大自動NLP工具!谷歌推出AutoML自然語言預訓練模型
谷歌近日宣布面向全球用戶推出AutoML Natural Language的通用版本,支持分類、情緒分析和實體提取等任務,以及支持各種文件格式,包括掃描的pdf文件。現在戳右邊鏈接上新智元小程序了解更多!
今年早些時候,谷歌發布了AutoML自然語言(AutoML Natural Language),這是其Cloud AutoML機器學習平臺向自然語言處理領域的擴展。
經過數月的beta測試,谷歌近日宣布面向全球用戶推出AutoML Natural Language的通用版本,支持分類、情緒分析和實體提取等任務,以及支持各種文件格式,包括掃描的pdf文件。
AutoML自然語言利用機器學習來揭示電子郵件、聊天日志、社交媒體帖子等文本的結構和含義。它可以從上傳或粘貼的文本、或谷歌云存儲的文檔中提取關于人、地點和事件的信息,允許用戶訓練自己的自定義AI模型來對情緒、實體、內容和語法等進行分類、檢測和分析。此外,它還提供自定義實體提取功能,該功能可以在文檔中識別出標準語言模型未出現的特定于領域的實體。
AutoML Natural Language有超過5000個分類標簽,并允許訓練多達100萬個文檔,文檔的大小最大10MB。谷歌表示,這使得它非常適合“復雜”的用例,比如理解法律文件或為擁有大量內容的組織進行文檔分割。
自發布以來的幾個月中,它已經得到很大改進,特別是在文本和文檔實體提取方面。谷歌表示,AutoML自然語言現在可以考慮附加上下文(例如文檔的空間結構和布局信息)來訓練模型和預測,提高發票、收據、簡歷和合同等類型文本的識別能力。
此外,谷歌表示,AutoML Natural Language現在已經獲得FedRAMP的中級授權(FedRAMP 是為政府啟用安全云計算的美國程序),使聯邦機構更容易利用AutoML的功能。
赫斯特集團(Hearst,美國出版界巨頭)已經在使用AutoML Natural Language來幫助組織其國內和國際雜志的內容,日本出版商日經集團(Nikkei Group)也在利用AutoML Translate來發布不同語言的文章。Chicory是第三個早期采用者,利用它為Kroger、Amazon和Instacart等雜貨零售商開發定制數字購物和營銷解決方案。
AutoML Natural Language的產品經理Lewis Liu在一篇博客文章中解釋說,他們的最終目標是為需要定制機器學習模型的組織、研究人員和企業提供一種簡單、實用的訓練方法。“自然語言處理是揭示文本結構和意義的寶貴工具,”他說,“我們通過更好的微調技術和更大的模型搜索空間,與Google AI研究部門合作,不斷提高模型的質量。我們還引入了更高級的特性來幫助 AutoML自然語言更好地理解文檔。”
值得注意的是,AutoML是在AWS Textract之后推出的。AWS Textract是亞馬遜開發的針對文本和數據提取的機器學習服務,于今年5月推出。微軟在Azure Text Analytics中也提供類似的服務。
相關文章
車路協同繞不開5G+車聯網,自動駕駛的積極探索與實踐
談到智能網聯,我們很難繞開的一個詞是車路協同。過去幾年,業內都在講自動駕駛是汽車產業發展的一個終極目標。在探索過程中,我們提出了聰明的車和智慧的路,那么,如何在復雜場景下實時、可靠地交付,就必須有一個靠譜的車路協同。關于這一點...
推出近兩年,鴻蒙讓開發者感到驚喜了嗎?
三年時光轉瞬即逝,華為依然處在被谷歌斷供等一系列挑戰中,尋找生機、努力突圍,而HarmonyOS,也是如此。2019年5月,谷歌在美國對華為的貿易禁令之下,開始限制華為對安卓操作系統的使用。作為華為“備胎”之一,Harmony...
十萬平數字化、全自動“超級大冰箱”,盒馬上海供應鏈中心單日可分揀超280萬份訂單
未來,航頭物流基地,會支持全國200家門店的物流周轉需求,并串聯上下游,通過自動化項目的高效運轉,提升整個供應鏈的供給效率、降低供應鏈的整體運營成本。
工業自動化新格局下,PLC增長點在哪?
從上世紀六十年代末PLC誕生之日起,伴隨著幾十年工業自動化的發展,PLC的應用技術已經相當成熟,在國內外已廣泛應用于鋼鐵、石油、化工、電力、建材、機械制造、汽車、輕紡、交通運輸、環保、水處理及文化娛樂等各個行業,發揮了巨大的作...