網站平台
圖片來源:VentureBeat 使用 Midjourney 製作
加入我們的每日和每週通訊,以了解相關行業領先的人工智能報道的最新更新和獨家內容。
鎮上出現了一位新國王:人工智能寫作新創公司HyperWrite的聯合創始人兼創始人Matt Shumer今天推出了Reflection 70B,這是一個基於Meta開源Llama 3.1-70B Instruct的新大型語言模型(LLM) ),利用了新的錯誤-自我校正技術,並在第三方基準測試中擁有卓越的性能。
正如 Shumer 在社群網站 X 上一篇文章中所宣布的那樣,Reflection-70B 現在似乎是「世界頂級的開源人工智慧模型」。
他發布了下面的圖表,顯示了其基準性能:
Reflection 70B 已使用 LMSys 的 LLM Decontaminator 在多個基準測試中進行了嚴格的測試,包括 MMLU 和 HumanEval,以確保結果不受污染。商業模式進行正面競爭。
你可以在「playground」網站上嘗試一下,但正如Shumer 在X 上指出的那樣,新的開源AI 模型之王的聲明已經讓演講網站充滿了流量,他的團隊正在先恐後地尋找足夠的資源。
Reflection 70B 為何工廠
Shumer強調,Reflection 70B不僅能與結構模型競爭,還能帶來獨特的功能,特別是錯誤和修改。
舒默透過DM 告訴VentureBeat 是這樣的:「我幾個月來一直在思考這個想法。法學碩士會產生幻覺,但他們無法修正方向。如果你教法學碩士如何識別和修正自己的錯誤,會發生什麼?
因此得名「反射」——一個模型,可以反映其生成的文本並在將其輸出傳遞給用戶之前評估其準確性。
該模型的優勢在於一種稱為反射調整的技術,該技術允許其檢測自身推理中的錯誤並在最終確定響應之前修復這些錯誤。
Reflection 70B 引入了一些新的用於推理和糾錯的特殊標記,使用戶更容易以更結構化的方式與模型互動。錯誤時進行即時修改。
Playground 簡報網站包含供使用者使用的建議提示,詢問Reflection 70B 以單字「Strawberry」有多少個字母「r」實例,以及哪個數字擴充,9.11 或 9.9,這是許多 AI 模型面臨的兩個簡單問題-包括引導母線的-無法一致地正確。
這使得模型對於完成的任務特別有用,因為這需要推理分成不同的步驟以提高精確度。 Hyperbolic Labs 提供。
更強大、更大的型號即將推出
Reflection 70B 的發布只是 Reflection 系列的開始。
他也告訴 VentureBeat,HyperWrite 正在致力於將 Reflection 70B 模型整合到其主要的人工智慧程式設計助理產品中。
「我們正在探索多種分享模型整合到 HyperWrite 的方法——我很快就會更多相關內容,」他承諾。
Reflection 405B的效能預計甚至訓練未來市場上的嚴格閉源模型。
Reflection 70B 的基礎模型是基於 Meta 的 Llama 3.1 70B 指令構建,並使用現有的 Llama 聊天格式,確保與現有工具和管道的兼容。
Shumer 稱讚 Glaive 實現了快速 AI 模型訓練
Reflection 70B 成功的關鍵因素是 Glaive 產生的合成數據,Glaive 是一家專門從事創建特定數據集的新創作公司。
Glaive的平台能夠快速訓練小型、高度集中的語言模型,有助於實現人工智能工具的民主化之一。於任務的資料的可用性。
Glaive 的方法是創建適合特定需求的合成資料集,使公司能夠快速且經濟地調整模型。增的開源替代模型。 。
透過利用 Glaive 的技術,Reflection 團隊能夠快速產生高品質的合成資料來訓練 Reflection 70B。
Shumer 在給 VentureBeat 的直接訊息中表示,訓練過程總共花了三週。數據生成系統建置。
HyperWrite 是長島罕見的人工智能新創公司
乍一看,Reflection 70B 似乎是憑空而來。
他於 2020 年與 Jason Kuperberg 一起創立了自己的公司,最初名為 Otherside AI。 它最初的總部設在紐約州梅爾維爾,是一個距離紐約市以東約一小時車程的長島小村莊。
它繼承了標誌性產品 HyperWrite 而受到關注,該產品最初是一個 Chrome 擴展,供消費者根據撰寫電子郵件和回复,但現在發展到可以處理起草論文、匯總文本甚至組織電子郵件等任務。月,HyperWrite的用戶數量已達到200萬,這使得聯合創始人在 福布斯每年的「30歲以下30歲」名單,最終促使 Shumer 和 Kuperberg 以及他們不斷成長的團隊更改了公司名稱,以匹配他們的熱門產品。
HyperWrite 的最新融資於 2023 年 3 月披露,獲得了包括 Madrona Venture Group 欠下的投資者註資 280 萬美元。可以處理從預訂航班到LinkedIn上尋找求職者等任務。
Shumer 指出,準確性和安全性仍然是 HyperWrite 的護理任務,特別是當他們探索複雜的自動化任務時。模仿Reflection 70B嵌入的建構推理和反思,展現了舒默對人工智慧開發的精確性和責任感的承諾。
HyperWrite 和 Reflection AI 模型系列的下一步是什麼?
展望未來,舒默對《Reflection》系列有更大的計劃。
這不僅對 OpenAI 來說是個壞消息(據報道,OpenAI 正尋求從 Nvidia 和蘋果等公司募集新一輪重大私人投資),對 Anthropic 甚至微軟等其他閉源模型來說也是個壞消息。
看來,在快速發展的新一代人工智慧領域,力量平衡又改變了。
目前,Reflection 70B的發布開源AI的一個重要里程碑,讓開發人員和研究人員能夠獲得與初等模型功能相媲美的強大工具。開源模型的實作設定新標準。
VB日報
了解保持!
訂閱即表示您同意 VentureBeat 的服務條款。
感謝您的訂閱。
發生錯誤。