認識世界上最強大的全新AI開源模型：HyperWrite的Reflection 70B

2024 年 9 月 6 日

分類

全部新聞

標籤

認識世界上最強大的全新AI開源模型：HyperWrite的Reflection 70B

網站平台

2024年9月5日下午2:54

網站平台身穿紅色長袍、頭戴金冠的機器人國王站在紅色塊狀風景的一面大鏡前

圖片來源：VentureBeat 使用 Midjourney 製作

加入我們的每日和每週通訊，以了解相關行業領先的人工智能報道的最新更新和獨家內容。

鎮上出現了一位新國王：人工智能寫作新創公司HyperWrite的聯合創始人兼創始人Matt Shumer今天推出了Reflection 70B，這是一個基於Meta開源Llama 3.1-70B Instruct的新大型語言模型（LLM）），利用了新的錯誤-自我校正技術，並在第三方基準測試中擁有卓越的性能。

正如 Shumer 在社群網站 X 上一篇文章中所宣布的那樣，Reflection-70B 現在似乎是「世界頂級的開源人工智慧模型」。

我很高興地宣布世界頂級開源模型Reflection 70B。

使用Reflection-Tuning進行培訓，這是一種為使法學碩士能夠修復自己的錯誤而開發的技術。

405B將於下週推出—我們預計將成為世界上最好的型號。

使用@GlaiveAI 構建。

繼續閱讀⬇️：pic.twitter.com/kZPW1plJuo

— 馬特舒默 (@mattshumer_) 2024 年 9 月 5 日

他發布了下面的圖表，顯示了其基準性能：

Reflection 70B 已使用 LMSys 的 LLM Decontaminator 在多個基準測試中進行了嚴格的測試，包括 MMLU 和 HumanEval，以確保結果不受污染。商業模式進行正面競爭。

你可以在「playground」網站上嘗試一下，但正如Shumer 在X 上指出的那樣，新的開源AI 模型之王的聲明已經讓演講網站充滿了流量，他的團隊正在先恐後地尋找足夠的資源。

Reflection 70B 為何工廠

Shumer強調，Reflection 70B不僅能與結構模型競爭，還能帶來獨特的功能，特別是錯誤和修改。

舒默透過DM 告訴VentureBeat 是這樣的：「我幾個月來一直在思考這個想法。法學碩士會產生幻覺，但他們無法修正方向。如果你教法學碩士如何識別和修正自己的錯誤，會發生什麼？

因此得名「反射」——一個模型，可以反映其生成的文本並在將其輸出傳遞給用戶之前評估其準確性。

該模型的優勢在於一種稱為反射調整的技術，該技術允許其檢測自身推理中的錯誤並在最終確定響應之前修復這些錯誤。

Drive Reflection 70B的技術很簡單，但功能非常強大。

目前的法學碩士有產生幻覺的關聯，無法覺察自己何時會產生幻覺。

反射調優使法學能夠認識到自己的錯誤，然後在修正它們之前做出答案。

— 馬特舒默 (@mattshumer_) 2024 年 9 月 5 日

Reflection 70B 引入了一些新的用於推理和糾錯的特殊標記，使用戶更容易以更結構化的方式與模型互動。錯誤時進行即時修改。

Playground 簡報網站包含供使用者使用的建議提示，詢問Reflection 70B 以單字「Strawberry」有多少個字母「r」實例，以及哪個數字擴充，9.11 或 9.9，這是許多 AI 模型面臨的兩個簡單問題-包括引導母線的－無法一致地正確。

這使得模型對於完成的任務特別有用，因為這需要推理分成不同的步驟以提高精確度。 Hyperbolic Labs 提供。

更強大、更大的型號即將推出

Reflection 70B 的發布只是 Reflection 系列的開始。

他也告訴 VentureBeat，HyperWrite 正在致力於將 Reflection 70B 模型整合到其主要的人工智慧程式設計助理產品中。

「我們正在探索多種分享模型整合到 HyperWrite 的方法——我很快就會更多相關內容，」他承諾。

Reflection 405B的效能預計甚至訓練未來市場上的嚴格閉源模型。

Reflection 70B 的基礎模型是基於 Meta 的 Llama 3.1 70B 指令構建，並使用現有的 Llama 聊天格式，確保與現有工具和管道的兼容。

Shumer 稱讚 Glaive 實現了快速 AI 模型訓練

Reflection 70B 成功的關鍵因素是 Glaive 產生的合成數據，Glaive 是一家專門從事創建特定數據集的新創作公司。

Glaive的平台能夠快速訓練小型、高度集中的語言模型，有助於實現人工智能工具的民主化之一。於任務的資料的可用性。

我想說的很清楚——@GlaiveAI 是它如此有效的原因。

他們為您提供生成合成數據的控制是瘋狂的。

我將在接下來建立的幾乎每個模型中使用它們，您也應該這樣做。

— 馬特舒默 (@mattshumer_) 2024 年 9 月 5 日

Glaive 的方法是創建適合特定需求的合成資料集，使公司能夠快速且經濟地調整模型。增的開源替代模型。。

透過利用 Glaive 的技術，Reflection 團隊能夠快速產生高品質的合成資料來訓練 Reflection 70B。

Shumer 在給 VentureBeat 的直接訊息中表示，訓練過程總共花了三週。數據生成系統建置。

HyperWrite 是長島罕見的人工智能新創公司

乍一看，Reflection 70B 似乎是憑空而來。

他於 2020 年與 Jason Kuperberg 一起創立了自己的公司，最初名為 Otherside AI。它最初的總部設在紐約州梅爾維爾，是一個距離紐約市以東約一小時車程的長島小村莊。

它繼承了標誌性產品 HyperWrite 而受到關注，該產品最初是一個 Chrome 擴展，供消費者根據撰寫電子郵件和回复，但現在發展到可以處理起草論文、匯總文本甚至組織電子郵件等任務。月，HyperWrite的用戶數量已達到200萬，這使得聯合創始人在 福布斯每年的「30歲以下30歲」名單，最終促使 Shumer 和 Kuperberg 以及他們不斷成長的團隊更改了公司名稱，以匹配他們的熱門產品。

HyperWrite 的最新融資於 2023 年 3 月披露，獲得了包括 Madrona Venture Group 欠下的投資者註資 280 萬美元。可以處理從預訂航班到LinkedIn上尋找求職者等任務。

Shumer 指出，準確性和安全性仍然是 HyperWrite 的護理任務，特別是當他們探索複雜的自動化任務時。模仿Reflection 70B嵌入的建構推理和反思，展現了舒默對人工智慧開發的精確性和責任感的承諾。