馬斯克表示,特斯拉Dojo AI 訓練計算機正在取得進展。我們將于今年晚些時候上線下一代AI芯片Dojo 2。一項新技術要經過三次重大迭代才能成為偉大的技術。Dojo 2已經很好了,但Dojo 3一定會更棒。
特斯拉AI官方發(fā)文的內容是其最新的Dojo技術報告。特斯拉AI表示Dojo超級計算機正面臨制造缺陷和老化導致的靜默數據損壞(SDC)問題。與傳統(tǒng)的系統(tǒng)崩潰不同,這些缺陷不會立即暴露,而是在訓練過程中悄無聲息地破壞數據完整性。
一個有缺陷的節(jié)點可能導致耗時數周的AI模型訓練產生錯誤結果,或使收斂速度顯著放緩。更致命的是,這些問題在模型訓練完成后幾乎無法檢測——企業(yè)可能在不知情的情況下部署了基于損壞數據訓練的AI系統(tǒng)。
Dojo是特斯拉設計的超級計算機系統(tǒng),用作人工智能,特別是FSD的訓練場。這個名字是對武術練習道場的致敬。
超級計算機由數千臺稱為節(jié)點的小型計算機組成。這些節(jié)點各自擁有自己的CPU(中央處理單元)和GPU(圖形處理單元)。前者負責節(jié)點的總體管理,后者則處理復雜的事情,比如將任務分割成多個部分并同時進行處理。
免責聲明:文章只做訊息的收集及分享,文章來源:新浪財經、半導體芯聞,版權歸原撰寫發(fā)布機構所有,如涉及侵權,請聯系我們刪除。