目錄
2月24日消息,據報道,DeepSeek今日啟動“開源週”,首個開源的代碼庫為Flash MLA——針對Hopper GPU優化的高效MLA解碼內核,專為處理可變長度序列而設計。據介紹,Flash MLA的靈感來自FlashAttention 2&3和cutlass計畫。
2月24日消息,據報道,DeepSeek今日啟動“開源週”,首個開源的代碼庫為Flash MLA——針對Hopper GPU優化的高效MLA解碼內核,專為處理可變長度序列而設計。據介紹,Flash MLA的靈感來自FlashAttention 2&3和cutlass計畫。