研究チームは、DeepSeekの基本技術をわずか30ドルで再現しました。この新しい技術部門に関連するコストに疑問を呈する偉業。
後根本的にコストが低い業界を揺るがしましたアメリカの競争相手のオープンアライと後者の怒りを引き起こしました、モデルオープンソースのdeepseek今回は研究者の注目を集めています。バークレー大学のチームは最近、Deepseekテクノロジーの中心を再現したことを発表しましたわずか30ドル。
学習モデル
それは続いていますx(以前のツイッター)それJiayi Pan、バークレー大学の博士課程の学生は、この偉業を発表しました。一連の出版物で、彼は自分のチームがモデルに基づいてAIの設計にどのように進んだかを説明しますDeepseek R1-Zeroゲームの適応でそれを設定することによって数字と文字。 6710億パラメーターを備えたプレミアムディープシェクモデルとは異なり、最初は最初は所有していました50000万。彼女が最初に誤った答えを生み出した場合、研究者は徐々に得る能力を高めました良い結果から30億パラメーター、AIは、より少ないステップで、特に自分自身を修正することにより、正しい答えを見つけることができます。
さらに印象的なのは、パンチームがこれを達成したと主張していることです約30ドルの費用。現在、Openai APIは100万ドルあたり15ドルの入り口トークン、100万ドルのDeepseek-R1入り口の27倍以上の価格の価格が27倍以上です、と報告してくださいトムのハードウェア。
さらに進む
LLMとは何ですか? ChatGpt、Geminiなどはどのように機能しますか?
ただし、これらのコストは、研究に関連する技術的なコストのみを考慮し、人間および構造の研究コストを脇に置いているため、資格を取得していないままです。この偉業を再現したいと思っている最も好奇心が強いために、Jiayi Pan詳細彼の完全な方法論アクセス可能にしましたギルブ。