GNC letter
GNCレター
中国のAIスタートアップDeepSeek社は、2025年1月20日に「DeepSeek-R1」という大規模言語モデルを公開した。
DeepSeek-R1の特筆すべき点は、強化学習を駆使し、従来の教師あり学習を行う必要なく、自律的に思考連鎖を学習する点だ。このアプローチにより、モデルは複雑な問題を解決するための思考の連鎖を探索し、自己検証、内省、長い思考の連鎖の生成などの能力を実証しているという。
また、DeepSeek-R1は、MITライセンスの下でオープンソースとして提供されている点だ。商用利用などが自由にできるため、従来の大規模言語モデルサービスを展開する企業のビジネスモデルを根本から揺るがす可能性がある。 従来の大規模言語モデルの多くはオープンソースでは公開されず、高額なAPI利用料金が設定されていた。一方で、DeepSeek-R1は高性能でありながら、API利用料金が競合と比べて非常に低コストで提供され、従来よりも少ない計算資源でも動作する複数のモデルも提供されている。これにより、計算資源の制約から高性能なAIモデルの開発や利用が難しかった研究者や開発者にも新たなチャンスが生まれる期待がある。
DeepSeek-R1はモデルの開発費用が約560万ドルと説明しており、米NVIDIAが販売する高性能チップを利用せずとも、安価で強力な大規模言語モデルを創り出す事が可能となっており、これまで最先端のプロセスノードに高性能のGPUとHBMを搭載したダイをデータセンタに大規模に搭載する必要性が問われる事態となっている。また、NVIDIAの主要顧客であるOpenAIなどの米国の大規模言語モデルサービスを展開する企業の顧客も奪われる懸念から、NVIDIAの1月27日の株価は16%以上下落、TSMCの株価も13%以上下落、ASMLは7%以上下落した。
28日の東証でも、アドバンテストが9%以上下落、東京エレクトロンが5%以上下落、ディスコが6%以上下落と、半導体製造装置メーカの株価は軒並み値を下げる展開となっている。
半導体/MEMS/ディスプレイのWEBEXHIBITION(WEB展示会)による製品・サービスのマッチングサービス SEMI-NET(セミネット)