Axcxeptが切り拓く次世代言語モデルの可能性
株式会社Axcxept(北海道札幌市)は、最先端のAI技術を駆使して、新たな言語モデル「Deepseek R1」を発表しました。このモデルは、従来の枠を超えた短期間でのトレーニングを可能にし、少ないデータで高い性能を発揮することが注目されています。特に、14Bモデルのベースとなる「Phi-4」を上回る性能を、日本語と英語の両方で実現しています。
短期間・少量データで実現した性能向上
今回のトレーニングでは、わずか2日間で14K規模のデータを使用して実施されました。その成果は、「Japanese MT Bench」と「MT Bench」といった主要なベンチマークでのスコアに顕著に表れています。特に、グローバルな評価基準である「simple-eval」においても、gpt-4o-miniを上回る結果が得られました。
試行段階での微少な向上ではありますが、今後のトレーニングに向けた成功率の向上が期待されています。これにより、効率的な開発プロセスの確立が可能になり、さらなる進化が見込まれます。
日本語と英語の両立を目指すアプローチ
Axcxeptは、日本市場向けに特化したモデルの開発を行っており、今後は国際的な競争力を持つモデルの実現を目指しています。英語能力を強化するデータセットの加工やパラメータ設定を行いながら、日本語性能を妥協なく維持する方針を取ることで、両言語において高いパフォーマンスを実現しました。このアプローチにより、将来的にはバイリンガル対応の高性能モデルが期待されます。
Deepseek R1の顕在化
新しいモデル「Deepseek R1」は、従来の学習期間の概念を覆す性能を示しました。短期間かつ少ないリソースでも、高い性能を引き出せる点が評価されています。Axcxeptは、この実証結果を元に、公共機関や製造業などのニーズに応える独自のトレーニング手法を確立しました。その結果、日本語では0.7ポイント、英語では0.2ポイントの性能向上が確認されています。
ローカルLLMへの取り組み
特にセキュリティが重視される環境では、外部クラウドに機密データを持ち込むことは困難です。Axcxeptは、オンプレ環境や社内サーバーでのローカルLLMへのニーズに応えるため、独自の技術を磨いています。これにより、高いセキュリティを確保しつつ、実用性を向上させるモデルの開発が進められています。
今後の展望
今後、Axcxeptは、高セキュリティ企業向けのドメイン特化モデルの開発を一層進めていく方針です。これまでに得た知見を生かし、公共機関や製造業、デザイン業界と連携しながら、LLM開発の専門性を高め、AIソリューションの提供にも力を入れていきます。
この成果に感謝を通わせつつ、短期でのパイロットトレーニングがもたらす意味を深く理解し、さらに多様な分野での「日本語・英語に強いローカルLLM」の普及を目指して邁進していきます。今後も多くの企業や機関との協力を通じて、実用性の高い技術の発展を続ける所存です。
Axcxeptは、数々のサービス開発や受託開発の経験が豊富です。今後も新たな挑戦とともに、より多くのクライアントのニーズに応えていく企業であり続けます。私たちは、オープンな開発環境を支えるために、業務提携や資本提携など、様々な協力の提案を心からお待ちしています。