ENTRY

◀︎ AI NEWS TOPへ

生成AIの新潮流、オンプレで作る自社特化LLM

2025.09.26
生成AIの新潮流、オンプレで作る自社特化LLM

クラウド経由で使うChatGPTやGeminiといった大規模言語モデル(LLM)に加えて、最近注目されているのが「オンプレ型LLM」です。オンプレ型とは、自社サーバーやローカルPC上で動かす生成AIのこと。

クラウド利用と比べてどのような特徴があるのか、また実際の事例について紹介します。


クラウドとオンプレの違い

クラウド型LLM

  • 仕組み:ユーザーが入力したプロンプトは外部のサーバーに送られ、処理結果が返ってくる。
  • 特徴:最新かつ高性能なモデルを利用できる。使用量に応じた従量課金制。
  • 注意点:入力データ自体は外部に送信されるため、機密情報の扱いには制約がある。

オンプレ型LLM

  • 仕組み:モデルを自社内に設置し、入力から処理までを自前環境で完結。
  • メリット
    • データが社外に出ないためセキュリティが高い
    • 利用量が多い場合、ランニングコストを抑えやすい
    • 自社ネットワーク内で完結するため応答速度が安定
  • デメリット
    • 初期導入コスト(サーバーやGPU)が高い
    • 利用できるモデルのサイズが比較的小規模で、処理できる範囲が限定的

実際の事例

1. 金融業でのレポート作成

  • 課題:機密情報を外部に出せない。レポート作成に時間がかかる。
  • 解決:オンプレでLLMを導入。100点の精度は求めず、「叩き台を自動生成してくれるだけで十分」という要件を満たす。
  • ポイント:セキュリティ重視+中程度の精度でOKならオンプレが適する。

2. IT企業の問い合わせ対応

  • 課題:自社サービスの問い合わせに使いたいが、データを社外に出せない。
  • 解決:検索拡張(RAG)の仕組みを活用。ただし回答文の自動生成(G部分)は省略し、関連情報をリストで提示する方式に。
  • ポイント:ハードウェア負荷を軽くしつつ、必要な情報を安全に検索可能にする。

3. 施設内でのチャットシステム

  • 課題:施設ごとにネットワークが分かれており、外部クラウド利用不可。
  • 解決:オンプレに特化した翻訳モデルや検索モデルを組み合わせ、顧客対応チャットを構築。
  • ポイント:用途に合ったモデル選定が精度を大きく左右する。

オンプレLLMを成功させるポイント

  1. ユースケースを明確にする
    • どんな入力を受け、どんな出力が得られれば成功なのかを最初に定義する。
    • 期待値を整理することで、モデルの軽量化や精度の調整が可能になる。
  2. ハードウェア要件の把握
    • GPU・メモリなどの環境に合わせてモデルを最適化(量子化など)する必要がある。
  3. 業務特化カスタマイズ
    • 汎用モデルをそのまま使うより、特定業務向けに調整することで精度が向上する。

まとめ

オンプレ型LLMは「高精度の汎用モデルが必要な場面」には不向きですが、

  • データを外に出せない
  • 利用コストを抑えたい
  • 処理スピードを安定させたい

といったケースでは非常に有効です。

生成AIを自社に導入する際は、クラウドとオンプレのメリット・デメリットを見極め、自分たちのユースケースに合う選択肢を検討することが重要です。

AI NEWS メルマガ登録

AI最新ニュースをメールでキャッチ

本ブログの新着以外の配信は一切いたしません

メールアドレスを正しく入力してください
AI NEWS メルマガ登録

AI最新ニュースをメールでキャッチ

本ブログの新着以外の配信は一切いたしません

メールアドレスを正しく入力してください

Tags

タグ一覧へ ▶︎

Kamone
著者 Kamone

30歳で学者志望からITエンジニアに転身。通信・金融業界におけるインフラ領域を中心に、オンプレミスからクラウドまで幅広く経験。AWS学習コミュニティでは公認メンターとして教材制作や講師を務める。現在はリツアンSTCにて事業推進に携わり、AI活用とエンジニア支援の高度化に取り組んでいる。

Kamone
著者 Kamone

株式会社リツアンSTC社員。

1984年 東京都中野区生まれ。

大学中退後、工場や警備員などを経て、何もスキルが身についていないことに危機感を覚える。
2014年 何か手に職をつけなければと思い、電子専門学校からエンジニアになった弟を見て「コイツにできるなら俺もできる」と安易な考えで未経験からIT業界に飛び込む。
そこは「まともな案件に入れなければ営業としてこき使われるか中国に送られるらしい」と恐ろしい噂が飛び交う会社だった。
「とんでもないところに来てしまった…」と戦慄するも、運よく大手新聞社系のインフラチームから声がかかり、エンジニアとしてのスタートを切る。

その後、SESを転々としながら通信・金融業界のオンプレ・クラウド案件を中心にインフラエンジニアとして経験を積む。

2021年 AWS学習サービス「Cloudtech」に参加し、公認メンターとして書籍出版プロジェクトや教材制作・講師などのコミュニティ・サービス運営に関わる。

2023年 ゆとりーマンのYoutube動画で新興SESの闇とリツアンの存在を知り、転職。(当時所属していたSES企業が動画で紹介されていた特徴に当てはまっていて愕然)
その後、CloudTechとリツアンの橋渡し役を担い、合同プロジェクト「テラコヤテック」の運営に関わる。
2025年 リツアンの「エンジニアに一円でも高い報酬を」「会社は社員に使われるためにある」「出入り自由」といったスタンスに共鳴。エンジニアから転向し、リツアンの事業推進に参画。
現在に至る。

他人の文体を真似たり、他人が書いた文章を手直しするのが得意、という若干嫌な気持ちにさせる特技を持つ。
AI活用を鋭意研究中。
(リツアンいいとこ一度はおいで。)

AI NEWS メルマガ登録

AI最新ニュースをメールでキャッチ

本ブログの新着以外の配信は一切いたしません

メールアドレスを正しく入力してください
社員
1000名
突破!

インサイドセールス・カスタマーサクセス人材募集!  詳しく