RAGを実装する際によく使われるツール
では、RAGの実装に使用するツールについてお話しします。ご質問などあれば、チャット欄にいただければ、きりのいいタイミングでお答えします。
RAGを実装するツールは、ざっくり分けると以下のようになります。

クラウドベース
エンタープライズ企業などでは、既に社内システムがクラウドで構築され、データがGoogle DriveやMicrosoft SharePointに溜まっていることが多いです。そのため、社内でRAGシステムを使いたい場合、まず選択肢となるのがクラウドベースのRAGシステムです。
MicrosoftやAWSなどのクラウドベンダーは、RAGを簡単に作れるパッケージやシステムを既に提供しています。
Microsoft Azure: Azure AI Search というマネージドな検索サービスがあります。マネージドサービスとは、私たちがエンベディングモデルを選んだり、類似度計算の関数を実装したりする手間なく、検索対象のドキュメントをデータベースに入れておけば、質問に近いドキュメントを自動的にいい感じで検索してくれるサービスです。
Amazon Web Services (AWS): Amazon Kendra や Amazon Bedrock の Knowledge Bases といったサービスがあります。これらも同様に、AWS上のデータベースと連携して簡単にRAGを構築できます。
Google Cloud: Vertex AI Search (旧: Vertex AI の RAG Engine) といった同様のサービスがあります。


オンプレミス / ライブラリ
クラウドサービスで十分な精度が得られない場合や、特定の要件がある場合にこちらを選択します。
利用シーン:クラウドに接続できない、完全にクローズドな社内システムで構築したい場合(オンプレミス)。
クラウドのマネージドサービスよりも、さらに細かいチューニングや精度向上を行いたい場合。
メリット・デメリット: クラウドサービスは大規模スケールに対応しやすく、手軽に構築できる反面、カスタマイズ性が低いというデメリットがあります。 特定のドメイン(例: 社内の特殊な設計書マニュアル)で高い精度が求められる場合、自社で作り込んだ方が精度が上がることが多いです。
代表的なライブラリ: LangChain は、オンプレミス環境でRAGを構築する際にほぼ一強といえるほど、多くのプロジェクトで使われている非常に有用なライブラリです。 コミュニティが活発で、最新の精度向上手法が利用でき、クラウドサービスでは難しい柔軟なチューニングが可能です。 LangSmith のような評価ツールも付属しており、オンプレミスで開発するならまず触ってみるべきツールです。

SaaS / iPaaS
エンジニアリングの知識があまりない方でも、手軽にRAGを試したい場合に利用されます。
代表的なツール: Dify、Meebo などがあります。特にDifyは有名で、ノーコードでRAGを構築できるアプリケーションです。 画面上でワークフローをポチポチ組んでいくだけで、PDFなどの書類を読み込ませて、それに関する質問に答えられるチャットボットがすぐに完成します。
メリット・デメリット: 手軽に使える一方で、細かいチューニングが難しい点が欠点です。 また、既に社内のデータがクラウド上にある場合は、それと連携しやすいクラウドベースのツールを使った方が、結果的に社内全体で使いやすいプロジェクトになることが多いです。
使い分けのフロー
試行フェーズ: まず短期間でRAGを試したい場合は、DifyなどのSaaSが適しています。
本格導入フェーズ: 大規模に利用したり、既存のクラウドデータと連携したりする場合は、AWSのKendraやAzureのAI Searchなどのクラウドサービスを検討します。
高度な精度向上フェーズ: それでも精度が足りない場合は、オンプレミスでLangChainなどのライブラリを使い、一から独自にカスタマイズしていく、という流れが一般的です。

リツアンと面談していただくと、
すべての書き起こしと録画を見ることができます。