かずきち。の日記

サーバサイドエンジニアのつぶやき

【コードあり】ChatGPTにLamaIndexを入れて人工知能に事前学習を施していく

ChatGPTが流行っている

ChatGPTブームがしばらく続きそうですが、今回はPython上でLama index(gpt-index)を構築していきます。
gpt-ndexとはChatGPTに事前情報を教え込んだ上で、問い合わせを行う手法です。
今回はChatGPTのindexをPythonで構築していきます。

この記事で解説していること

GoogleColabへのchatgptのインストールから→lama indexのインストール→事前学習したChatGPTを使うとこまでを解説します。
基本的にコードは全て載せますので、コードが書けない人で見様見真似でやればできるかと思います。

まずはChatGPTに学習データをおいておきます。

今回はGoogleの企業分析をChatGPTのLamaIndexを使って行っていきます。

#まずは今回の学習対象おGoogleに関するデータをおきます

dataというフォルダの中にGoogleの会社情報が入った「Ggoogle.txt」を起きます。

# パッケージのインストール
!pip install llama-index

まずはgpt-indexを入れます。
これでChatGPTにGoogleに事前情報を入れた状態でスタートします。

# 質問応答
print(index.query("Googleが大事にしていることはなんですか?"))
#回答
Googleは、世界中のユーザーに最高のサービスを提供することを大事にしています。Googleは、技術革新を繰り返し、機能性の高いサービスを提供することを目標としています。Googleは、ユーザーが探しているものを正確に把握していなくても、ウェブで答えを探すことを目標としています。Googleは、新しいスタンダードとなるサービスを作り出すことを目標としています。Googleは、創造性のある優秀な成果を上げるために適切な企業(略)

となります。
ChatGPTにLamaIndexを貼るということは「非公開情報」でChatGPTを走らせることになります。
なので、社外秘情報などを分析したい方はlama-indexを貼る必要があります。

プロンプトエンジニアはChatGPTを使いこなす存在

ブラウザ版ChatGPTはOpenAIが学習させたデータで回答してきますが、自分が持っているデータでチューニングできるのは大きなメリットです。
今後はChatGPTのパラメータについて研究していきたいなと思います。

zenn.dev
引用:
https://zenn.dev/to3izo/books/9328f52bd3cfd3/viewer/3595ec