my notebook

Large Language Model をローカルで動かす時代が到来するらしい。

Reddit には LocalLLaMA というサブレディットがあり、かなり盛り上がっている。そこではシリコンマックを使っているひとが結構いる。 Meta の商用利用も可能な Llama 2 がオープンソースで提供された結果、その派生プロジェクトがいろいろ存在している。そのなかには、低スペックのシリコンマックでも LLM を実行できるものがある。 Pytorch もMetal 対応していて、おそらくは、Pytorch 依存の LLM モデルについては、Linux + CUDA と同じ手順で動かせるのではないかと思う。

Pytorch を使う方法を手元の M1 Macbook Air 8GB で試したが残念ながら作動しなかった。たぶんメモリが足りないのだと思う。十分メモリがあれば動くのではないかと思うが定かではない。

それでも Llama.cppと軽量化されたモデルを使うことで M1 Macbook Air 8GB でも作動させることができた。

このエントリーでは、Linux + CUDA で、 Llama 2 をベースに商用利用可能な日本語LLM ELYZA を試します。

» Read More

前回のエントリーで Hugging Face の Diffusers ライブラリを使用してテキストから画像を生成しました。今回はその続きで、それを Bottle を使ってWebサーバにしました。

venv 環境は前回作成した diffuers 環境をそのまま引き継いでいる点に注意してください。（OS は M1 macOS ではなく Linux(Ubuntu) を使います。）

a cup of coffee (1)

» Read More