Home About
パンの写真 120枚 を使って Deeplab V3 plus (Semantic Segmentation)

my-bread-120-demo

自分で用意したパンの写真 120枚 を使って、この例に従って Multiclass semantic segmentation using DeepLabV3+ モデルをつくりました。

このページでそのモデルを使って画像からパンのピクセルを推測するデモ を実行できます。Chrome または Firefox で作動確認しています。 いわゆる SPA アプリなのでそのページ内で処理が完結しています。推測に使う画像がサーバやインターネットにアップロードされることはありません。興味ある方はお試しください。

» Read More
Semantic Segmentation の結果確認画像の合成 / 該当ピクセルを重ねて表示

自分で用意したパンの写真 120枚 を使って、Keras の Deeplab V3 plus を使ってファインチューニングしたモデルをつくった。 そのモデルを使って新たに撮った写真でパンの写っているピクセルを推測した結果。

semantic segmentation my-bread-120

※赤いピクセルで塗った部分がパンとして推測されたピクセル。

今回は、この元画像と結果を合成する方法について書く。

» Read More
Scheme で 関数を定義するときに使う lambda の省略

前回のエントリー GIMP Script-Fu を使って 所定のディレクトリ内にある xcf ファイルを png にバッチ変換するで、 関数を定義する部分。 lambda を使う書き方と、使わない書き方があり、なんなんだろうと思って調べた。 どうやら lambda を使わない記述方法は単なる省略表記であるらしい。

» Read More
GIMP Script-Fu を使って 所定のディレクトリ内にある xcf ファイルを png にバッチ変換する

GIMPには、 Script-Fu というスクリプトが備わっていてバッチ処理などができます。

InDesign での ExtendScript / UXP Scripting に相当するものです。

今回は複数の xcf ファイルを一括で png ファイルに変換(保存)するスクリプトを書きます。

» Read More
Tensorflow 2.x + CUDA + cuDNN + Ubuntu 22.04 server セットアップの備忘録

Ubuntu 22.04 で CUDA 11 + cuDNN 8 環境をつくった。

すべて apt でインストールが完了するわけではなく、cuDNN については、引き続き nvidia サイトから該当ファイルを入手する必要あり。 sudo apt install cuda-toolkit-11-cudnn-8 だけで、インストールが完了する時代が来ればいいのに。

» Read More
Chromebook Linux に emacs をセットアップ outline mode , mozc, migemo を設定する

Acer Chromebook 311 (CB311-11H)

日本語を書くのはもっぱら ターミナル上で emacs を使って書いている。 しかし、長い文章では見通しが悪い。 pomera 搭載のエディタのようにアウトライン機能が使えればいいのにと考え始めた。 調べてみると、WZ Editor が pomera と同じアウトライン機能を持っていることがわかった。 (順番からいけばおそらく WZ Editorが先で、pomeraが後からそれをサポートしたのだと思う。) では WZ Editor 使うか、というと普段ターミナル上で動く emacs / vim でテキスト編集しているので、 テキストエディタはターミナル上で動いてほしい。 そもそも使いたいのは、アウトライン機能だけ。 ならば、emacs にアウトライン機能を追加する方法を調べればいいのではないか。 ・・・ということで色々調べたら、解決できたので、今回はその結果を備忘録として書き残します。

» Read More
Stable Diffusion で足りない背景を描き足す

正方形の画像が必要だが、縦長の写真 ( 270 x 360px )しかなかった場合。

bread

これを左右を描き足して正方形の画像にしたい。

» Read More
ラスター画像をトレースして SVG にする試み

example 1

Vector Graphics を扱うアプリを書いているのだが、 普通の raster 画像のインポートをサポートしたい。

関連しそうな技術を調べてみると テキストから画像を生成するAIで、 ベクターデータを生成するものがあった。

これはすごいが、今のところはラスター画像をSVGに変換できればそれでよい。 さらに調べてみたところ potrace というものが存在していた。

このように白黒の raster 画像をベクターデータに変換するツールです。

» Read More
InDesign 18.4 の変更点と UXP InDesign Script を deno_emit でバンドルする

Hello, World!

InDesign 18.4 から require() API を使って InDesign DOM を取得するように変わったそうです。 詳しくはこのページ https://developer.adobe.com/indesign/uxp/recipes/dom-versioning/ をご覧ください。

18.4 以前は、app などが予めグロバール変数として存在していたが、これを以下のように取得する。

» Read More
Mobile Food Segmenter を試す

前回 DeepLab v3 Semantic Segmentation を TensorFlow.js で試す(その2)TensorFlow Lite モデル編 のコードを流用して、別のモデル Mobile food segmentation model の TFLiteを試す。

推測結果

Mobile food segmentation

» Read More
DeepLab v3 Semantic Segmentation を TensorFlow.js で試す(その2)TensorFlow Lite モデル編

前回は TensorFlow.js 用にコードが用意されていたので、そこそこ簡単に扱うことができた。 今度は TensorFlow Hub にある この TensorFlow Lite モデル版の DeepLab V3 を TensorFlow.js から使ってみる。

» Read More
DeepLab v3 Semantic Segmentation を TensorFlow.js で試す(その1)

semantic dog image segmentation

Semantic Segmentation in the Browser: DeepLab v3 Model を起点にあれこれ調べた結果を書き残します。

トレーニング済みのモデルとして提供されている次の3つ pascal, cityscapes, ade20k が使えますが、 pascal を試します。

» Read More