EasyOCRで日本語画像をテキスト化—セットアップから実運用まで

EasyOCRを使ってJPEG画像から日本語テキストを抽出するスクリプトを作りました。フォルダにまとめて置いた画像を一括処理し、テキストファイルに書き出します。日本語OCRの精度と前処理のコツも解説します。 [Read More]

アテンションを用いた画像処理モデルの作成

アテンションを用いた画像処理モデルの作成のまとめ

画像認識にアテンションという機構を付与して、判断の根拠を可視化しました。

前振り

画像認識についてはもう深層学習が人間を超えてから(2015)しばらく経っています。

[Read More]

AI(深層学習) を用いて観賞魚の品種識別

AI を用いて観賞魚の品種識別のまとめ

  1. AI はもはや普通の人間を超える性能を発揮している

  2. 深層学習系の手法がメジャー

  3. デバイスは2 万円〜から利用が可能

前振り

仕事がらAIについて調べております。調べると言ってもプレスリリースを漁るといったものではなく、主に公開されている論文やソースコードを読みこなして自力でAIを構築できるように取り組んでいます。

[Read More]

ポートフォリオ

実績

🚀 最新プロジェクト(2023-2025)

フルスタックWebアプリケーション

  • X Favorites Gallery - X(Twitter)いいねギャラリー + AIレコメンド

    • X Favorites Gallery LP / アプリを開く
    • 技術スタック: Next.js + React + PostgreSQL + pgvector, Chrome拡張, Docker
    • 成果: いいねしたコンテンツをAI(DINOv2)が自動レコメンド、NSFW自動フィルタリング対応
  • tsuzukan(続刊) - 漫画・小説の続刊管理アプリ

    [Read More]

deeplubcut 動画を対象にした点の位置の予測

点のアノテーションの予測

  • 蝿の腹、マウスの脊椎、指の関節など応用範囲が広い。
  • 動画でできてる。デモがある。
  • 動画の特徴量抽出はResNet, mobileNetなど
    • Mobile Netでできるならエッジコンピューティングが視野に入る
    • ラズパイ+GPUみたいな構成

参考リンク

https://github.com/DeepLabCut/DeepLabCut

[Read More]