キーワード検索では見つからない関連文書を発見する方法

セマンティック検索で解決する文書検索の限界

問題:なぜキーワード検索では欲しい文書が見つからないのか

社内の膨大な文書データベースから「機械学習の性能向上に関する文書」を探しているとします。キーワード検索で「機械学習」「性能向上」と入力しても、本当に必要な文書が見つからない経験はありませんか?

[Read More]

少ないデータで高精度な文書分類を実現する戦略

データ不足という現実的制約下でのFew-shot学習とTransfer Learning活用法

問題:なぜ実際のプロジェクトでは十分なデータが集まらないのか

「ニュース記事を『政治・経済・スポーツ・エンタメ』に自動分類したい。でも各カテゴリ30件ずつしかラベル付きデータがない…」

機械学習の教科書では数万件のデータセットが当たり前ですが、実際のビジネス現場では全く異なります。

[Read More]

日本語自然言語処理で直面する現実的な課題と解決策

文字化け、分かち書き、敬語処理など、日本語特有の問題を技術的に克服する方法

問題:なぜ日本語のテキスト処理は難しいのか

「英語のNLPライブラリを日本語に適用したら、全然うまくいかない…」

日本語の自然言語処理は、英語中心に設計されたツールでは対応できない独特な課題が多数存在します。

[Read More]

機械学習実験の混乱を解決する:再現できない結果との戦い

パラメータ管理とMLflowによる実験追跡の実践的解決法

問題:なぜ機械学習の実験結果が再現できないのか

「先週良い結果が出たモデルがあったんだけど、どのパラメータを使ったか覚えてる?」

機械学習プロジェクトでこんな会話を聞いたことはありませんか?多くのチームが直面する典型的な問題です。

[Read More]

ViteでReact の環境構築

環境構築

npx create-react-app my-app
cd my-app
npm start

上の方法は古いらしい

下記の方法でviteを利用してReact+TypeScriptの環境構築を行う

npm create vite@latest

ctranslate2でpytorchがimportできないエラーが出たので回避方法メモ

公式のインストール方法

pip install ctranslate2

https://github.com/OpenNMT/CTranslate2

Macでは上手く動作しない

segmentatioin faultになった。

しかしlinuxでは動作するとの情報を得た。 なのでまずはMacの中でDocker環境を構築して問題を回避できないか確認しようとした。

[Read More]

pysenをインストールするとmypy周りで他のライブラリがエラーになる

pysenが入っていたらlangChainと依存関係がバッティングする?

環境

Mac OS poetry python == 3.9

LangChainのインストールに失敗する

poetry add langchain

が失敗する

CLANG 

C言語関係のエラーかと思われた。

なんだっけ

xcode-toolsのインストールとアップデート

pip install --update pip
pip install --upgrade setuptools

mypyのバージョンによるエラーらしい

[Read More]

Dockerfileでasdfを実行できないことについて

Dockerfile でsource ~/.bashrc ができない

  • Dockerfile ではデフォルトのシェルはsh
  • shではsourceは実行できない

対策1:デフォルトのシェルをbashに変更

  • デフォルトのシェルをbashに変更した SHELL [/bin/bash,-lc]

Dockerfile でasdf が実行できない

  • RUN asdf に失敗する
    • asdfが見つからない
  • しかしDocker内部ではasdfを実行できる

原因

  • DockerfileではRUNごとに異なるシェルが実行される

効果がなかったこと

  1. 同一のRUNでsource ~/.bashrcasdf install を実行
    1. asdfが実行できない
  2. bash/execでbashを再起動
    1. asdfが実行できない

最終的な対処

  • apt install python3

感想

  • Dockerとasdfと何重にも仮想環境を重ねることにどれだけの意味があるだろうか?

参考資料

poetry環境でpytorchをインストールしても失敗したのでその対処法

poetry add torch でパスが通らない

  • Dcokerfile+poetry で環境構築をしていた
  • poetry add torchでpytorchをインストールした
  • import torchでエラー
  • cuda周りのパスが通っていないらしい

対処法

  • poetry run python -m pip install torch
  • poetry.tomlに記述することもできるらしい

参考資料