word2vecでteratailの検索システムっぽいものを作る

概要

分散表現を用いた検索システムを作る。

  1. teratailから質問をスクレイピングする。
  2. スクレイピングした文章をもとにword2vecを学習する。
  3. word2vecによって得られた分散表現をもとにcosine similarityを計算して、クエリと質問文の類似度を得る。
  4. 類似度をもとにソートする。

ソース

teratail_w2v_question.ipynb

関連書籍

[Read More]

chromebookでre:view用にtexをインストールするときに発生したエラーの対処法

re:view用に日本語用のtex liveをインストール

re:viewの依存関係としてtexがあるので以下のコマンドでtexをインストールする。

sudo apt install texlive-lang-cjk xdvik-ja evince

ここでrakeコマンドを実行してpdfを作成しようとするが、 エラーが発生した。

[Read More]

chromebookのセットアップ

手順

  1. OSの更新
  2. bitwardenの導入
  3. visual code studioの導入
    1. Intel, amdなら amd64版を選択する
    2. CPUによる
  4. Linuxの導入
    1. 設定からコマンドラインの導入ができる。
  5. Linuxの環境構築
sudo apt update
sudo apt upgrade
sudo apt install aptitude
sudo aptitude safe-upgrade
  1. GitHubのSSHの設定
  2. hugoの設定
sudo aptitude install hugo
git clone my_repository

git submodule foreach git stash
git submodule foreach git checkout master
git submodule foreach git pull origin master
  1. linuxアプリの日本語入力設定
sudo aptitude install fcitx-mozc -y
8. fxitxの実行
fcitx-configtool

下のーボタンでデフォルトのキーボード設定を削除する。

[Read More]

アテンションを用いた画像処理モデルの作成

アテンションを用いた画像処理モデルの作成のまとめ

画像認識にアテンションという機構を付与して、判断の根拠を可視化しました。

前振り

画像認識についてはもう深層学習が人間を超えてから(2015)しばらく経っています。

[Read More]

AI(深層学習) を用いて観賞魚の品種識別

AI を用いて観賞魚の品種識別のまとめ

  1. AI はもはや普通の人間を超える性能を発揮している

  2. 深層学習系の手法がメジャー

  3. デバイスは2 万円〜から利用が可能

前振り

仕事がらAIについて調べております。調べると言ってもプレスリリースを漁るといったものではなく、主に公開されている論文やソースコードを読みこなして自力でAIを構築できるように取り組んでいます。

[Read More]

技術書典7に参加するに当たって技術書とプログラムを作成したメモ 経緯と売り上げ、あと感想

経緯

学位を取るための論文執筆が死ぬほど辛かった私は執筆の経験が浅いから苦しんだのだと仮説を置いた。

この仮説を検証するために論文よりレベルを落として薄い本を書くことを思い立った。

[Read More]

MLops 実験開発環境の整備の必要性

MLops

レベル1だけでもやっとけばええんちゃうか

やること

  • データの前処理と保存
  • 特徴量の抽出と保存
  • 分類器の学習と保存
  • それぞれのパラメータの保存

利点

実験する部分や追加したい機能の切り分けがしやすくなる。

[Read More]

pythonに引数をとらせるArgparseの例

サンプルプログラム

以下公式サイトより引用

import argparse

parser.add_argument("square", type=int,
                    help="display a square of a given number")
parser.add_argument("-v", "--verbose", action="store_true",
                    help="increase output verbosity")
args = parser.parse_args()
answer = args.square**2

解説

parser.add_argument("square", type=int,
                help="display a square of a given number")

引数の名前がsquare

型を指定できる。デフォルトはstr。

前に-がつかない名前は位置引数。

[Read More]