1/34ページ
ダウンロード(3.6Mb)
AI モデルを作成しよう
本資料では、 『 AI に興味があるけど難しそう 』 、 『 AI モデルの作成方法が分からない 』 などの不安を抱えている方向けに、画像認識 AI を題材として環境整備~教師データ準備~トレーニング~評価までの一連の流れを説明します。
このカタログについて
ドキュメント名 | はじめての AI 開発 |
---|---|
ドキュメント種別 | ホワイトペーパー |
ファイルサイズ | 3.6Mb |
取り扱い企業 | 株式会社リョーサン (この企業の取り扱いカタログ一覧) |
この企業の関連カタログ

このカタログの内容
Page1
はじめてのAI開発
AIモデルを作成しよう
CK000494 ©2024 RYOSAN CO.,LTD.
Page2
はじめに
• 本資料では、『AIに興味があるけど難しそう』、『AIモデルの作成方法が分からない』などの不安を抱えている方向
けに、画像認識AIを題材として環境整備~教師データ準備~トレーニング~評価までの一連の流れを説明しま
す。
• pythonに関しては説明を割愛しています。pythonに関して知りたい方は公式サイトをご参照ください。
• AIに関してより詳しく知りたい、資料の内容に関して不明点がある等の相談がございましたら、お気軽にご連絡く
ださい。
お問い合わせはこちらからお願いします。
https://techlabo.ryosan.co.jp/contact/
CK000494 ©2024 RYOSAN CO.,LTD. 2
Page3
1. AIの種類と活用~画像認識AIとは
2. 使用環境と作業手順
3. 環境準備
4. データ準備
5. AIモデルトレーニングと評価
6. 応用例
7. まとめ
CK000494 ©2024 RYOSAN CO.,LTD. 3
Page4
1. AIの種類と活用~画像認識AIとは
CK000494 ©2024 RYOSAN CO.,LTD. 4
Page5
1-1. AIの種類と活用
• AIの種類と活用
一口にAI(Artificial Intelligence)と言っても、いろんなAIがあります。
最近よく聞くのはChatGPTなどの生成AIだと思いますが、左図のように何をやら
せるかによってAIの種類が変わります。
その他にもクラウドで処理するか、現地の端末内で処理するかでもAIのシステ
ムが分けられます。処理性能で言えばクラウドAIが優れていますがネットワークの
ない環境では使えません。またネットワーク上の遅延なども懸念材料となります。
端末内で処理するエッジAIでは処理性能は制限されますが、現場で完結する
のでネットワークやサーバーなどの環境の依存せず安定した処理結果が得られま
す。
• 今回紹介するAIとは
今回は識別系AIの画像認識AIを題材に、PC上で動作するエッジAIの立ち上げ、
学習、評価手順に関して説明します。一見すると難しいと思われるAI開発ですが、皆様
の参考になれば幸いです。
その他のAIに関して詳しく知りたい方はリョーサンテクラボの記事もご参照ください ⇒
CK000494 ©2024 RYOSAN CO.,LTD. 5
Page6
1-2. 画像認識AIとは
入力された画像が、予め設定された種類のいずれに該当するかを判別するAIです
コンピュータは画像を見ただけでは、何かわかりません。画像認識でキーとなるのがAIモデルです。AIモデルは、コンピュータが何の画像かを理
解できるように結果(出力)を導くための仕組みです。
AIモデル
? ちょき
AIモデルを自作する事で様々な画像認識を行うシステムを作成する事ができます。
今回は、「ぐー、ちょき、ぱー」 3種類だけ画像認識するAIモデル(YOLOモデル)の自作手順(一部を除く)を説明します。
CK000494 ©2024 RYOSAN CO.,LTD. 6
Page7
1-3. AIロボットじゃんけん
画像認識AIと 「ぐー、ちょき、ぱー」 を認識するAIモデルによりAIロボットじゃんけんを創ることも可能です
• AIロボットじゃんけん - YouTube
CK000494 ©2024 RYOSAN CO.,LTD. 7
Page8
2. 使用環境と作業手順
CK000494 ©2024 RYOSAN CO.,LTD. 8
Page9
2-1. 使用環境と作業手順
今回はLinux環境+Darknet/YOLO、Windows環境+Microsoft VoTTを使用します
• ハードウェア
➢ Linux PC : Ubuntu 24.04.1 LTS (学習時間に影響するので、出来るだけ高性能なPCを準備しましょう)
➢ Windows PC : Windows 10以降 (今回は画像データ収集とアノテーションに使用します)
• ソフトウェア
➢ Darknet : オープンソースのニューラルネットワークフレームワーク
➢ Microsoft VoTT : 画像データにメタデータを付与するためのアノテーションツール
➢ python : インタプリンタ型プログラミング言語、PCを使用した写真撮影の自動化、データコンバートなどに使用
• 作業手順
Windows PC Linux PC
Python Mirrosoft VoTT Darknet Darknet
画像データ収集 アノテーション AI学習 AI推論
(写真撮影)
CK000494 ©2024 RYOSAN CO.,LTD. 9
Page10
2-2. DarknetとYOLO
Darknetはオープンソースのニューラルネットワークフレームワークで、特にコンピュータビジョンのタスクに使用されます
• 特徴
➢ 軽量かつ高速 : DarknetはC言語とCUDAで書かれており、非常に軽量で高速に動作します
➢ 柔軟性 : 異なるニューラルネットワークアーキテクチャを簡単に定義・トレーニングすることができます
➢ YOLOの基盤 : 特にYOLO(You Only Look Once)オブジェクト検出モデルの実装に使用されることで有名です
• Darknetを使用することで、効率的に画像認識やオブジェクト検出のモデルを構築・トレーニングすることができます。今回は、このフレームワー
クを使ってどのようにYOLOモデルを作成するかを説明します。
YOLO(You Only Look Once)は、リアルタイムのオブジェクト検出アルゴリズムです。(Darknetに含まれています)
• 特徴
➢ 高速性 : YOLOは画像全体を一度に処理するため、非常に高速です。これにより、リアルタイムでのオブジェクト検出が可能です
➢ 単一のニューラルネットワーク : YOLOは単一のニューラルネットワークを使用して画像を複数のグリッドに分割し、各グリッドセルでオブジェクトの存在を
予測します
➢ 高い精度 : YOLOはオブジェクトの位置とクラスを同時に予測するため、精度が高く、誤検出が少ないです
➢ 汎用性 : 様々なオブジェクト検出タスクに適用でき、カスタマイズも容易です
• YOLOは、物体検出の分野で広く使用されており、特に自動運転車、監視システム、ロボティクスなどのリアルタイムアプリケーションでその性能
が評価されています。
CK000494 ©2024 RYOSAN CO.,LTD. 10
Page11
2-3. Microsoft VoTT (Visual Object Tagging Tool)
Microsoftの提供するアノテーション(対象となるデータに対してタグなどのメタデータを付与する)ツールです
• 特徴
➢ GUI操作 : VoTTはGUI操作で、直感的に素早く簡単にタグ付けできます
➢ クロスプラットフォーム : VoTTはWindows, Mac, Linuxを問わずクロスプラとフォームで利用できます
➢ 豊富な出力フォーマット : CNTK, Pascal VOC, Tensorflow, VoTT JSON, CSVなどの多様な形式で出力できます
• MicrosoftのVoTT説明ページ
https://learn.microsoft.com/ja-jp/dotnet/machine-learning/how-to-guides/label-images-for-object-detection-using-vott
CK000494 ©2024 RYOSAN CO.,LTD. 11
Page12
3. 環境準備
CK000494 ©2024 RYOSAN CO.,LTD. 12
Page13
3-1. Ubuntu 24.04.1 LTS インストール
Ubuntuの公式日本語サイトより最新のLTS(Long-Term Support)を入手し、インストールします
Ubuntuを入手する | Ubuntu | Ubuntu
CK000494 ©2024 RYOSAN CO.,LTD. 13
Page14
3-2. Darknetインストール ※Linux PC作業
Terminalを使用してベース環境とDarknetをインストールします
• Terminal起動 • ツール類インストール
➢ 以下のコマンドをTerminalに入力
sudo apt update
sudo apt install git
sudo apt install make
右クリック sudo apt install build-essential
→ 端末で開く
• Darknetインストール
➢ 以下のコマンドをTerminalに入力
git clone
https://github.com/pjreddie/darknet
cd darknet
make
Terminal起動
参考:darknet公式
https://pjreddie.com/darknet/yolo/
CK000494 ©2024 RYOSAN CO.,LTD. 14
Page15
3-3. Darknetを動かしてみよう!
Darknetのインストールまで完了したら、Darknetの動作確認をしてみましょう
• 以下のコマンドをTerminalに入力
wget https://pjreddie.com/media/files/yolov3.weights
./darknet detect cfg/yolov3.cfg yolov3.weights data/dog.jpg
出典:https://pjreddie.com/darknet/yolo/
CK000494 ©2024 RYOSAN CO.,LTD. 15
Page16
3-3. Microsoft VoTTの入手
Githubよりwindows用の実行ファイルをダウンロードします
• ダウンロードした “vott-2.2.0-win32.exe” を実行すると、VoTTがインストールされて自動的に起動
https://github.com/Microsoft/VoTT/releases
CK000494 ©2024 RYOSAN CO.,LTD. 16
Page17
4. データ準備
CK000494 ©2024 RYOSAN CO.,LTD. 17
Page18
4-1. 画像データ準備
「カメラで撮影する」、「pythonでプログラムを作成する」等で画像データを集めます
※下記は、 pythonでプログラムを作成した場合(pythonでの自動取得方法は自分で調べてみてください) 今回は30枚程度
撮影してみましょう!
Microsoft Windows [Version 10.0.19045.2251]
(c) Microsoft Corporation. All rights reserved.
C:¥Users¥saitomhr>cd C:¥work¥create_aimodel
C:¥work¥create_aimodel>python capture_USB_CAM(ChatGPT).py
画像を保存しました: 2024_09_26_00000.jpg
画像を保存しました: 2024_09_26_00001.jpg
画像を保存しました: 2024_09_26_00002.jpg
画像を保存しました: 2024_09_26_00003.jpg
2024_09_26_00000.jpg 2024_09_26_00001.jpg 2024_09_26_00002.jpg
CK000494 ©2024 RYOSAN CO.,LTD. 18
Page19
4-3. VoTT 起動
撮影した画像にタグ付けして教師データにします
• VoTT起動
起動
デスクトップのアイコンダブルクリックで
VoTT起動
CK000494 ©2024 RYOSAN CO.,LTD. 19
Page20
4-2. VoTT 接続設定
VoTTの接続設定(画像保存フォルダなどの設定)を行います
• 接続設定 2. “⊞” をクリック ⇒ 右側の“接続設定”が表示される
3. “表示名” に任意の名称を設定
4. “プロバイダー” は “ローカルファイルシステム” を指定
1. “接続” を選択
5. “フォルダーパス” は画像が保存されているフォルダを指定
6. 設定が終わったら、“設定を保存” をクリック
CK000494 ©2024 RYOSAN CO.,LTD. 20