【ANNO-Navi】 効率的なAI開発のためのアノテーション代行サービスガイド » アノテーションサービスの領域と作業内容 » 画像データ処理・自然言語分類

画像データ処理・自然言語分類

アノテーションにおける分類とは

アノテーションはAI(人工知能)の学習に必要となる膨大な量の教師データを作ることですが、収集された音声、画像、自然言語、テキストなどの様々なデータはタグ付けされ、関連する情報(メタデータ)が付け加えられていきます。
必要なデータの種類や作業は構築するAIの用途によって異なり、AIが最終的な認識をするためには分類されたデータが必要となります。

画像・映像分類

画像や映像のアノテーションは商品の不良品検出や自動車の自動運転などのAIで必要とされます。
画像・映像アノテーションでは、最初に画像データから人や動物などを検出して長方形(バウンディングボックス)で囲んでタグ付けする物体検出(Object Detection)を行い、次に画像データの特定領域を抽出し、「この領域部分は犬である」というように、何であるかタグ付けする領域抽出(Image Semantic Segmentation)を行います。
最後に画像分類処理 (Image Classification)を行いますが、画像分類では画像データ1枚に対して「犬か猫か」「何色か」「どんな柄か」などのタグ付けをして分類ができるようにします。

音声分類

コールセンターなどで利用する音声認識AIを実現するために必要な音声アノテーションは、音声データをテキスト化したものにタグ付けしていきます。
最初に大量の音声データをテキストに書き起こし、その後、それぞれの名詞の意味、「えーと」「それで」「あの」などの間投詞など、単語1つ1つに対して意味をタグ付けして音声分類をしていきます。

言語・テキスト分類

言語・テキスト分類では指定されたテキストデータの意味を人間が解釈してタグ付け処理をしていきます。
ある文章の指定テキストは何についてなのか(意味的分類)、ネガティブかポジティブか(感情的分類)など分類する作業です。ニュース記事の自動カテゴリ分類、SNSの不適切情報抽出などに利用できます。

アノテーション代行サービスの画像・自然言語分類の事例

FastLabel

画像分類

画像データに対して商品分類、感情分類、属性情報の付与などといった、あらかじめ設定したタグをつけて分類します。

映像分類

動画映像の開始・終了時刻をもとにして、動画全体、動画内イベントを分類します。

テキスト分類

文章に対して、文章分類、感情分類、属性情報の付与など、あらかじめ設定したクラスで文章を分類します。

参照元:FastLabel公式サイト(https://fastlabel.ai/text

ANNOTEQ

画像・動画分類

指定のカテゴリに動画や画像を分類します。

自然言語分類

文章を元に、意図、感情度など、文脈から読み取れる意味を分類します。

参照元:ANNOTEQ公式サイト(https://annoteq.com/

ブライセン

画像分類

画像データの状況や撮影物などを判断してタグ付けします。

領域分類

画素単位で画像内の物体を色塗りして意味付けします。

参照元:ブライセン公式サイト(https://annotation.brycen.co.jp/service

マクニカ

クラス分類

画像データ内の全ピクセルに対し、自動車、人、信号機、空、歩道など、どのクラスに分類されるかタグ付けをします。クラス分類、出力フォーマット、色指定などのカスタマイズも可能です。

参照元:マクニカ公式サイト(https://www.macnica.co.jp/business/maas/services/135041/

アノテーションサービスの領域と作業内容について、こちらもチェック

重視するポイントで選ぶ
アノテーション代行サービス3選

重視するポイントで選ぶ
作業領域の広い
アノテーション代行サービス
3選

画像・動画・言語・音声などの作業領域が適応している代行サービスなら、 一通りのアノテーションは対応してくれますが、 より効率的に作業をすすめたいのであれば、 状況に応じた重視するポイントを把握しておくとよいでしょう
例えば、限られたAI開発予算のなかで大量のデータ処理が必要な場合は、コスパを重視して選ぶべきですし、 多種多様な言語や医療などの専門知識が必要なデータを処理する場合は、特殊な案件であっても代行可能な対応力を重視して選ぶべきです。
また、秘匿性の高い自社データを扱う場合は、信頼できる直接契約のアノテーターへ依頼ができるなどのセキュリティを重視する必要があるでしょう。
ここでは、画像・動画・言語・音声など、幅広い作業領域に対応できる代行サービスの中から、3つの重視するポイントに合ったサービスをご紹介します。

コストパフォーマンス
重視するなら

FastLabel
(ファストラベル)

ファストラベル公式サイトキャプチャ
引用元:FastLabel公式HP
(https://fastlabel.ai/annotation)
  • データ単位の従量課金制で画像アノテーションが2円(税不明)から利用可能
  • データ品質99.7%の納品実績(2023年10月時点)を実現する独自の品質チェックAIとのダブルチェック体制
品質の管理
アノテーター
教育の有無
責任者による
品質チェック

クラウドに対応

専門アノテーターによる
対応力を重視するなら

アッペンジャパン

アッペンジャパン株式会社公式サイトキャプチャ
引用元:アッペンジャパン公式HP
(https://appen.co.jp/what-we-do/)
  • 全世界にアノテーターが在籍しており、170か国、235言語に対応
  • 医師資格などの専門性の高い資格を持つアノテーターも在籍
品質の管理
アノテーター
教育の有無
責任者による
品質チェック

リモート/オンプレミスに対応

セキュリティの高さ
重視するなら

ヒューマンサイエンス

ヒューマンサイエンス公式サイトキャプチャ
引用元:ヒューマンサイエンス公式HP
(https://www.science.co.jp/annotation/index.html)
  • セキュリティルームの利用や依頼企業に常駐・オンサイトのみの作業も可能
  • クラウドワーカーではなく直接契約したアノテーターへの作業依頼も可能
品質の管理
アノテーター
教育の有無
責任者による
品質チェック

クラウド/オンサイトに対応

※選定条件
2023年10月6日調査時点において、「アノテーション サービス」でGoogle検索の表示上限までにでてきた39社の中で、 画像/動画/テキストといった幅広い領域のアノテーションに対応している企業の中から、以下の条件で3社をピックアップしています。
①FastLabel:公式HPに掲載されている料金が最も安いサービス(企業)(画像アノテーション2円(税不明)~)
②アッペンジャパン:公式HPに幅広い言語や専門分野に対応できるアノテータリソースの記述がある(企業)
③ヒューマンサイエンス:セキュリティに関する対策項目が最も多かったサービス(企業)

AI分野のアノテーションとは
わかりやすく解説