アノテーションはAI(人工知能)の学習に必要となる膨大な量の教師データを作ることですが、収集された音声、画像、自然言語、テキストなどの様々なデータはタグ付けされ、関連する情報(メタデータ)が付け加えられていきます。
必要なデータの種類や作業は構築するAIの用途によって異なり、AIが最終的な認識をするためには分類されたデータが必要となります。
画像や映像のアノテーションは商品の不良品検出や自動車の自動運転などのAIで必要とされます。
画像・映像アノテーションでは、最初に画像データから人や動物などを検出して長方形(バウンディングボックス)で囲んでタグ付けする物体検出(Object Detection)を行い、次に画像データの特定領域を抽出し、「この領域部分は犬である」というように、何であるかタグ付けする領域抽出(Image Semantic Segmentation)を行います。
最後に画像分類処理 (Image Classification)を行いますが、画像分類では画像データ1枚に対して「犬か猫か」「何色か」「どんな柄か」などのタグ付けをして分類ができるようにします。
コールセンターなどで利用する音声認識AIを実現するために必要な音声アノテーションは、音声データをテキスト化したものにタグ付けしていきます。
最初に大量の音声データをテキストに書き起こし、その後、それぞれの名詞の意味、「えーと」「それで」「あの」などの間投詞など、単語1つ1つに対して意味をタグ付けして音声分類をしていきます。
言語・テキスト分類では指定されたテキストデータの意味を人間が解釈してタグ付け処理をしていきます。
ある文章の指定テキストは何についてなのか(意味的分類)、ネガティブかポジティブか(感情的分類)など分類する作業です。ニュース記事の自動カテゴリ分類、SNSの不適切情報抽出などに利用できます。
画像データに対して商品分類、感情分類、属性情報の付与などといった、あらかじめ設定したタグをつけて分類します。
動画映像の開始・終了時刻をもとにして、動画全体、動画内イベントを分類します。
文章に対して、文章分類、感情分類、属性情報の付与など、あらかじめ設定したクラスで文章を分類します。
参照元:FastLabel公式サイト(https://fastlabel.ai/text)
指定のカテゴリに動画や画像を分類します。
文章を元に、意図、感情度など、文脈から読み取れる意味を分類します。
参照元:ANNOTEQ公式サイト(https://annoteq.com/)
画像データの状況や撮影物などを判断してタグ付けします。
画素単位で画像内の物体を色塗りして意味付けします。
参照元:ブライセン公式サイト(https://annotation.brycen.co.jp/service)
画像データ内の全ピクセルに対し、自動車、人、信号機、空、歩道など、どのクラスに分類されるかタグ付けをします。クラス分類、出力フォーマット、色指定などのカスタマイズも可能です。
参照元:マクニカ公式サイト(https://www.macnica.co.jp/business/maas/services/135041/)
画像・動画・言語・音声などの作業領域が適応している代行サービスなら、
一通りのアノテーションは対応してくれますが、
より効率的に作業をすすめたいのであれば、
状況に応じた重視するポイントを把握しておくとよいでしょう。
例えば、限られたAI開発予算のなかで大量のデータ処理が必要な場合は、コスパを重視して選ぶべきですし、
多種多様な言語や医療などの専門知識が必要なデータを処理する場合は、特殊な案件であっても代行可能な対応力を重視して選ぶべきです。
また、秘匿性の高い自社データを扱う場合は、信頼できる直接契約のアノテーターへ依頼ができるなどのセキュリティを重視する必要があるでしょう。
ここでは、画像・動画・言語・音声など、幅広い作業領域に対応できる代行サービスの中から、3つの重視するポイントに合ったサービスをご紹介します。
コストパフォーマンスを
重視するなら
品質の管理 | |
---|---|
アノテーター 教育の有無 |
〇 |
責任者による 品質チェック |
〇 |
クラウドに対応
専門アノテーターによる
対応力を重視するなら
品質の管理 | |
---|---|
アノテーター 教育の有無 |
― |
責任者による 品質チェック |
〇 |
リモート/オンプレミスに対応
セキュリティの高さを
重視するなら
品質の管理 | |
---|---|
アノテーター 教育の有無 |
〇 |
責任者による 品質チェック |
〇 |
クラウド/オンサイトに対応
※選定条件
2023年10月6日調査時点において、「アノテーション サービス」でGoogle検索の表示上限までにでてきた39社の中で、
画像/動画/テキストといった幅広い領域のアノテーションに対応している企業の中から、以下の条件で3社をピックアップしています。
①FastLabel:公式HPに掲載されている料金が最も安いサービス(企業)(画像アノテーション2円(税不明)~)
②アッペンジャパン:公式HPに幅広い言語や専門分野に対応できるアノテータリソースの記述がある(企業)
③ヒューマンサイエンス:セキュリティに関する対策項目が最も多かったサービス(企業)