動画(映像)、音声、画像、テキストなど、さまざまなデータに対してラベル付けを行うアノテーションは、AIの機械学習に必要となる教師データを作るために欠かせない作業です。
その中の動画(映像)アノテーションは画像アノテーションの応用的な作業で、動画データを開始点と終了点時刻をもとに区切った映像セグメントにし、動画全体や動画内のイベントを分類してタグ付けしていきます。
動画(映像)アノテーションには以下のような種類があります。
動画や映像データにある車道や信号などの物体を検出してバウンディングボックス(長方形)で囲み、物体が何であるかタグ付けします。2Dだけでなく、3Dのバウンディングボックスもあり、その場合は頂点を8つ持つ直方体の形となるため、より立体的なアノテーションを行うことができます。
物体検出のように長方形で囲む方法ではなく、特定の物体だけを抽出してタグ付けを行います。形状が複雑な物の領域を多角形で指定できるので、正確な領域アノテーションが可能となります。
例えば、動画(映像)データの中から猫のデータだけを抽出したい場合には、猫の領域だけを抽出してタグ付けをしていきます。細かな領域を抽出するので、建物の錆びやヒビといった劣化具合を特定するシステムなどに利用されています。
ランドマークアノテーションは動画(映像)データの目、鼻、眉、輪郭、口など顔のパーツを点で指定してタグ付けしていきます。顔認識では20~100点くらいのアノテーションを行いますが、細かいアノテーションによって顔の表情から感情の特定をすることができます。
キーポイントアノテーションは動画(映像)データ内の人物の腰、肩、ひじなどの関節を点で指定してタグ付けしていきます。人物の骨格を検出することによって、その人物が歩いているのか、座っているのかなど姿勢を特定することができます。
動画の中の音声を抽出して文字起こしし、タグ付けします。特定話者の発言だけの文字起こしや、感嘆詞、沈黙時間などもタグを付与しながら文字起こしをしていきます。動画へのキャプションを自動で付けるAIシステムなどの構築で利用されます。
動画が指定されたルールに沿っているかどうか分類し、タグ付けしていきます。
動画(映像)アノテーションは監視カメラやドローンの定点カメラからの物体検知、自動車自動運転領域での物体検知、人物検知システムなどの教師データとして活用されています。
画像・動画・言語・音声などの作業領域が適応している代行サービスなら、
一通りのアノテーションは対応してくれますが、
より効率的に作業をすすめたいのであれば、
状況に応じた重視するポイントを把握しておくとよいでしょう。
例えば、限られたAI開発予算のなかで大量のデータ処理が必要な場合は、コスパを重視して選ぶべきですし、
多種多様な言語や医療などの専門知識が必要なデータを処理する場合は、特殊な案件であっても代行可能な対応力を重視して選ぶべきです。
また、秘匿性の高い自社データを扱う場合は、信頼できる直接契約のアノテーターへ依頼ができるなどのセキュリティを重視する必要があるでしょう。
ここでは、画像・動画・言語・音声など、幅広い作業領域に対応できる代行サービスの中から、3つの重視するポイントに合ったサービスをご紹介します。
コストパフォーマンスを
重視するなら
品質の管理 | |
---|---|
アノテーター 教育の有無 |
〇 |
責任者による 品質チェック |
〇 |
クラウドに対応
専門アノテーターによる
対応力を重視するなら
品質の管理 | |
---|---|
アノテーター 教育の有無 |
― |
責任者による 品質チェック |
〇 |
リモート/オンプレミスに対応
セキュリティの高さを
重視するなら
品質の管理 | |
---|---|
アノテーター 教育の有無 |
〇 |
責任者による 品質チェック |
〇 |
クラウド/オンサイトに対応
※選定条件
2023年10月6日調査時点において、「アノテーション サービス」でGoogle検索の表示上限までにでてきた39社の中で、
画像/動画/テキストといった幅広い領域のアノテーションに対応している企業の中から、以下の条件で3社をピックアップしています。
①FastLabel:公式HPに掲載されている料金が最も安いサービス(企業)(画像アノテーション2円(税不明)~)
②アッペンジャパン:公式HPに幅広い言語や専門分野に対応できるアノテータリソースの記述がある(企業)
③ヒューマンサイエンス:セキュリティに関する対策項目が最も多かったサービス(企業)