アノテーション(annotation:注釈)とは、テキスト、音声、画像、動画などのデータにタグやメタデータ(属性)を付与して意味付けをし、AIが理解できるような教師データを作っていく作業です。AI(人工知能)システム構築には欠くことのできないものであり、AIシステムの精度はアノテーションによって決まるといってもいいほど重要な役割をもっています。
アノテーションにおいて、音声、画像、動画、手書き文字などのデータ収集やデータ作成が必要な理由や収集方法について解説し、データ収集やデータ作成を行っている企業の事例も紹介しています。AIの精度を上げるために大量の教師データが必要となるのはなぜでしょうか。
画像・自然言語分類方法や作業内容例について解説し、画像・自然言語分類を行っている企業の事例も紹介します。アノテーションにおける音声分類、画像・映像分類、言語・テキスト分類は自動車の自動運転、ニュース記事の自動カテゴリ分け、コールセンターの音声認識AIなどで利用されています。
製造業、食品製造業、不動産・建設業など画像アノテーションの利用シーンやバウンディングボックス、セグメンテーション、キーポイント、バウンダリー・ディテクションなど画像アノテーションの種類について解説します。画像アノテーションは商品不良検出などのAIシステムや自動車の自動運転などに利用されています。
動画アノテーションの目的やバウンディングボックス、セグメンテーション、キーポイント、動画適正判定、動画音声文字起こしなど動画アノテーションの種類について解説します。映像セグメントに区切られた動画にタグ付けする動画アノテーションは画像アノテーションの応用的作業です。
音声アノテーションの目的や作業方法、活用シーンについて解説し、音声アノテーションを行っている企業の事例について紹介します。音声データからの文字起こしされた1つ1つの単語に意味をタグ付けする音声アノテーションはスマートスピーカーやコールセンターなど音声認識分野で利用されています。
テキスト・言語アノテーションの目的や作業方法、利用シーンについて解説し、テキスト・言語アノテーションを行っている企業の事例も紹介します。特定の文章の部分や全体に対して事前に定義されているカテゴリを割り付けていくテキストアノテーションは顧客データ分析、ニュースのカテゴリ分け、チャットボットなどで利用されています。
画像・動画・言語・音声などの作業領域が適応している代行サービスなら、
一通りのアノテーションは対応してくれますが、
より効率的に作業をすすめたいのであれば、
状況に応じた重視するポイントを把握しておくとよいでしょう。
例えば、限られたAI開発予算のなかで大量のデータ処理が必要な場合は、コスパを重視して選ぶべきですし、
多種多様な言語や医療などの専門知識が必要なデータを処理する場合は、特殊な案件であっても代行可能な対応力を重視して選ぶべきです。
また、秘匿性の高い自社データを扱う場合は、信頼できる直接契約のアノテーターへ依頼ができるなどのセキュリティを重視する必要があるでしょう。
ここでは、画像・動画・言語・音声など、幅広い作業領域に対応できる代行サービスの中から、3つの重視するポイントに合ったサービスをご紹介します。
コストパフォーマンスを
重視するなら
品質の管理 | |
---|---|
アノテーター 教育の有無 |
〇 |
責任者による 品質チェック |
〇 |
クラウドに対応
専門アノテーターによる
対応力を重視するなら
品質の管理 | |
---|---|
アノテーター 教育の有無 |
― |
責任者による 品質チェック |
〇 |
リモート/オンプレミスに対応
セキュリティの高さを
重視するなら
品質の管理 | |
---|---|
アノテーター 教育の有無 |
〇 |
責任者による 品質チェック |
〇 |
クラウド/オンサイトに対応
※選定条件
2023年10月6日調査時点において、「アノテーション サービス」でGoogle検索の表示上限までにでてきた39社の中で、
画像/動画/テキストといった幅広い領域のアノテーションに対応している企業の中から、以下の条件で3社をピックアップしています。
①FastLabel:公式HPに掲載されている料金が最も安いサービス(企業)(画像アノテーション2円(税不明)~)
②アッペンジャパン:公式HPに幅広い言語や専門分野に対応できるアノテータリソースの記述がある(企業)
③ヒューマンサイエンス:セキュリティに関する対策項目が最も多かったサービス(企業)